【 MLOps 】依 train 與 test 的 csv 內容的檔案分類從 Azure Blob 匯入到 AzureML Studio 中的 Data assets

內容

  • 檔案結構
  • 學習目標
  • 前置準備作業
  • 資料集入 AzureML Data Assets
  • 驗證 AzureML Studio 中的 Data Assets

檔案結構

  • Azure Blob
└── Azure Blob  ( ㊟ Azure Blob 服務 ) 
   └── randomdatasets  ( ㊟ 自行建立的 Azure Blob ) 
       └── datasets ( ㊟ 自行建立的 Container ) 
          ├── 1.jpg 
          ├── 2.jpg
          ├── 3.jpg
          ├── 4.jpg
          ├── 5.jpg
          ├── 6.jpg
          ├── 7.jpg
          ├── 8.jpg
          ├── 9.jpg
          └── 10.jpg
  • train.csv 內容
file
datasets/1.jpg
datasets/2.jpg
datasets/3.jpg
datasets/8.jpg
datasets/9.jpg
datasets/10.jpg
  • test.csv 內容
file
datasets/4.jpg
datasets/5.jpg
datasets/6.jpg
datasets/7.jpg

學習目標

  • 依 train 與 test 的 csv 內容的檔案分類從 Azure Blob 匯入到 AzureML Studio 中的 Data assets。

前置準備作業

  • 已建立 Azure 帳號並能正常登入
  • 已於 Azure 建立 Azure Machine Learning Studio
  • 已將資料集上傳到 Azure Blob

資料集入 AzureML Data Assets

Step 1. 依 csv 取得對應檔案在 Azure Blob 的 URL

  • 請於 AuzreML Studio 中的 Notebook 中執行下方程式
  • 請將第 3 行的 randomdatasets 改成所建立的 Azure Blob 名稱

Step 2. 依 csv 設定 AzureML Data Assets

  • 請於 AuzreML Studio 中的 Notebook 中執行下方程式

驗證 AzureML Studio 中的 Data Assets

Sample Code

GitHub

List of blogs