【 AIoT 】於 Azure VM 中使用單一 NVIDIA GPU 訓練影像

【 AIoT 】於 Azure VM 中使用單一 NVIDIA   GPU 訓練影像

內容

  • 學習目標
  • 前置準備作業
  • 訓練花朵影像
  • 驗證訓練完成的模型

前置準備作業


訓練花朵影像

Step 1. 遠端登入的 Azure VM


Step 2. 建立資料夾並切換路徑

  • 請在終端機中輸入下方指令

    mkdir ~/tensorflow-sample && cd ~/tensorflow-sample 

    ---2020-04-23---10.03.05


Step 3. 下載 Google - tensorflow-for-poets-2 訓練程式

  • 下載

    • 請在終端機中輸入下方指令

      git clone https://github.com/googlecodelabs/tensorflow-for-poets-2 

      ---2020-04-23---10.04.00

  • 切換路徑

    • 請在終端機中輸入下方指令

      cd tensorflow-for-poets-2 

      ---2020-04-23---10.04.33


Step 4. 下載花朵訓練影像

  • 下載

    • 請在終端機中輸入下方指令

      wget http://download.tensorflow.org/example_images/flower_photos.tgz 

      ---2020-04-23---10.05.10

  • 解壓縮

    • 請在終端機中輸入下方指令

      tar zxvf flower_photos.tgz 

      ---2020-04-23---10.05.57


Step 5. 建立放置 model 的資料夾

  • 請在終端機中輸入下方指令

    mkdir model 

    ---2020-04-23---10.06.36


Step 6. pip 升級與安裝套件

  • pip 升級

    • 請在終端機中輸入下方指令

      pip install --upgrade pip 

      ---2020-04-23---10.11.37

  • 安裝 tensorflow-gpu 套件

    • 請在終端機中輸入下方指令

      pip install tensorflow-gpu==1.13.2 

      ---2020-04-23---10.13.56


Step 7. 使用 GPU 訓練程式

  • 取得 GPU 編號

    • 請在終端機執行下方指令

      nvidia-smi 

      ---2020-04-23---10.23.24

  • 請在終端機執行下方指令 ( 訓練時間約 5 ~ 10 分鐘 )

    ---2020-04-23---10.15.55


Step 8. 查看執行狀況

  • 請開啟兩個登入到 Azure GPU VM 的終端機
    • 終端機 1 中輸入下方指令

      tail -f ~/tensorflow-sample/tensorflow-for-poets-2/nohup.log 

      ---2020-04-23---10.22.25

    • 終端機 2 中輸入下方指令

      watch -n 2 nvidia-smi 

      ---2020-04-23---10.16.54


驗證訓練完成的模型

Step 1. 編輯程式

  • 請在終端機中輸入下方指令

    sudo vi ~/tensorflow-sample/tensorflow-for-poets-2/scripts/label_image.py 

    ---2020-04-23---10.25.29

  • 輸入 /input_layer 進行搜尋

    ---2020-04-23---10.26.28

  • 修改資料 ( 輸入 i 進入編輯模式 )

    • input_layer = "input" 修改成 input_layer = "Mul"

    • input_height 後方的數字改成 299

    • input_width 後方的數字改成 299

      • 修改前

        ---2020-04-23---10.27.34

      • 修改後

        ---2020-04-23---10.28.44

  • 存檔並離開

    • ① 點選 esc 鍵到指令模式

    • ② 輸入 :wq!

      ---2020-04-23---10.30.17


Step 2. 花朵識別

  • 切換路徑

    • 請在終端機中輸入下方指令

      cd ~/tensorflow-sample/tensorflow-for-poets-2 

      ---2020-04-23---10.33.25

  • 下載測試影像

    • 請在終端機中輸入下方指令

      wget https://i.imgur.com/F55o4EM.jpg -O test-flower.jpeg 

      ---2020-04-23---10.56.18

  • 使用 Model 識別花朵

    • 請在終端機中輸入下方指令

    ---2020-04-23---10.58.47


Reference
GitHub
List of blogs