Azure 既存の仮想マシンのサイズを変更して GPU を利用する方法



マシンラーニングの処理で行列の計算が多く、サーバへの負荷が高いため、既存の Azure 仮想マシンのサイズを変更して、GPU ドライバをインストールすることで、GPU を利用できるようにしました。


環境

Azure 仮想マシン Red Hat Enterprise Linux

NCas_T4_v3 シリーズ

Azure 仮想マシンのサイズ変更

Azure ポータルにて、下記の方法で、Azure 仮想マシンのサイズを NCas_T4_v3 シリーズのインスタンス NC4as T4 v3 にサイズを変更します。


1. Azure ポータルで仮想マシンを停止する。


2. Azure ポータルの該当する仮想マシンのサイズ画面にて、仮想マシンのサイズを NC4as T4 v3 に変更する。


3. Azure ポータルで仮想マシンを起動する。


GPU ドライバーのインストール

Azure ポータルにて、GPU ドライバー拡張機能をインストールします。


1. Azure ポータルにて、該当する仮想マシンの

設定 > 拡張機能

を選択する。


2. 「追加」をクリックする。


3. 「NVIDIA GPU Driver Extention」を検索する。


4. 「次へ」をクリックする。


5. 注意事項を確認して、「確認と作成」 をクリックする。

※拡張機能をインストールする中で再起動が発生する可能性あり。


6. 検証が成功したら、「作成」をクリックする。


補足

GPU ドライバーのインストールを確認します。

確認方法:※nvidia-smi コマンドを実行して確認できます。

https://docs.microsoft.com/ja-jp/azure/virtual-machines/linux/n-series-driver-setup#verify-driver-installation


追記

GPU を利用することをやめて、元の仮想マシンのサイズに戻すことができます。


1. Azure ポータルにて、該当する仮想マシンの

設定 > 拡張機能

を選択する。


2. 拡張機能一覧から NvidiaGpuDriverLinux を選択し、[アンインストール] をクリックする。

※反映まで時間がかかる場合がある。


3. アンインストール完了後に、拡張機能にて、NvidiaGpuDriverLinux が存在しないことを確認する。


4. Azure ポータルで仮想マシンを停止する。


5. Azure ポータルの該当する仮想マシンのサイズ画面にて、仮想マシンのサイズを元のサイズに変更する。


6. Azure ポータルで仮想マシンを起動する。



スポンサーリンク

0 件のコメント :

コメントを投稿