このメッセージ(Probe with driver nvidia failed with error -1
)は、カーネルがNVIDIAドライバーのモジュール初期化に失敗したことを意味します。 原因としては、以下のようなものが考えられます:
- 互換性のないドライバーバージョン
Secure Boot(セキュアブート)の問題
必要なファームウェアの不足
Azureでの正しいNVIDIAドライバーのインストール手順(A10 GPU向け)
不具合のあるドライバーを削除する(VMが応答しない場合)
Azure ポータルの シリアルコンソール を使用して VM にアクセスします:
- GRUBメニューから
Advanced options for Ubuntu → recovery mode
を選択
rootシェルプロンプトに入って、以下のコマンドを実行:
apt purge '^nvidia'
update-initramfs -u
reboot
必要であれば、Azure ポータルの「Run Command(コマンドの実行)」機能を使ってリモートでドライバーを削除できます。
**注意:Azure NVads A10 v5 VM では、GRID 14.1 (510.73) 以上のドライバーバージョンのみサポートされます。 ** この A10 SKU 用の vGPU ドライバーは、グラフィックスとコンピュートの両方をサポートする統合ドライバーです。
正しいドライバーのインストール(Microsoft公式スクリプト使用)
アクセスが復旧したら、Microsoft が提供しているスクリプトを使って NVIDIA ドライバーをインストールします:
Copy to BlackBox
wget https://aka.ms/install-nvidia-driver -O install-nvidia-driver.sh
sudo bash install-nvidia-driver.sh
ドライバーが正しく動作しているかを確認
VM を再起動して、以下を実行:
nvidia-smi
以下のような出力が表示されれば成功です:
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 550.xx Driver Version: 550.xx CUDA Version: 12.2 |
| GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC|
| 0 NVIDIA A10 | 00000000:00:1E.0 Off | Off |
+-----------------------------------------------------------------------------+
参考資料:
Microsoft Learn - Azure NシリーズLinuxドライバーセットアップ
お役に立てれば幸いです!
さらにご質問がありましたら、お気軽にお知らせください。
もしこの情報が役に立った場合は、「いいね」ボタンをクリックして教えてくださ