WSL での ML における GPU アクセラレーションの始め方

2025-06-10

機械学習 (ML) は、多くの開発ワークフローの重要な部分になりつつあります。データサイエンティスト、ML エンジニア、ML を使用した学習体験の開始のいずれであっても、Windows Subsystem for Linux (WSL) には、最も一般的で人気のある GPU アクセラレータ ML ツールを実行するための優れた環境が用意されています。

これらのツールを設定するには、さまざまな方法があります。たとえば、WSL、TensorFlow-DirectML、PyTorch-DirectML の NVIDIA CUDA はすべて、WSL で ML に GPU を使用できるさまざまな方法を提供します。いずれかを選択する理由と別の理由の詳細については、 GPU 高速 ML トレーニングに関するページを参照してください。

このガイドでは、次の設定方法について説明します。

NVIDIA グラフィックスカードがあり、サンプル ML フレームワークコンテナーを実行している場合は NVIDIA CUDA
AMD、Intel、または NVIDIA グラフィックスカードの TensorFlow-DirectML と PyTorch-DirectML

[前提条件]

Windows 11 または Windows 10 バージョン 21H2 以降を実行していることを確認します。
WSL をインストールし、Linux ディストリビューションのユーザー名とパスワードを設定します。

Docker を使用して NVIDIA CUDA を設定する

NVIDIA GPU 用の最新のドライバーをダウンロードしてインストールする
次のコマンドを実行して、 Docker Desktop をインストールするか、DOCKER エンジンを WSL に直接インストールします
```
curl https://get.docker.com | sh
```
```
sudo service docker start
```

Docker エンジンを直接インストールした場合は、次の手順に従って NVIDIA Container Toolkit をインストールします。

次のコマンドを実行して、NVIDIA Container Toolkit の安定したリポジトリを設定します。

distribution=$(. /etc/os-release;echo $ID$VERSION_ID)

curl -s -L https://nvidia.github.io/nvidia-docker/gpgkey | sudo gpg --dearmor -o /usr/share/keyrings/nvidia-docker-keyring.gpg

curl -s -L https://nvidia.github.io/nvidia-docker/$distribution/nvidia-docker.list | sed 's#deb https://#deb [signed-by=/usr/share/keyrings/nvidia-docker-keyring.gpg] https://#g' | sudo tee /etc/apt/sources.list.d/nvidia-docker.list

次のコマンドを実行して、NVIDIA ランタイムパッケージと依存関係をインストールします。

sudo apt-get update

sudo apt-get install -y nvidia-docker2

機械学習フレームワークコンテナーとサンプルを実行します。

機械学習フレームワークコンテナーを実行し、この NVIDIA NGC TensorFlow コンテナーで GPU の使用を開始するには、次のコマンドを入力します。
```
docker run --gpus all -it --shm-size=1g --ulimit memlock=-1 --ulimit stack=67108864 nvcr.io/nvidia/tensorflow:20.03-tf2-py3
```
このコンテナーに組み込まれている事前トレーニング済みのモデルサンプルを実行するには、次のコマンドを実行します。
```
cd nvidia-examples/cnn/
```
```
python resnet.py --batch_size=64
```

NVIDIA CUDA をセットアップして利用するその他の方法については、 WSL ユーザーガイドの NVIDIA CUDA を参照してください。

TensorFlow-DirectML または PyTorch-DirectML を設定する

GPU ベンダーの Web サイト (AMD、Intel 、NVIDIA) から最新のドライバーをダウンロードしてインストールします。
Python 環境をセットアップします。

仮想 Python 環境を設定することをお勧めします。仮想 Python 環境のセットアップに使用できるツールは多数あります。これらの手順では、 Anaconda の Miniconda を使用します。
```
wget https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh
```
```
bash Miniconda3-latest-Linux-x86_64.sh
```
```
conda create --name directml python=3.7 -y
```
```
conda activate directml
```
選択した DirectML に基づく機械学習フレームワークをインストールします。

TensorFlow-DirectML:
```
pip install tensorflow-directml
```
PyTorch-DirectML:
```
sudo apt install libblas3 libomp5 liblapack3
```
```
pip install torch-directml
```
TensorFlow-DirectML または PyTorch-DirectML の対話型 Python セッションで簡単な追加サンプルを実行して、すべてが動作していることを確認します。

質問がある場合や問題が発生した場合は、 GitHub の DirectML リポジトリにアクセスしてください。

複数の GPU

コンピューターに複数の GPU がある場合は、WSL 内の GPU にアクセスすることもできます。ただし、アクセスできるのは一度に 1 つだけです。特定の GPU を選択するには、次の環境変数を、デバイスマネージャーに表示される GPU の名前に設定してください。

export MESA_D3D12_DEFAULT_ADAPTER_NAME="<NameFromDeviceManager>"

これにより文字列が一致するため、"NVIDIA" に設定すると、"NVIDIA" で始まる最初の GPU と一致します。