在 WSL2 中可以通过以下步骤来检验所有显卡是否都可以正常使用:
1. 使用 nvidia-smi
命令
在 WSL2 环境中,执行以下命令:
1 |
nvidia-smi |
此命令会显示所有可用的 GPU 以及它们的状态。如果你看到所有 8 张 RTX 4090 都列出来了,并且显示正常状态(例如:空闲或正在使用),那么说明这些显卡都可以被 WSL2 识别和使用。
输出应该类似于:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 |
+-----------------------------------------------------------------------------+ | NVIDIA-SMI 510.39.01 Driver Version: 510.39.01 CUDA Version: 11.6 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 RTX 4090 On | 00000000:01:00.0 Off | N/A | | 30% 54C P2 300W / 450W | 1100MiB / 24576MiB | 23% Default | +-------------------------------+----------------------+----------------------+ | 1 RTX 4090 On | 00000000:02:00.0 Off | N/A | | 30% 54C P2 300W / 450W | 1100MiB / 24576MiB | 23% Default | +-------------------------------+----------------------+----------------------+ ... |
2. 使用 CUDA
进行检查
可以通过运行一个简单的 CUDA 程序来确认是否能够使用所有 GPU。首先确保 CUDA 工具包已正确安装,然后使用以下命令查看可用的 GPU 数量:
1 |
python -c "import torch; print(torch.cuda.device_count())" |
如果输出显示的数值和你的显卡数量一致,说明所有显卡都可以被 CUDA 识别和使用。
你还可以进一步检查每张显卡是否可以正常运行:
1 |
python -c "import torch; [print(torch.cuda.get_device_name(i)) for i in range(torch.cuda.device_count())]" |
此命令会列出每张 GPU 的名称,确保它们显卡的类型。
3. 运行负载测试
要确认所有显卡在计算任务下都正常工作,可以运行一个简单的深度学习训练脚本,并监控显卡的利用率。
例如,使用 PyTorch 进行测试:
1 2 3 4 5 6 7 8 9 10 |
import torch from torch import nn, optim # 测试是否能够在每个 GPU 上运行简单的计算 for i in range(torch.cuda.device_count()): device = torch.device(f'cuda:{i}') print(f'Testing GPU {i} ({torch.cuda.get_device_name(i)})') x = torch.rand((1000, 1000), device=device) y = torch.mm(x, x) print(f'GPU {i} computation success.') |
4. 检查多 GPU 配置
如果你使用深度学习框架(如 TensorFlow 或 PyTorch),可以通过以下方式检查多 GPU 使用情况:
1 |
python -c "import torch; print(torch.cuda.device_count()); print(torch.cuda.is_available())" |
确认 device_count()
返回的数量与实际 GPU 数量一致。
总结
通过以上方法,你可以全面地验证所有 GPU 是否在 WSL2 中正常工作。最重要的是使用 nvidia-smi
和 CUDA 相关命令来查看显卡的状态和可用性。如果某些显卡未显示或有错误信息,可以进一步排查驱动或配置问题。