安装驱动显示成功,但重启后输入nvidia-smi命令无输出内容;
检查主机BIOS设置,设置BIOS内存映射I/O库设置为12T(默认情况下为56TB)
Ampere架构显卡安装结束后,虚拟机分配显卡资源后开机报错“无法初始化vGPU“nvidia_a40_4q”的插件“libnvidia-vgx.so”
检查主机BISO设置,是否开启SR-IOV功能,部分主机如果有ARI FORWARDING功能,也需要打开。
ESXi主机安装驱动结束后,在分配虚拟机显卡资源池无法查看到可分配的GPU资源;
可能存在驱动与ESXi小版本不兼容的问题,可通过升级ESXi补丁解决;
ESXi直通显卡资源给虚拟机使用,无法开机初始化资源;
ESXi PCI Function BAR 限制虚拟机BIOS引导中限制直通设备不得超过3.75GB,efi引导不得超过32GB,需要通过修改vmx配置文件解除限制。编辑虚拟机设置,在高级参数中添加,要启用 64 位内存映射 I/O (MMIO),请将以下行添加到虚拟机 vmx 文件:
pciPassthru.use64bitMMIO="TRUE"
要使用超过 32 GB 的容量,请在虚拟机的 vmx 文件中将 MMIO 区域的大小指定为 2 的幂数倍个 GB,例如:
pciPassthru.64bitMMIOSizeGB = “128"
参考资料:
vSphere VMDirectPath I/O and Dynamic DirectPath I/O: Requirements for Platforms and Devices↗
分配显卡的虚拟机帧率很低,性能无法发挥
ESXi限制虚拟机帧率最大60帧,可通过添加高级参数解除帧率限制
pciPassthru0.cfg.frame_rate_limiter=0
显卡模式查看
lspci -n | grep 10de
查看显卡驱动
esxcli software vib list |grep NVIDIA
卸载显卡驱动
esxcli software vib remove -n NVIDIA-VMware_ESXi_XXX_Host_Driver