[...]物理核显直通 vs SRIOV vGPU的优缺点对比:优点缺点物理核显直通1、性能强2、支持物理显示输出(VGA/DP/HDMI/Type-C)3、兼容性好,不妨碍PVE升级。独占(不支持直通给多个虚拟机)直通后,PVE宿主不能同时用核显。SRIOV虚拟核显直通可分为多个VF虚拟显卡,给不同的虚拟机使用。1、性能拆分(分成多个VF显卡具体如何分配性能不详)如N100等不建议超过3个VF显卡,具有性[...]
Kernel preparation unnecessary for this kernel. Skipping...
Building module: cleaning build area... make -j4 KERNELRELEASE=6.5.0-28-generic -j4 -C /lib/modules/6.5.0-28-generic/build M=/var/lib/dkms/i915-sriov-dkms/6.5.0-28/build KVER=6.5.0-28-generic..............(bad exit status: 2) ERROR (dkms apport): binary package for i915-sriov-dkms: 6.5.0-28 not found Error! Bad return status for module build on kernel: 6.5.0-28-generic (x86_64) Consult /var/lib/dkms/i915-sriov-dkms/6.5.0-28/build/make.log for more information.
21 条评论
[...]物理核显直通 vs SRIOV vGPU的优缺点对比:优点缺点物理核显直通1、性能强2、支持物理显示输出(VGA/DP/HDMI/Type-C)3、兼容性好,不妨碍PVE升级。独占(不支持直通给多个虚拟机)直通后,PVE宿主不能同时用核显。SRIOV虚拟核显直通可分为多个VF虚拟显卡,给不同的虚拟机使用。1、性能拆分(分成多个VF显卡具体如何分配性能不详)如N100等不建议超过3个VF显卡,具有性[...]
无法在intel-gpu-top中手动指定id查看运行状态
root@ubuntu ls -l /sys/class/drm/card*
lrwxrwxrwx 1 root root 0 6月 18 21:44 /sys/class/drm/card0 -> ../../devices/pci0000:00/0000:00:1c.0/0000:01:00.0/drm/card0
sudo intel_gpu_top -d sys:/sys/devices/pci0000:00/0000:00:1c.0/0000:01:00.0
(Kernel 4.16 or newer is required for i915 PMU support.)Failed to detect engines! (No such file or directory)
root@ubuntu lsmod | grep i915
drm 765952 6 drm_kms_helper,drm_display_helper,drm_buddy,i915,ttmi915 4026368 0
drm_buddy 20480 1 i915
ttm 110592 1 i915
drm_display_helper 241664 1 i915
cec 94208 2 drm_display_helper,i915
drm_kms_helper 274432 2 drm_display_helper,i915
i2c_algo_bit 16384 1 i915
video 73728 1 i915
root@lorin:~# dmesg | grep -i i915
[ 1.896430] [drm] Initialized i915 1.6.0 20201103 for 0000:01:00.0 on minor 0[ 0.000000] Command line: BOOT_IMAGE=/boot/vmlinuz-6.5.0-35-generic root=UUID=54709887-995b-468e-91cf-bc3ea382813f ro quiet splash intel_iommu=on iommu=pt i915.enable_guc=3 vt.handoff=7
[ 0.013299] Kernel command line: BOOT_IMAGE=/boot/vmlinuz-6.5.0-35-generic root=UUID=54709887-995b-468e-91cf-bc3ea382813f ro quiet splash intel_iommu=on iommu=pt i915.enable_guc=3 vt.handoff=7
[ 1.632749] i915: loading out-of-tree module taints kernel.
[ 1.890200] i915 0000:01:00.0: Running in SR-IOV VF mode
[ 1.891185] i915 0000:01:00.0: [drm] GT0: GUC: interface version 0.1.4.1
[ 1.892907] i915 0000:01:00.0: vgaarb: deactivate vga console
[ 1.892933] i915 0000:01:00.0: [drm] Using Transparent Hugepages
[ 1.893925] i915 0000:01:00.0: [drm] GT0: GUC: interface version 0.1.4.1
[ 1.894442] i915 0000:01:00.0: GuC firmware PRELOADED version 1.4 submission:SR-IOV VF
[ 1.894445] i915 0000:01:00.0: HuC firmware PRELOADED
[ 1.896133] i915 0000:01:00.0: [drm] Protected Xe Path (PXP) protected content support initialized
[ 1.896140] i915 0000:01:00.0: [drm] PMU not supported for this GPU.
Ubuntu内核版本: 6.5.0-35
PVE版本: 8.1.4
Intel I3 12300T 核显是UHD730
核显直通之后,无法通过VNC连接桌面了
9代cpu核显跟这个步骤一样吗?
9代intel cpu应该是不支持这个技术的, 建议使用较新的11/12/13代U平台尝试
root@ubuntu:/usr/src/i915-sriov-dkms-6.5.0-28# dkms install -m i915-sriov-dkms -v $KERNEL -k $(uname -r) --force -j 4
Kernel preparation unnecessary for this kernel. Skipping...
Building module:
cleaning build area...
make -j4 KERNELRELEASE=6.5.0-28-generic -j4 -C /lib/modules/6.5.0-28-generic/build M=/var/lib/dkms/i915-sriov-dkms/6.5.0-28/build KVER=6.5.0-28-generic..............(bad exit status: 2)
ERROR (dkms apport): binary package for i915-sriov-dkms: 6.5.0-28 not found
Error! Bad return status for module build on kernel: 6.5.0-28-generic (x86_64)
Consult /var/lib/dkms/i915-sriov-dkms/6.5.0-28/build/make.log for more information.
sr-iov驱动项目issue中已经有人反馈了这个问题, 属于暂未修复的bug, 建议切换到2023.12的源码版本之后重新尝试下吧; 博文中更新了相关操作
git checkout cdb1399821e942db6fcc2b8322da72b517a9bc0d这个之后 依旧还是这个问题。。。
好详细的教程!比我之前找的好多都详细。
最近太折磨了,pve 8.1, 内核6.2,虚拟机ubuntu22.04,只能直通主gpu,虚拟出来的gpu进虚拟机ls /dev/dri 看不到。
我是核显sriov再lxc中docker,然而6.5的内核jellyfin硬解会有内存泄露的问题,看了下github有和我一样问题的,似乎是dkms i915+6.5内核有问题,只好换回6.2内核。。。
但最近用immich视频硬件转码,开4个并行,整个pve就会崩溃。。。看了功耗表维持在50多w,但ssh,网页都没响应。
现在尝试在虚拟机里跑jellyfin和immich,结果(╯°A°)╯︵○○○虚拟机里都找不到/dev/dri。
想问下博主有什么头绪吗(ó﹏ò。)
如果是ssh,网页都没响应, 可以看下是否分配了全部的CPU给虚拟机/LXC, 所以才会在高负载时导致CPU卡死, 其它服务无响应, 所以建议针对immich所在虚拟机/lxc设置减少cpu可用核心在测试下; 今天试了下在虚拟机安装UBuntu22.04.4(KERNEL=6.5.0.28), 配置sr-iov的pci虚拟核显, 最后也成功了, 但需要注意最新的sr-iov驱动代码部分存在些问题, 暂时使用了2023.12月份的版本, 博文有更新说明
太强了!之前没想过是i915版本问题,换到23年12月的版本,正常直通了!
跟着UP主完成了主机的核显直通,写得太好了。现在跟着UP主做虚拟机内部的核显直通,最终结果和UP主的一样,但是感觉没有生效的,UP主有没有遇到过?我用intel_gpu_top这个来检测,没有找到显卡。
感觉没生效, 指的是无法再虚拟机linux内直接执行intel_gpu_top吧, 这个问题在sr-iov源码驱动项目的issue中被反馈过; 建议在pve宿主机内部署intel_gpu_top, 同时参考本文的效果验证部分docker方式部署一个jellyfen, 来验证是否生效
OK,我再试试。我说的不生效是说在系统层面,使用intel_gpu_top没有找到显卡,也导致了无法在虚拟机内部使用GPU来运行大模型的推理服务,后面我用lxc的容器就正常了。虚拟机的核显直通我还将继续尝试,后续看看有什么进展或者问题再上来分享和交流。
大模型指的是llama2之类开源项目么, 方便分享的话可以留个地址我本地测试验证下
按这个方法部署之后ubuntu里已经识别到了虚拟的显卡,但是docker里的jellyfin还是无法使用核显解码这是啥问题呢?jellyfin提示该客户端与媒体不兼容,服务器未发送兼容的媒体格式
这个问题我也在之前配置的过程中遇到过, 出现问题的原因也暂时没弄清楚; 后面我重新开了一个环境, 按照本文的教程一步步配置成功了; 也建议你重开一个再试试看
请问下上篇的LXC Debian12核显直通,与这篇的Ubuntu22.04LTS核显直通,有什么区别吗?
LXC是一种容器技术, 部署的系统可以简单理解为简化后的, 移除了一些不必要的组件与设置(可以类比docker),CPU/RAM等资源占用更少; 这篇文章介绍的基于(QEMU)虚拟机部署的完整系统, 有着与物理机部署几乎一致的体验; 技术上来讲最大差别在于2者的底层依赖, 在实际应用中选择哪种, 需要看自己的需求: 一般如果主要是玩docker, 更推荐lxc容器化部署; 如果lxc容器内的系统无法满足需求, 或者修改设定太麻烦时, 可以考虑虚拟机方式
B站过来的,3个视频做的很用心,讲解很详细,支持UP主。想学一下Intel N100小主机pve核显直通的方法,结果搜到了你这个虚拟核显的视频,学习了一下,很棒。
谢谢, 欢迎一起折腾&分享