容器云vGPU环境IsaacSim崩溃问题

硬件环境
宿主机GPU:RTX5880
分卡插件:volcano-vgpu-device-plugin
分卡配置:
volcano.sh/vgpu-number: “1”
volcano.sh/vgpu-memory: “1229”

软件版本
IsaacSim5.1+IsaacLab2.3
noVNC/turboVNC远程桌面
驱动版本:570.124.06
CUDA 12.8

系统环境
Ubuntu 22.04

问题描述
Volcano vGPU​ 分配的容器环境中运行 Isaac Sim,出现以下特定现象,远程桌面由noVNC/turboVNC提供:

  1. 无头模式运行正常:使用 Isaac Lab 进行无图形界面的强化学习训练任务(headless),可以稳定运行。
  2. 图形界面启动必现崩溃:一旦尝试启动带图形界面的 Isaac Sim 应用(例如,使用 isaac-sim.sh或启动任何需要3D渲染窗口的任务),程序会在初始化后崩溃。

错误日志

Hi L.JH,
vGPU我们这块测试的不多, volcano.sh/vgpu-memory: “1229”, 这个是配置GPU为1.2G么,如果是,提高到4-8G看下,另外用nvidia-sim观察下显存使用情况,看启动 Isaac Sim 前后观察是否瞬间把 1.2 GB 显存吃满

您好,这里的显存是12G,我们也尝试过24G,也是同样的崩溃问题

Hi L.JH,

您在我们总部的forum问下吧,vGPU这块我们没有太多测试经验.