在Thor上部署qwen3-vl-4b/qwen3-vl-8b,测试单图问答程序过程中发现GPU占用仅为30%左右,但是CPU的占用达到了100%,并且触发了过流,导致性能受限,同样的程序测试qwen2.5-vl-3b和qwen2.5-vl-7b结果正常,且GPU和CPU占用正常,且不会触发过流影响系统性能。 测试程序如下图: