请问声音方面的训练要考虑排列组合的情况吗?

比如:”识别汽车和路牌“,然后就要同时识别汽车和路牌

本次黑客松因为第一次引入语音识别部分,所以更多倾向于参赛者对模型本身的训练和推理,不会出现同时识别多种目标的情况,放心。