只能凭借战斗意识去推测文字转WAV音频