这说明他们的分工很明确文字转WAV音频