都是相对于正常的实验室规模来说的文字转WAV音频