最后产生了两个方案文字转WAV音频