我们认为我们可以共存文字转WAV音频