只是他的推测需要一些验证文字转WAV音频