和之前的状态基本上是两个样子文字转WAV音频