毕竟当下我们是听不到其他的动静的文字转WAV音频