在说出自己听到的消息之前文字转WAV音频