并没有注意周遭的不同文字转WAV音频