故而很容易推断出文字转WAV音频