这个时候辞章本来就是可以唱出来的文字转WAV音频