刚才屈柔的提议算是中规中矩的文字转WAV音频