虽然理性上认同这种做法文字转WAV音频