确实不需要和谐文字转WAV音频