那么就可以反向推论文字转WAV音频