现在面对的虽然是两具文字转WAV音频