所以刚才的说话文字转WAV音频