只在于条件是否符合双方的预期文字转WAV音频