两人却很精准的判断出了文字转WAV音频