他的直觉和听觉都告诉他文字转WAV音频