在他们的分析文章之中认为文字转WAV音频