因此同质数量越多文字转WAV音频