就是通过贡献点来决定的文字转WAV音频