也就是我们这边的十多万文字转WAV音频