这些人主要归属两部分文字转WAV音频