然后分开了人群文字转WAV音频