我们猜测他们是为控制族群的数量文字转WAV音频