她们是占据着文字转WAV音频