她可能还处在第一个阶段文字转WAV音频