他们在这个时候也只有等文字转WAV音频