然后长途飞行之后直接训练文字转WAV音频