而且很多东西都是理论的文字转WAV音频