我们起码要为它们创造一个最基本的发展条件文字转WAV音频