所以一直是在和现成的阵图学习文字转WAV音频