但是声音还是各自属于各自的文字转WAV音频