他还是采用了类似的口吻文字转WAV音频