他在考虑如何对你说文字转WAV音频