而是建议他自己思考文字转WAV音频