因为很难确保上一个决断究竟是正确的还是错误的文字转WAV音频