虽然他们都刻意压制文字转WAV音频