他们还需要装作不认识文字转WAV音频