多数为方阵文字转WAV音频