所以她们也算是认识文字转WAV音频