多多少少都反映着一部分的现实文字转WAV音频