这个标准的意义就在于它确立了一道界限文字转WAV音频