看来书上说的是有现实根据的文字转WAV音频