一个期望值就是五亿文字转WAV音频