第二方案成功的可能性应该是百分之百文字转WAV音频