主要还靠平素多注意文字转WAV音频