前两次都是假打文字转WAV音频