只不过因为理念不同才导致冲突文字转WAV音频