大致为夜染检测一番文字转WAV音频