然后主动凑过来大声说文字转WAV音频