也更加容易被捕捉到文字转WAV音频