他能想到的办法只有带着文字转WAV音频