其数量和强悍程度是远高于第二幕的文字转WAV音频