具体的器具是随机分配的文字转WAV音频