而第三个则介于虚影和实体之间文字转WAV音频