Abstract not available.
将多模态基础模型集成到企业生态系统面临着根本性的软件架构挑战。架构师必须平衡相互竞争的质量属性:视觉语言动作模型的高延迟和非确定性与企业控制回路所需的严格确定性和实时性能。在本研究中,我们提出了一种用于视觉智能体的架构模式语言,将快速、确定性的反射与缓慢、概率性的监督相分离。该语言包含四种架构设计模式:(1)混合功能集成,(2)自适应视觉锚定,(3)视觉层次综合,以及(4)语义场景图。
← Back