字节跳动豆包大模型团队(Seed)发布并开源UI-TARS-1.5。据介绍,这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。目前,UI-TARS-1.5已在7个典型的GUI图形用户界面评测基准中取得SOTA表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。
本文来自投稿,不代表AI界Plus立场,如若转载,请注明出处:https://www.aijieplus.com/902.html
字节跳动豆包大模型团队(Seed)发布并开源UI-TARS-1.5。据介绍,这是一款基于视觉-语言模型构建的开源多模态智能体,能够在虚拟世界中高效执行各类任务。目前,UI-TARS-1.5已在7个典型的GUI图形用户界面评测基准中取得SOTA表现,并首次展现了其在游戏中的长时推理能力和在开放空间中的交互能力。
本文来自投稿,不代表AI界Plus立场,如若转载,请注明出处:https://www.aijieplus.com/902.html