3 天on MSN
新加坡国立大学等推出GameWorld:用游戏精准丈量AI与现实的距离
新加坡国立大学与牛津大学联合研发的AI游戏测试平台GameWorld,通过34款浏览器游戏和170个任务构建起一套全新的评估体系。这项研究以技术报告形式提交至arXiv平台,编号为arXiv:2604.07429,为多模态大语言模型的能力边界提供了量化依据。与传统测试依赖问答模式不同,该平台将AI置于动态游戏场景中,要求其完成从画面解析到动作执行的全流程操作 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果