英伟达联手高校发布LocateAnything模型,AI定位速度新突破!
创始人
2026-05-30 19:34:14
0

5月29日,英伟达宣布与香港理工大学、南京大学合作,推出了一款名为LocateAnything的模型。该模型能够从照片或截图中高速、高精度地检测并标记出指定对象,主要服务于机器人感知和电脑自动操作等需要快速定位的场景。

LocateAnything模型通过ParallelBoxDecoding技术,将边界框或点作为固定长度的原子单元,在一步内预测出x1、y1、x2、y2等坐标值。模型提供了三种模式:FastMode、SlowMode和HybridMode,分别适用于不同的应用场景,如端侧机器人、离线标注和高精度评测等。此外,团队还构建了LocateAnything-Data数据集,包含12M独立图像、138M语言查询和785M边界框,覆盖了多种训练场景。

在性能方面,LocateAnything在单张NVIDIA H100 GPU上,默认HybridMode下达到12.7 Boxes Per Second,超过了Qwen3-VL和Rex-Omni的性能。在高精度任务中,LocateAnything在LVIS的IoU=0.95下得分31.1,高于Rex-Omni的20.7;在ScreenSpot-Pro中平均F1达到60.3;在DocLayNet和M6Doc中分别达到76.8与70.1,显示出其在不同任务中的优越性能。

相关内容

热门资讯

梅赛德斯-AMG限量CLE63... 近日,汽车媒体autoevolution发布了一组在德国纽博格林赛道附近抓拍的梅赛德斯-AMG CL...
比亚迪“郑州号”直航澳洲,单船... 近日,比亚迪在澳大利亚市场实现爆发式增长,订单量激增导致交付周期延长至6-8周。为应对这一情况,比亚...
特斯拉FSD功能遭10名中国车... 近日,北京市大兴区人民法院审理了一起针对特斯拉FSD(完全自动驾驶)功能的集体诉讼案。10名中国车主...
丰田在巴西投资21.8亿美元建... 近日,丰田汽车宣布计划于11月初在巴西圣保罗州索罗卡巴市开设其在巴西的第二家工厂,这标志着该市将成为...
英伟达联手高校发布Locate... 5月29日,英伟达宣布与香港理工大学、南京大学合作,推出了一款名为LocateAnything的模型...
尚界Z7系列新能源轿车全国大规... 5月30日,尚界汽车在上海举行了首批车主交付仪式,标志着全国大规模交付的开启。尚界Z7系列车型于4月...
理想L9Livis续航惊人:1... 5月29日,理想汽车董事长李想通过微博分享了全新理想L9Livis的续航测试成绩。测试显示,理想L9...
华为加持!启境GT7智能猎装车... 5月29日,广汽集团与华为合作的首款车型启境GT7正式开启预售,预售价区间为21.99-30.99万...
兰博基尼CEO:纯电车型无限期... 5月28日,兰博基尼CEO斯蒂芬·温克尔在接受CNBC采访时表示,公司决定无限期推迟电动汽车项目是正...
腾讯混元发布Hy-Memory... 5月28日,腾讯混元宣布推出Hy-Memory,一款专为长期协作型Agent设计的Openclaw记...