腾讯混元OCR模型1B参数破纪录,小语种翻译能力领先业界!
创始人
2025-11-26 07:15:01
0

11月25日,腾讯混元宣布推出全新开源模型HunyuanOCR,参数规模为1B,基于混元原生多模态架构设计,多项OCR应用榜单达到SOTA(最先进水平)成绩。HunyuanOCR模型采用全端到端范式,通过规模化应用导向数据和在线强化学习,展现出稳健的端到端推理能力。

HunyuanOCR由原生分辨率视频编码器、自适应视觉适配器和轻量化混元语言模型三大部分构成。在复杂文档解析的OmniDocBench测评中,HunyuanOCR以94.1分的成绩超越谷歌Gemini3-pro等领先模型。在自建的覆盖9大应用场景的基准上,HunyuanOCR在文字检测和识别能力上大幅度领先同类开源模型及商业OCR模型。在OCRBench榜单上,HunyuanOCR以1B总参数的配置取得3B以下参数模型的SOTA成绩。

HunyuanOCR支持多语种复杂文档解析,具备文字检测和识别能力,应用于票据字段抽取、视频字幕识别、拍照翻译等场景。模型对文档、艺术字、街景、手写、广告、票据、截屏、游戏、视频等场景表现卓越。此外,HunyuanOCR支持14种高频小语种翻译,包括德语、西班牙语等,取得ICDAR2025端到端文档翻译比赛小模型赛道冠军。

相关内容

热门资讯

吉利星瑞TCR赛车意大利站夺冠... 今日,吉利汽车运动宣布,中国车手马青骅驾驶吉利星瑞TCR赛车在2026FIATCR世界巡回赛意大利站...
演员张静初,面临47人集体起诉 近日,多位在演员张静初直播间购买过“优思益”产品的网友表示,目前仍未拿到退款,陷入退货无门的境地。5...
保利海韵首开认购约18.2亿元... 在“穗八条”新政与传统营销旺季的双重推动下,2026年“五一”黄金周广州楼市交出超预期答卷。小长假后...
高端访谈|中国式现代化为世界提... 新华社贝尔格莱德5月10日电 高端访谈|中国式现代化为世界提供了新的发展模式——访黑山副总理阿莱克西...
新疆旅游新动向丨从“凑人气”到... 石榴云/新疆日报记者 姚刚美团《2026“五一”消费洞察报告》显示,全国县域旅游热度榜Top10中,...
男子因“帮忙”刷脸认证,竟卷入... 5月10日,韶关市中级人民法院公布了这样一起案件:马某“帮人”在游戏里刷脸认证以绑定微信,导致他人游...
无人机撞上高铁致63趟列车晚点... 5月9日,公安部公布2026年以来公安机关查处的多起无人机影响铁路安全典型案例。记者留意到,其中多起...
广州荔湾发布五月文旅“菜单”:... 5月19日,第16个“中国旅游日”全国主会场活动在广州落地。记者从荔湾区获悉,围绕这一节点,该区从“...
经济热点快评丨前4个月进出口增... 据海关统计,今年前4月,我国货物贸易进出口总值16.23万亿元,同比增长14.9%,出口、进口分别增...
蔚来智能旗舰乐道L60焕新升级... 5月10日,蔚来创始人李斌在官方直播中宣布,新款乐道L60将于5月底开启预售,6月正式上市。新车在外...