腾讯混元OCR模型1B参数破纪录，小语种翻译能力领先业界！_知识学习_花城资讯网

腾讯混元OCR模型1B参数破纪录，小语种翻译能力领先业界！

创始人

2025-11-26 07:15:01

0次

11月25日，腾讯混元宣布推出全新开源模型HunyuanOCR，参数规模为1B，基于混元原生多模态架构设计，多项OCR应用榜单达到SOTA（最先进水平）成绩。HunyuanOCR模型采用全端到端范式，通过规模化应用导向数据和在线强化学习，展现出稳健的端到端推理能力。

HunyuanOCR由原生分辨率视频编码器、自适应视觉适配器和轻量化混元语言模型三大部分构成。在复杂文档解析的OmniDocBench测评中，HunyuanOCR以94.1分的成绩超越谷歌Gemini3-pro等领先模型。在自建的覆盖9大应用场景的基准上，HunyuanOCR在文字检测和识别能力上大幅度领先同类开源模型及商业OCR模型。在OCRBench榜单上，HunyuanOCR以1B总参数的配置取得3B以下参数模型的SOTA成绩。

HunyuanOCR支持多语种复杂文档解析，具备文字检测和识别能力，应用于票据字段抽取、视频字幕识别、拍照翻译等场景。模型对文档、艺术字、街景、手写、广告、票据、截屏、游戏、视频等场景表现卓越。此外，HunyuanOCR支持14种高频小语种翻译，包括德语、西班牙语等，取得ICDAR2025端到端文档翻译比赛小模型赛道冠军。

上一篇：小桔充电正式更名为“滴滴充电”，充电站覆盖超270城！

下一篇：NanoBanana无限套娃惊艳登场，GPT-5自愧不如？

相关内容

热门资讯

吉利星瑞TCR赛车意大利站夺冠... 今日，吉利汽车运动宣布，中国车手马青骅驾驶吉利星瑞TCR赛车在2026FIATCR世界巡回赛意大利站...

演员张静初，面临47人集体起诉近日，多位在演员张静初直播间购买过“优思益”产品的网友表示，目前仍未拿到退款，陷入退货无门的境地。5...

保利海韵首开认购约18.2亿元... 在“穗八条”新政与传统营销旺季的双重推动下，2026年“五一”黄金周广州楼市交出超预期答卷。小长假后...

高端访谈｜中国式现代化为世界提... 新华社贝尔格莱德5月10日电高端访谈｜中国式现代化为世界提供了新的发展模式——访黑山副总理阿莱克西...

新疆旅游新动向丨从“凑人气”到... 石榴云/新疆日报记者姚刚美团《2026“五一”消费洞察报告》显示，全国县域旅游热度榜Top10中，...

男子因“帮忙”刷脸认证，竟卷入... 5月10日，韶关市中级人民法院公布了这样一起案件：马某“帮人”在游戏里刷脸认证以绑定微信，导致他人游...

无人机撞上高铁致63趟列车晚点... 5月9日，公安部公布2026年以来公安机关查处的多起无人机影响铁路安全典型案例。记者留意到，其中多起...

广州荔湾发布五月文旅“菜单”：... 5月19日，第16个“中国旅游日”全国主会场活动在广州落地。记者从荔湾区获悉，围绕这一节点，该区从“...

经济热点快评丨前4个月进出口增... 据海关统计，今年前4月，我国货物贸易进出口总值16.23万亿元，同比增长14.9%，出口、进口分别增...

蔚来智能旗舰乐道L60焕新升级... 5月10日，蔚来创始人李斌在官方直播中宣布，新款乐道L60将于5月底开启预售，6月正式上市。新车在外...