微软发布Phi-4-Reasoning-Vision-15B:视觉推理新突破,智能应用新高度
创始人
2026-03-05 09:22:59
0

3月5日,微软官方开发者社区博客宣布,微软发布了一款名为Phi-4-Reasoning-Vision-15B的视觉推理模型。这款模型是Phi-4系列中首个结合高分辨率视觉感知与选择性、任务感知推理的小语言模型(SLM),能够实现“看得清楚”和“想得深入”。与传统视觉模型仅执行被动感知不同,Phi-4-Reasoning-Vision-15B能够执行结构化、多步骤的推理,理解图像中的视觉结构,将其与文本上下文连接,并得出可操作的结论。

Phi-4-Reasoning-Vision-15B的关键设计特征是其混合推理行为,可以根据提示在“推理模式”和“非推理模式”之间切换。在需要深度推理时,如数学问题、逻辑分析,启用多步推理链;而在快速感知足够时,如OCR、元素定位,直接输出以降低延迟。该模型最重要的应用领域之一是搭配计算机智能体使用,能够接收屏幕截图和自然语言指令,输出目标UI元素的标准化边界框坐标,供其他智能体模型执行点击、滚动等交互操作。

相关内容

热门资讯

博通CEO豪言:AI芯片202... 3月5日,博通公司在其财报电话会议上透露,预计到2027年,AI芯片业务将为公司带来超过1000亿美...
小鹏G6增程版震撼上市:续航1... 3月5日,小鹏汽车宣布其G6超级增程车型将于次日上市,并公布了六大核心卖点。该车型以其卓越的续航能力...
比亚迪海豹07EV震撼上市!7... 3月5日,比亚迪海豹07EV中型纯电轿车正式上市,推出两款车型,预扣提车价分别为15.5万元和17....
长城汽车新旗舰坦克700Hi4... 今日,长城汽车董事长魏建军宣布,公司将于17:00发布一款名为“长城麒麟新旗舰”的新车。从发布的预告...
华为问界M6新配色来袭:活力橙... 今日,鸿蒙智行发布了问界M6全新「活力橙」配色的更多官图。这款新配色以其高饱和度纳米色浆和高亮铝粉的...
华为鸿蒙智行尚界Z7轿跑电光紫... 3月5日,鸿蒙智行官方发布了尚界Z7轿跑的更多高清官图,该车型预计将吸引年轻消费者。尚界Z7轿跑将推...
长城坦克700Hi4-Z豪华旗... 3月5日,长城汽车官方微博宣布,将于当日17:00发布其豪华旗舰车型。根据预告图显示,新车可能为坦克...
岚图新车搭载华为顶尖激光雷达,... 日前,岚图汽车官方宣布,旗下三款新车型将搭载华为乾崑智驾最新的全球最高规格896线激光雷达。其中,岚...
华为携手东风打造全尺寸SUV,... 3月5日,华为智能汽车解决方案BU CEO靳玉志在鸿蒙智行技术焕新发布会上宣布,全球量产最高的896...
Anthropic CEO炮轰... 3月5日,美国AI公司Anthropic的联合创始人兼CEO达里奥·阿莫代伊对OpenAI的CEO萨...