富士通PHOTON架构性能超Transformer 475倍,革新多查询处理
创始人
2026-06-25 18:53:19
0

6月25日,富士通在日本宣布了其最新开发的PHOTON架构,该架构在多查询场景下的性能可达到主流Transformer架构的475倍。PHOTON架构通过在语义层面进行分层处理,相较于Transformer的词元级分割,能够降低计算复杂度并提供更好的并行性。这一技术革新使得PHOTON在处理智能体系统等多I/O流程时更为高效,同时降低了GPU成本。

PHOTON架构在多查询的决策环节采用多数决定或选择最佳的方式,仅需一次推理即可完成。测试结果显示,在600M、900M、1.2B等参数规模相对较小的模型中,PHOTON实现了更高的迭代吞吐量和更低的内存占用。特别是在1.2B模型上,PHOTON展现了475倍的性能提升,尽管在质量上略有下降。此外,由于PHOTON架构每次迭代所需的KVCache更少,还能提升最大迭代次数。

相关内容

热门资讯

华为发布尊界S800Grand... 6月25日,华为常务董事余承东在发布会上推出了尊界S800 Grand Design典藏大观车型,该...
北京人形机器人集体舞惊艳亮相,... 6月25日,北京人形机器人创新中心发布了一项创新的多智能体群控方案。该方案展示了多台全尺寸天工3.0...
比亚迪大唐新配“灵动按键”,2... 6月25日,比亚迪官方商城推出BYD灵动按键,首发价为259元。该产品与比亚迪大唐汽车一同发布,目前...
华为鸿蒙智行安全升级,尊界S8... 6月25日,鸿蒙智行尊界品牌盛典暨尊界S800 Grand Design典藏大观发布会成功举办。华为...
AI编程成本飙升!2028年或... 6月24日,市场研究机构Gartner发布研究报告,预测到2028年,AI编程的成本将超过普通开发者...
鸿蒙智行尊界S800Grand... 6月25日,鸿蒙智行尊界品牌盛典将发布超高端豪华系列新作——尊界S800 Grand Design典...
英伟达黄仁勋:AI工厂时代开启... 6月24日,英伟达首席执行官黄仁勋在年度股东大会上讨论了人工智能基础设施建设的重要性。黄仁勋强调,人...
富士通PHOTON架构性能超T... 6月25日,富士通在日本宣布了其最新开发的PHOTON架构,该架构在多查询场景下的性能可达到主流Tr...
魅族FlymeAuto3.0将... 6月25日,魅族FlymeAIOS官方微博发布图文,回顾了Flyme操作系统14年的发展历程,并透露...
广州“卖旧买新”试点满月,安居... 自广州安居集团5月26日试点启动收购特定范围二手房,至今已满月。也就在6月25日上午,首例实现“卖旧...