6月26日,法国人工智能初创企业MistralAI宣布推出其最新的文档内容识别模型OCR4。该模型能够支持10个语族的170种语言,其输出文本相较于市场上的其他竞争对手如GPT5.5Pro、Gemini3.1ProPreview等更受人类青睐,并在OmniDocBench上获得了93.07分的高分。
OCR4模型不仅能够输出文本,还能提供边框、区域分类和置信度评分,支持RAG语义分块、智能体结构化基本单元、连接器结构化内容等下游工作负载。MistralAI强调,OCR4是一个小型、聚焦的模型,旨在提高文档处理的效率和准确性。
在定价方面,MistralAI为OCR4基础API调用设定了每千页4美元的价格,而采用批处理方式则可以享受50%的优惠。此外,文档人工智能服务的定价为每千页5美元。这些定价策略旨在为客户提供成本效益高的文档识别解决方案。

