• 媒体品牌
    爱范儿
    关注明日产品的数字潮牌
    APPSO
    先进工具,先知先行,AIGC 的灵感指南
    董车会
    造车新时代,明日出行家
    玩物志
    探索城市新生活方式,做你的明日生活指南
  • 知晓云
  • 制糖工厂
    扫描小程序码,了解更多
公司 | 苏伟鸿 07-09 15:56

下一任苹果 CEO,可能是这位 iPhone 的掌舵人

公司 | 莫崇宇 07-10 15:17

年费超 2 万!马斯克刚刚发布最贵 AI ,Grok 4 号称所有领域碾压博士

公司 | 莫崇宇 07-09 15:43

打工人天天用的三件套,被飞书用 AI 重做了一遍,还将打通企微和钉钉

小米 MIX Flip 2 首发体验:升级点,都在点上

03:39

在开发者大会,华为给每个「走得慢的人」留了座位

06:43

手机影像的风向标!华为Pura 80 Ultra 影像实测

10:19

鸿蒙电脑,靠国产软件能用起来吗?

5:11

专访苹果副总裁:AI 时代,苹果如何设计 Mac?

09:08

你见过物理外挂吗?这就是!

09:51

拍港风夜景人像大片,只用一部 OPPO Find X8 Ultra!

06:39

华为 Pura X 一周感受:这是最佳的折叠屏形态吗?

03:41

卖 399 的 AI 键盘,到底有没有用?| 明日打假办

02:23

M4 MacBook Air 真机速看:蓝色西装,性能暴徒

2:25

首发实测:10 万块的顶配 Mac,能跑满血版 DeepSeek 吗?

3:41

iPhone 16e 首发评测:信号好续航强?和 iPhone 16 比比看

05:16

在华为方舟壹号,遇见未来智能空间的起点

9:09

OPPO Find N5 首发评测:最好的折叠屏手机,是让你忘了折叠屏

10:09

新引擎!新电机!45 岁的「奔驰大 G」,还有以前的味道吗?

5:28

充电「不打嗝」,手机电脑一起吃自助餐

5:24

极速 310km/h!地表最强超豪华 SUV,落地还不到 500 万?

6:28

21 天华为折叠屏体验计划:这些是他们路转粉的理由

11:21

全新HUAWEI MatePad Pro 13.2 英寸实测!原生鸿蒙系统的超强交互!

08:22

红枫原色影像怎么样?华为Mate 70 Pro+ 拍照实测

09:02

加载更多

快讯

  • 看图能解高中函数题,能分析物流单和发票这样的复杂图表,还能根据风景照片推测出拍摄地点,多模态理解、推理能力再次迎来突破。近日,阿里国际AI团队发布多模态大模型Ovis2.5,在通用多模态基准、复杂图表理解与 OCR 等实际应用场景,Ovis2.5 均展现出领先的理解与推理能力。 在主流多模态评测套件 OpenCompass 上,Ovis2.5-9B综合得分 78.3,超越众多更大参数量的模型,在40B以下参数规模的开源模型中位居前茅;Ovis2.5-2B综合得分73.9,延续了Ovis系列小尺寸、高性能的理念,在同尺寸模型中性能显著领先。 Ovis2.5-9B在多个benchmark上取得了同尺寸开源最佳性能,Ovis2.5-2B在很小的模型尺寸下也展现了优异的性能 相比Ovis2等早期版本, 升级版的Ovis2.5在处理复杂图表、数学题推理、知识储备等方面都有亮眼表现。例如,Ovis2.5可以看图求解函数题、看风景照片分析地点并找到应景的古诗。
    ▲Ovis2.5 数学推理能力示例
    ▲Ovis2.5 复杂图表分析能力示例
    ▲Ovis2.5 知识能力示例
    ▲Ovis2.5 定位能力示例
    具体来说,Ovis2.5有三方面的能力进化:
    1. 看图更完整,不需要“先切分再合并”
    在 Ovis2 及早期版本中,高分辨率图片需要通过“切图-拼接”处理,这往往导致整体结构与细节信息的损失。为解决这一问题,Ovis2.5 集成了原生分辨率视觉编码器(NaViT),能够直接处理任意原生分辨率的图像,让模型真正做到“完整看图”。无论是宏观布局还是微小文字细节,都能精准捕捉,为复杂场景下的深度推理奠定坚实基础。
    1. 深度推理“思考模式”,能自我检查与修正
    Ovis2.5 融入了包含自我检查与修正环节的长链思考训练,使模型能够在解决问题时进行自我反思。在推理时,用户可以选择开启“思考模式”:模型会生成中间步骤,主动检视并修正推理过程,从而在数学题求解、复杂图表等高难度任务中获得更高的准确率。这一机制提供了延迟与精度的灵活权衡,用户可根据需求自由切换。
    1. 攻克复杂图表难题
    复杂图表理解一直是多模态领域的“硬骨头”,大量噪声和密集的视觉信息给模型带来了巨大挑战。Ovis2.5针对这一痛点,从三个层面进行了系统性增强:
    • 数据端:新增了海量高质量的图表、OCR、Grounding数据。
    • 视觉端:利用原生分辨率编码器,准确全面地理解图表中的元素。
    • 推理端:结合深度思考能力,对图表中的数据和逻辑关系进行精准分析。
    在模型尺寸较小的情况下,Ovis2.5实现了性能与效率的双重突破,在端侧和资源受限的场景下能发挥出“小身板、大能量” 的效果。据悉,Ovis累计下载量超280万,在多模态领域最近一个月下载量仅次于QwenVL模型。 在AI领域,具有推理能力的多模态大模型应用场景特别广泛。例如,在快递分拣场景,能够识别快递面单照片上的订单号、收件地址等各种信息,并遵循指令以JSON格式输出,提升物流效率;在自动驾驶场景,能够处理不同模态的信息,精准感知环境、作出决策。随着人工智能的发展,大模型的多模态理解能力、推理能力升级也逐渐成为行业趋势。 据此前报道,阿里国际AI Business团队成立于2023年,基于全球化电商场景探索AI技术。目前,阿里国际的所有电商平台均已应用AI,已服务了超50万卖家,形成了以服务中小企业出海为核心,覆盖全球多元市场、多种电商模式的规模级AI应用。当下,阿里国际AI服务的调用量每两个月就会翻一番,截至2025年7月,平均日调用量已突破10亿次。 附相关链接: 技术报告:https://arxiv.org/abs/2508.11737 代码: https://github.com/AIDC-AI/Ovis 9B模型: https://huggingface.co/AIDC-AI/Ovis2.5-9B 2B模型: https://huggingface.co/AIDC-AI/Ovis2.5-2B 9B Demo: https://huggingface.co/spaces/AIDC-AI/Ovis2.5-9B 2B Demo: https://huggingface.co/spaces/AIDC-AI/Ovis2.5-2B

    分享至微信

    使用微信扫码将网页分享到微信

  • OPPO Find X9 将配备丹霞原彩镜头 近期,OPPO Find 系列产品负责人周意保在回复网友时确认,OPPO Find X9 将配备丹霞原彩镜头。 据悉,「丹霞原彩镜头」在今年发布的 OPPO Find X8 Ultra 机型中亮相,其具备完整光学结构的独立摄像头,内置分区色温感知技术,能够将画面划分为多个区域,针对每一区域 ​……

    分享至微信

    使用微信扫码将网页分享到微信

  • 萤火虫或下月推出特别版,欧版同款调校 据「汽车像素」报道,蔚来将在近期发布「特别版」的萤火虫,时间点大概率会是今年 9 月的 Nio Day 上,与第三代蔚来 ES8 的上市同步。 消息称,今年 4 月下旬 Firefly 萤火虫上市时,蔚来创始人、董事长李斌曾透露,蔚来内部在讨论,是否应该在合适时间点把欧 ​……

    分享至微信

    使用微信扫码将网页分享到微信

  • 格力高管再回应「销量被小米空调超越」 日前,珠海格力电器股份有限公司市场总监「朱磊 Gree」再次发文谈空调销量排名争议,其称: 「我刚去奥维数据罗盘看了下,数据并没有变来变去,倒是那张来路不明的图表,还稳稳地挂在小米老总卢伟冰转发的微博上。卢总的微博里还有一张所谓《2025 年 7 月中国 ​……

    分享至微信

    使用微信扫码将网页分享到微信

  • 蔚来高管要求不拉踩诋毁竞品 日前,博主「Remi 雷米侃电车」晒出蔚来销售负责人杨波在内部工作群的截图。文中杨波对蔚来 Fellow 强调,不允许去拉踩和诋毁竞品。 杨波表示,近期客流量增大,要求一线伙伴珍惜每一位到店客户,多一份热情,多一份关心,拿出自己最专业的产品知识给用户讲好产品。「珍 ​……

    分享至微信

    使用微信扫码将网页分享到微信

  • 财联社消息,华为将于 8 月 27 日发布新品 AI SSD,目标直指 AI 存储器市场。 报道称,传统 HBM 存在容量限制,而华为或将通过技术创新提供大容量 SSD。 ​……

    分享至微信

    使用微信扫码将网页分享到微信

  • #喜茶上线拼好饭# ,是常规零售价的 6 折左右 据界面新闻报道,喜茶改变了它持续 7 年之久的线上渠道分布。8 月 22 日,喜茶宣布入驻「淘宝闪购(饿了么)」平台,并联合发放 100 万份喜茶免单卡。除此之外,喜茶 8 月份还悄然在「美团拼好饭」上线。 所谓的「拼好饭」,是美团推出的一种强调低价的 ​……

    分享至微信

    使用微信扫码将网页分享到微信

  • 马斯克真·起诉苹果、OpenAI:阻碍其他 AI 竞争 据彭博社报道,马斯克旗下的 X 公司和 xAI 于昨日正式向苹果、OpenAI 提起诉讼,认为苹果决定将 OpenAI 的 AI 产品集成到 iPhone 系统中,从而损害了其他 AI 产品的竞争,还剥夺了消费者的选择权。 本月中,马斯克就曾发文称,苹果偏袒 OpenAI,违反了 ​……

    分享至微信

    使用微信扫码将网页分享到微信