DeepSeek开源OCR-2新架构模型,六大科技巨头殊途同归齐聚共赴AI应用盛宴!

发布时间 2026-1-28 17:31
获悉,临近春节,DeepSeek的更新也越来越快了。日前,DeepSeek团队发布了论文《DeepSeek-OCR 2:Visual Causal Flow》,并正式开源了DeepSeek-OCR 2模型。

开源OCR-2模型来袭
据介绍,DeepSeek新开源的DeepSeek-OCR 2模型作为新一代视觉语言OCR模型,核心创新在于提出了视觉因果流的编码器架构,能够让机器阅读更像人而设计的。

此外,相比前代模型,DeepSeek-OCR 2在在线用户日志图像中,重复率从6.25%降至4.17%。展望未来,DeepSeek将向着更通用的多模态智能继续“深度求索”。

AI应用迈入商业新阶段
如今,AI应用新模型的消息持续引发业界广泛关注。产业链层面,AI的发展通常可分为三层,即算力基础设施、大模型能力,以及应用层。

当前阶段,AI一个显著变化是:应用端的重要性正在上升。一方面,模型能力的提升与推理成本的下降,为应用提供了可持续的经济基础;另一方面,企业和个人用户对效率提升的真实需求,正在推动应用快速落地。

尤其以AI Agent为代表的新型应用形态,开始在办公、金融、编程、政务等场景中实现更深度的使用,从“辅助建议”走向“部分任务替代”。根据弗若斯特沙利文的测算,AI应用正逐步迈入“能形成收入、能验证商业模式”的新阶段,并有望在未来几年保持较快增长。

资本层面上,AI产业的战略价值得到全球主要经济体的认可,资本投入持续增加,为行业注入动力。据Gartner(高德纳)预测,2026年全球人工智能支出将达到2.52万亿美元,同比增长44%,彰显全球主要经济体对AI战略价值的系统性押注。同期,科技巨头也在加码进攻。

大厂殊途同归,把握AI应用机遇
英伟达(NVDA.US)
1月27日,英伟达和人工智能(AI)云服务商CoreWeave公司宣布扩大双方长期互补的合作关系,使 CoreWeave 能够加速建设超过 5 吉瓦的 AI 工厂,到 2030 年在全球范围内推广 AI 应用。

过去五年间,英伟达已成为惊人规模的人工智能数据中心建设核心。这为公司带来了前所未有的销售增长和财务实力,同时英伟达是首家市值达到4万亿美元的公司,甚至曾短暂实现5万亿美元。

目前人工智能的需求持续呈指数级增长,计算需求也空前高涨,为了满足这一需求,英伟达和 CoreWeave 正在深化其基础设施、软件和平台方面的合作。这项投资体现了英伟达对CoreWeave 的业务、团队以及作为基于 NVIDIA 基础设施构建的云平台的增长战略的信心。

Meta(META.US)
近日,Meta首席技术官表示,该公司新成立的人工智能实验室本月在内部交付了首批备受瞩目的人工智能模型。

此前,知情人士透露,Meta正在开发一个代号为 “鳄梨”的文本人工智能模型,计划在第一季度推出 ,同时还有一个代号为 “芒果”的图像和视频模型 。首席技术官博斯沃思说,去年成立的Meta超级智能实验室团队建立的模型显示出很大的前景,相信新的模型即将发布。

阿里巴巴(BABA.US)
1月27日,消息显示,阿里正式发布千问旗舰推理模型Qwen3-Max-Thinking。该模型总参数量超万亿(1T),预训练数据量高达36T Tokens,是目前阿里规模最大、能力最强的千问推理模型。

在涵盖事实知识、复杂推理、指令遵循、人类偏好对齐、Agent能力等19个公认的大模型基准测试中,千问旗舰推理模型刷新了数项最佳表现纪录,整体性能可媲美 GPT-5.2-Thinking-xhigh、Claude Opus 4.5 和 Gemini 3 Pro 。

与此同时,面向即将到来的智能体Agent时代,Qwen3-Max-Thinking也增强着自主调用工具的原生Agent能力,进行了基于规则奖励与模型奖励的联合强化学习训练,使得Qwen3-Max-Thinking拥有更智能结合工具进行思考的能力。

腾讯(TCEHY.US)
据悉,日前,马化腾在腾讯年会上,称腾讯会一体化考虑大模型和AI产品,试图以“元宝派”打开新空间。

正如马化腾所言,腾讯更喜欢用不打扰用户的方式,做“润物细无声”的生态融合。在通用大模型的激进发布上显得谨慎,腾讯的AI战略更倾向于“渗透”与“结合”,把AI能力深度融入微信、QQ、企业微信等国民级应用以及游戏、金融科技等优势业务中。

微美全息(WIMI.US)
资料显示,微美全息长期致力于打造算力基础设施+大模型研发+场景应用的全栈式AI能力,重点聚焦开源AI技术体系革新,持续推进"硬件+软件+生态"融合,开放技术接口与第三方开发者共建生态,旨在构建覆盖底层架构到行业应用的全链条能力。

目前,微美全息AI技术已覆盖视觉处理、自然语言理解、语音识别、知识图谱构建、机器学习算法优化等多模态领域,同时,微美全息打造全场景边端AI芯片技术,赋能自动驾驶、AIoT、智能交互、机器人等领域,深化开源AI领域布局,多元化抢占布局端侧AI高潜力赛道。

字节跳动
据了解,字节跳动以敏捷和务实著称。目前,豆包在字节内部应用非常广泛,包括抖音的内容推荐、创作工具,飞书的办公协同等等,推出“豆包AI手机”、研发“豆包AI耳机”,显示字节开始触碰硬件层。不过,字节潜在的AI超级入口可能是抖音,可能是豆包,也可能是尚未完全成型的新硬件。

总结
站在新的一年节点回望,AI模型应用的发展已经超出预期,未来几乎所有链接真实世界的工具接口。展望未来,随着技术迭代、政策支持、场景拓展等多重因素的推动,AI应用的市场空间将进一步打开,有望迎来更大规模的爆发,推动行业持续高速发展。

最新评论

风险批露: 交易股票、外汇、商品、期货、债券、基金等金融工具或加密货币属高风险行为,这些风险包括损失您的部分或全部投资金额,所以交易并非适合所有投资者。加密货币价格极易波动,可能受金融、监管或政治事件等外部因素的影响。保证金交易会放大金融风险。
在决定交易任何金融工具或加密货币前,您应当充分了解与金融市场交易相关的风险和成本,并谨慎考虑您的投资目标、经验水平以及风险偏好,必要时应当寻求专业意见。
Fusion Media提醒您,本网站所含数据未必实时、准确。本网站的数据和价格未必由市场或交易所提供,而可能由做市商提供,所以价格可能并不准确且可能与实际市场价格行情存在差异。即该价格仅为指示性价格,反映行情走势,不宜为交易目的使用。对于您因交易行为或依赖本网站所含信息所导致的任何损失,Fusion Media及本网站所含数据的提供商不承担责任。
未经Fusion Media及/或数据提供商书面许可,禁止使用、存储、复制、展现、修改、传播或分发本网站所含数据。提供本网站所含数据的供应商及交易所保留其所有知识产权。
本网站的广告客户可能会根据您与广告或广告主的互动情况,向Fusion Media支付费用。
本协议的英文版本系主要版本。如英文版本与中文版本存在差异,以英文版本为准。
© 2007-2026 - Fusion Media Limited | 粤ICP备17131071号 | 保留所有权利。