视觉编码器革命:Penguin-VL挑战CLIP,小米发布首款移动Agent,OpenAI推出GPT-5.4系列

今日摘要

本期聚焦视觉语言模型的架构创新、AI Agent在移动端的落地应用,以及大模型的持续进化。Penguin-VL挑战了传统视觉编码器的预训练范式,小米进军移动端智能体市场,OpenAI发布GPT-5.4系列模型,微软必应全面接入Sora 2,AI技术正在从理论研究加速向实际应用转化。

阅读更多

GPT-5.3 紧急上线拒绝"爹味",DeepSeek V4 万亿参数即将发布,谷歌 Gemini 3.1 推理性能翻倍

今日摘要

今日 AI 领域重磅消息不断:OpenAI 紧急推出 GPT-5.3 Instant 重点解决”爹味”说教问题;DeepSeek V4 万亿参数旗舰模型即将发布,支持 100 万上下文;谷歌发布 Gemini 3.1 Pro,推理性能翻倍超越 GPT-5.2;阿里通义千问负责人林俊旸宣布离职,引发行业震动。

阅读更多

字节Seedance 2.0震撼发布,蚂蚁开源万亿参数模型Ring-2.5-1T,Gemini 3 Deep Think血洗编程榜单

今日摘要

今日AI领域迎来多项重磅发布:字节跳动Seedance 2.0实现视频生成工业级交付,蚂蚁集团开源全球首个万亿参数混合线性架构思考模型Ring-2.5-1T,Google Gemini 3 Deep Think在编程与科研领域取得突破性进展。此外,智谱GLM-5、DeepSeek上下文升级、小米机器人VLA模型等也带来重要更新。

阅读更多

AI创新周报:无限推理突破、Transformer架构革新、移动GUI智能体基准测试

今日摘要

本周AI领域迎来多项重大突破:DeepSeek团队提出InftyThink+框架,通过强化学习实现高效的无限视野推理;研究者重新审视Transformer的MLP设计,提出沙漏型FFN架构;MemGUI-Bench首次系统性评估移动GUI智能体的记忆能力。此外,国内AI产业持续升级,可灵3.0发布、阿里千问品牌统一、上海AI实验室发布科学多模态大模型等重要进展值得关注。

阅读更多

AI新突破:支付宝AI眼镜扫福上线,OpenAI发布Codex桌面版,蚂蚁灵波开源VLA模型引领具身智能新时代

今日摘要

本周AI领域动态频繁:支付宝创新推出AI眼镜扫福体验,OpenAI发布macOS版Codex桌面应用深度整合智能体开发,蚂蚁灵波开源LingBot-VLA和世界模型推动具身智能发展,GPT-5.2、Qwen3等主流大模型迎来性能升级。同时,学术界在长上下文推理、软件工程智能体等方向取得重要进展。

阅读更多

具身智能爆发:蚂蚁灵波、宇树连发 VLA 大模型,推理奖励模型引领 AI Agent 新突破

今日摘要

具身智能领域迎来重大突破!蚂蚁集团发布 LingBot-VLA 双臂机器人操控模型,宇树开源 UnifoLM-VLA-0 为人形机器人注入”物理常识”。同时,多个推理奖励模型框架(R2M、TTCS、SSL)正在重塑 AI Agent 的优化范式,标志着从语义理解向实体交互的关键跃迁。

阅读更多