2026-03-04发表2026-03-04更新AI News

GPT-5.3 紧急上线拒绝"爹味"，DeepSeek V4 万亿参数即将发布，谷歌 Gemini 3.1 推理性能翻倍

今日摘要

今日 AI 领域重磅消息不断：OpenAI 紧急推出 GPT-5.3 Instant 重点解决”爹味”说教问题；DeepSeek V4 万亿参数旗舰模型即将发布，支持 100 万上下文；谷歌发布 Gemini 3.1 Pro，推理性能翻倍超越 GPT-5.2；阿里通义千问负责人林俊旸宣布离职，引发行业震动。

🔥 行业热点

1️⃣ OpenAI 紧急上线 GPT-5.3 Instant：拒绝”爹味”说教

核心要点：

🎯 重点优化：解决 ChatGPT 的”爹味”说教问题，对话更加自然平等
📊 幻觉率降低：在医学、法律等专业领域的可靠性显著提升
🎨 创意增强：创意写作能力大幅提升，更擅长通过细节刻画触动人心
🚀 后续版本：GPT-5.4 已在研发中，将带来更多突破性功能

OpenAI 推出 GPT-5.3 Instant 版本，这次更新的核心是解决用户长期诟病的”爹味”说教问题。新模型在保持专业性的同时，对话风格更加自然平等，不再给人居高临下的感觉。同时，在幻觉率控制和创意写作方面都取得了显著突破。

🔗 详情链接

2️⃣ DeepSeek V4 细节曝光：万亿参数 + 100 万上下文

核心要点：

🧠 参数规模：万亿参数级别，国产大模型新标杆
📚 超长上下文：支持 100 万 token 上下文窗口，可处理整本长篇小说
🎬 多模态能力：原生支持图片、视频和文本的 AI 生成
🇨🇳 国产芯片：优先适配华为、寒武纪等国产芯片平台

DeepSeek V4 作为下一代旗舰模型，将参数规模提升至万亿级别，上下文处理能力从 128K 跃升至 1M Token，处理能力提升近 8 倍。该模型还将引入原生多模态能力，支持图片、视频生成，填补国内低成本开源模型市场空白。

🔗 详情链接

3️⃣ 谷歌发布 Gemini 3.1 Pro：推理性能翻倍超越 GPT-5.2

核心要点：

🧠 推理跃升：核心推理测试得分较前代提升逾两倍
🏆 超越竞品：在 HLE 测试中超越 GPT-5.2
📊 长文本支持：支持百万级 Token 上下文输入
🎨 创新功能：可直接生成图表或 SVG 动画

谷歌发布的 Gemini 3.1 Pro 采用全新的 Core Intelligence 架构，重点强化了模型解决复杂问题的逻辑能力。在多项基准测试中表现优异，特别是在推理能力方面实现了质的飞跃。

🔗 详情链接

Gemini 3.1 Pro

💼 人事变动

阿里通义千问负责人林俊旸宣布离职

核心要点：

👨‍💼 身份背景：阿里最年轻的 P10 级技术领袖，主导 Qwen 开源生态
🌟 重要贡献：推动通义千问成为全球活跃度最高的开源大模型
🤖 前瞻布局：组建机器人与具身智能小组，推动 AI 走向物理世界
🔄 行业影响：引发 AI 学术界及开发者社区强烈反应

林俊旸的离职对阿里大模型战略带来挑战，也反映出大模型赛道核心人才流动的高频化趋势。他在任期间主导了 Qwen 开源生态的构建，使其成为全球开发者社区中活跃度最高的开源大模型。

🔗 详情链接

🚀 产品发布

1️⃣ Anthropic 发布 Claude Code 语音模式

核心要点：

🎙️ 语音编程：通过 /voice 指令开启，支持”口播式”代码重构
📈 商业表现：年化收入超 25 亿美元，两个月内营收与用户双倍增长
⏳ 逐步推送：目前仅 5% Windows 用户可用，预计本月全面上线

Anthropic 推出 Claude Code 语音模式，开发者可通过语音指令执行编程任务，提升开发效率并拓宽应用场景。这标志着 AI 编程工具向更自然的交互方式演进。

🔗 详情链接

Claude Code

2️⃣ 阶跃星辰 Step 3.5 Flash 全链路开源

核心要点：

🧠 模型架构：1960 亿参数 MoE 架构，推理时仅激活 110 亿参数
⚡ 推理速度：代码任务推理速度最高可达 350 TPS
📈 市场表现：下载量突破 30 万次，OpenClaw 调用量全球第二
💡 高能效比：实现高性能与低成本的完美平衡

阶跃星辰开源 Step 3.5 Flash 模型，采用稀疏 MoE 架构，在保持高性能的同时大幅降低推理成本，为开发者构建高性能 Agent 提供了强大工具。

🔗 详情链接

Step 3.5 Flash

3️⃣ 谷歌发布 Gemini 3.1 Flash-Lite：速度与性价比双提升

核心要点：

⚡ 速度提升：首字响应速度提升 2.5 倍，整体输出速度提高 45%
💰 极致性价比：每百万输入 Token 仅需 0.25 美元
🧠 思考层级：新增”思考层级”调节功能，支持效率与深度推理灵活切换

谷歌推出的 Gemini 3.1 Flash-Lite 模型专注于实时交互场景，在响应速度和性价比方面都实现了显著提升，为大规模 AI 部署降低了门槛。

🔗 详情链接

Gemini Flash-Lite

🔬 学术前沿

1️⃣ Utonia: 统一所有点云的编码器

研究亮点：

🌐 跨域统一：首个跨遥感、LiDAR、RGB-D、CAD 等多域的点云编码器
🧠 一致表示：学习跨域一致的表示空间，实现知识迁移
🤖 具身智能：可用于机器人操作和视觉语言模型的空间推理

研究团队提出 Utonia，这是迈向统一点云基础模型的第一步。通过自监督学习，Utonia 能够处理来自不同领域的点云数据，并学习到一致的表示空间。

📄 论文链接

2️⃣ 超越语言建模：多模态预训练探索

研究亮点：

🎨 RAE 架构：表示自编码器在视觉理解和生成上都表现优异
📊 扩展规律：发现视觉数据比语言数据更”饥渴”
🔀 MoE 优势：混合专家架构能自然实现模态专业化

Meta 团队通过从头预训练实验，系统研究了原生多模态模型的设计空间，提出了四个关键洞察，为构建真正统一的多模态模型铺平道路。

📄 论文链接

3️⃣ Code2Math: 代码智能体能否进化数学问题？

研究亮点：

🧮 问题进化：通过代码执行环境自动生成更复杂的数学问题
🔍 多智能体：设计多智能体框架验证问题的可解性和难度
📈 可扩展性：为高难度数学推理问题合成提供可行方案

研究团队探索代码智能体自主进化数学问题的潜力，通过充分的测试时探索，代码智能体能够合成结构不同且更具挑战性的新问题。

📄 论文链接
🔗 GitHub

4️⃣ Qwen3-Coder-Next: 下一代编程智能体

技术亮点：

🎯 高效推理：800 亿参数，推理时仅激活 30 亿参数
🤖 智能体训练：通过大规模可验证编程任务合成进行智能体训练
🏆 竞争力强：在 SWE-Bench 等智能体基准测试中表现出色

阿里通义团队发布 Qwen3-Coder-Next，这是一个专门为编程智能体设计的开源模型，通过创新的训练方法实现了强大的编程能力和高效推理。

📄 论文链接

🏢 企业动态

1️⃣ 讯飞 AI 眼镜 MWC 2026 全球首秀

产品特点：

⚖️ 轻量设计：仅 40 克，解决 AR 眼镜佩戴沉重问题
👄 唇动降噪：首创唇动识别多模态降噪技术，识别准确率提升 50%+
🗣️ 多模态翻译：实现实时字幕与译文同步播放

讯飞在 MWC 2026 上展示了其 AI 眼镜，以极致轻量化设计和创新的唇动识别降噪技术，为跨国交流提供了更自然、高效的解决方案。

🔗 详情链接

讯飞 AI 眼镜

2️⃣ 可灵 3.0 登顶全球视频模型第一

核心成就：

🏆 全球第一：在权威基准测试中登顶文生视频赛道
🇨🇳 集团优势：中国 AI 有 7 款模型进入全球前 15 名
💡 质变突破：实现从”玩具”到”生产力工具”的质变

快手自研的可灵 3.0 系列模型在全球视频生成赛道取得领先地位，标志着中国 AI 视频生成技术达到国际顶尖水平。

🔗 详情链接

3️⃣ MiniMax 公布上市后首份财报

财务数据：

💰 收入增长：2025 年总收入 7904 万美元，同比增长 158.9%
📉 亏损情况：年内亏损 18.72 亿美元，主要源于金融负债重估
🌍 海外市场：海外收入占比超 70%，Talkie 全球用户 2.36 亿

MiniMax 首份年报展示了其在 AI 平台战略上的显著进展，尽管面临亏损压力，但全球市场布局和成本优势为其带来巨大增长潜力。

🔗 详情链接

💡 技术创新

1️⃣ AReaL v1.0：智能体强化学习训练框架

技术突破：

🛠️ 零改造接入：通过 Proxy Worker 中转层实现 RL 训练
🚀 原生引擎：Archon 支持 5D 并行，降低开发门槛
🧠 边用边训：OpenClaw 能”边用边训”，实现持续进化

AReaL v1.0 稳定版发布，解决了智能体接入训练成本高和缺乏持续进化能力的问题，为 AI Agent 的发展提供了强大的训练工具。

🔗 详情链接
🔗 GitHub

AReaL

2️⃣ 阿里通义发布语音双模型

技术特点：

🎙️ Fun-CosyVoice 3.5：支持多语种语音生成和精细化控制
🎧 Fun-AudioGen-VD：根据描述生成”人物+场景”一体化音频
💡 FreeStyle 指令：支持自然语言精准控制声音风格

阿里通义实验室推出两款革命性语音生成模型，支持自然语言指令控制音色和场景，显著提升语音创作效率与质量。

🔗 详情链接

通义语音模型

🌐 行业观察

AI 眼镜市场：机遇与挑战并存

周鸿祎直言”AI 眼镜挺难做”，指出市场虽热但存在高门槛和商业挑战。他认为硬件只是载体，未来应聚焦智能体技术。与此同时，阿里巴巴宣布将在 MWC 上推出千问 AI 眼镜，整合阿里生态系统，提供便捷的智能生活体验。

华强北”神秘力量”也在横扫亚马逊，AI 眼镜销量暴涨 80%，国产平价替代正加速”围猎”Meta。这一市场呈现出高端与平价 AI 眼镜两极分化的格局。

🔗 周鸿祎观点
🔗 阿里千问眼镜

📊 市场数据

QM 发布 2025 年 AI 应用榜

榜单前五：

🥇 豆包 - 字节跳动
🥈 DeepSeek - 深度求索
🥉 元宝 - 腾讯
4️⃣ 蚂蚁阿福 - 蚂蚁集团
5️⃣ 阿里千问 - 阿里巴巴

关键发现：

📈 场景穿透：从”通用覆盖”到”场景穿透”的趋势明显
🏢 巨头主导：字节系和阿里系占据前十中的六个席位
🎯 垂类崛起：前十中有 4 个垂类场景的专业 AI

🔗 详情链接

🔐 安全与合规

小红书重拳治理 AI 假脸

新规要点：

⚖️ 强制标识：AI 生成及合成内容须显著标识
🔍 算法检测：平台将通过算法检测 AI 内容
🚫 严厉打击：违规将扣除流量，严厉打击虚假信息

小红书针对 AI 技术滥用乱象，要求创作者对 AI 生成及合成内容进行主动标识，以维护社区内容的真实性与合规性。

🔗 详情链接

🎓 教育思考

马云重返云谷学校：AI 冲击超乎想象

核心观点：

🧠 教育转型：从”知识驱动”转向”智慧驱动”
💡 能力培养：注重创造力、独立思考和责任感
🤖 AI 工具：教会孩子如何利用 AI 工具

马云带领阿里巴巴与蚂蚁集团核心管理层访问杭州云谷学校，探讨 AI 浪潮下的教育变革，强调教育需迅速适应 AI 带来的变化。

🔗 详情链接

本文由 AI 自动整理生成，内容来源于 AI Base 日报和 Hugging Face Daily Papers

GPT-5.3 紧急上线拒绝"爹味"，DeepSeek V4 万亿参数即将发布，谷歌 Gemini 3.1 推理性能翻倍

https://daily.ailab1024.com/2026/03/04/ai-breakthroughs-march-4-2026/

作者

Joker

发布于

2026-03-04

更新于

2026-03-04

许可协议

#LLM Multimodal Deep Learning AI Applications Machine Learning