GPT-5.3 紧急上线拒绝"爹味",DeepSeek V4 万亿参数即将发布,谷歌 Gemini 3.1 推理性能翻倍
今日摘要
今日 AI 领域重磅消息不断:OpenAI 紧急推出 GPT-5.3 Instant 重点解决”爹味”说教问题;DeepSeek V4 万亿参数旗舰模型即将发布,支持 100 万上下文;谷歌发布 Gemini 3.1 Pro,推理性能翻倍超越 GPT-5.2;阿里通义千问负责人林俊旸宣布离职,引发行业震动。
🔥 行业热点
1️⃣ OpenAI 紧急上线 GPT-5.3 Instant:拒绝”爹味”说教
核心要点:
- 🎯 重点优化:解决 ChatGPT 的”爹味”说教问题,对话更加自然平等
- 📊 幻觉率降低:在医学、法律等专业领域的可靠性显著提升
- 🎨 创意增强:创意写作能力大幅提升,更擅长通过细节刻画触动人心
- 🚀 后续版本:GPT-5.4 已在研发中,将带来更多突破性功能
OpenAI 推出 GPT-5.3 Instant 版本,这次更新的核心是解决用户长期诟病的”爹味”说教问题。新模型在保持专业性的同时,对话风格更加自然平等,不再给人居高临下的感觉。同时,在幻觉率控制和创意写作方面都取得了显著突破。
🔗 详情链接
2️⃣ DeepSeek V4 细节曝光:万亿参数 + 100 万上下文
核心要点:
- 🧠 参数规模:万亿参数级别,国产大模型新标杆
- 📚 超长上下文:支持 100 万 token 上下文窗口,可处理整本长篇小说
- 🎬 多模态能力:原生支持图片、视频和文本的 AI 生成
- 🇨🇳 国产芯片:优先适配华为、寒武纪等国产芯片平台
DeepSeek V4 作为下一代旗舰模型,将参数规模提升至万亿级别,上下文处理能力从 128K 跃升至 1M Token,处理能力提升近 8 倍。该模型还将引入原生多模态能力,支持图片、视频生成,填补国内低成本开源模型市场空白。
🔗 详情链接
3️⃣ 谷歌发布 Gemini 3.1 Pro:推理性能翻倍超越 GPT-5.2
核心要点:
- 🧠 推理跃升:核心推理测试得分较前代提升逾两倍
- 🏆 超越竞品:在 HLE 测试中超越 GPT-5.2
- 📊 长文本支持:支持百万级 Token 上下文输入
- 🎨 创新功能:可直接生成图表或 SVG 动画
谷歌发布的 Gemini 3.1 Pro 采用全新的 Core Intelligence 架构,重点强化了模型解决复杂问题的逻辑能力。在多项基准测试中表现优异,特别是在推理能力方面实现了质的飞跃。
🔗 详情链接

💼 人事变动
阿里通义千问负责人林俊旸宣布离职
核心要点:
- 👨💼 身份背景:阿里最年轻的 P10 级技术领袖,主导 Qwen 开源生态
- 🌟 重要贡献:推动通义千问成为全球活跃度最高的开源大模型
- 🤖 前瞻布局:组建机器人与具身智能小组,推动 AI 走向物理世界
- 🔄 行业影响:引发 AI 学术界及开发者社区强烈反应
林俊旸的离职对阿里大模型战略带来挑战,也反映出大模型赛道核心人才流动的高频化趋势。他在任期间主导了 Qwen 开源生态的构建,使其成为全球开发者社区中活跃度最高的开源大模型。
🔗 详情链接
🚀 产品发布
1️⃣ Anthropic 发布 Claude Code 语音模式
核心要点:
- 🎙️ 语音编程:通过 /voice 指令开启,支持”口播式”代码重构
- 📈 商业表现:年化收入超 25 亿美元,两个月内营收与用户双倍增长
- ⏳ 逐步推送:目前仅 5% Windows 用户可用,预计本月全面上线
Anthropic 推出 Claude Code 语音模式,开发者可通过语音指令执行编程任务,提升开发效率并拓宽应用场景。这标志着 AI 编程工具向更自然的交互方式演进。
🔗 详情链接

2️⃣ 阶跃星辰 Step 3.5 Flash 全链路开源
核心要点:
- 🧠 模型架构:1960 亿参数 MoE 架构,推理时仅激活 110 亿参数
- ⚡ 推理速度:代码任务推理速度最高可达 350 TPS
- 📈 市场表现:下载量突破 30 万次,OpenClaw 调用量全球第二
- 💡 高能效比:实现高性能与低成本的完美平衡
阶跃星辰开源 Step 3.5 Flash 模型,采用稀疏 MoE 架构,在保持高性能的同时大幅降低推理成本,为开发者构建高性能 Agent 提供了强大工具。
🔗 详情链接

3️⃣ 谷歌发布 Gemini 3.1 Flash-Lite:速度与性价比双提升
核心要点:
- ⚡ 速度提升:首字响应速度提升 2.5 倍,整体输出速度提高 45%
- 💰 极致性价比:每百万输入 Token 仅需 0.25 美元
- 🧠 思考层级:新增”思考层级”调节功能,支持效率与深度推理灵活切换
谷歌推出的 Gemini 3.1 Flash-Lite 模型专注于实时交互场景,在响应速度和性价比方面都实现了显著提升,为大规模 AI 部署降低了门槛。
🔗 详情链接

🔬 学术前沿
1️⃣ Utonia: 统一所有点云的编码器
研究亮点:
- 🌐 跨域统一:首个跨遥感、LiDAR、RGB-D、CAD 等多域的点云编码器
- 🧠 一致表示:学习跨域一致的表示空间,实现知识迁移
- 🤖 具身智能:可用于机器人操作和视觉语言模型的空间推理
研究团队提出 Utonia,这是迈向统一点云基础模型的第一步。通过自监督学习,Utonia 能够处理来自不同领域的点云数据,并学习到一致的表示空间。
📄 论文链接
2️⃣ 超越语言建模:多模态预训练探索
研究亮点:
- 🎨 RAE 架构:表示自编码器在视觉理解和生成上都表现优异
- 📊 扩展规律:发现视觉数据比语言数据更”饥渴”
- 🔀 MoE 优势:混合专家架构能自然实现模态专业化
Meta 团队通过从头预训练实验,系统研究了原生多模态模型的设计空间,提出了四个关键洞察,为构建真正统一的多模态模型铺平道路。
📄 论文链接
3️⃣ Code2Math: 代码智能体能否进化数学问题?
研究亮点:
- 🧮 问题进化:通过代码执行环境自动生成更复杂的数学问题
- 🔍 多智能体:设计多智能体框架验证问题的可解性和难度
- 📈 可扩展性:为高难度数学推理问题合成提供可行方案
研究团队探索代码智能体自主进化数学问题的潜力,通过充分的测试时探索,代码智能体能够合成结构不同且更具挑战性的新问题。
4️⃣ Qwen3-Coder-Next: 下一代编程智能体
技术亮点:
- 🎯 高效推理:800 亿参数,推理时仅激活 30 亿参数
- 🤖 智能体训练:通过大规模可验证编程任务合成进行智能体训练
- 🏆 竞争力强:在 SWE-Bench 等智能体基准测试中表现出色
阿里通义团队发布 Qwen3-Coder-Next,这是一个专门为编程智能体设计的开源模型,通过创新的训练方法实现了强大的编程能力和高效推理。
📄 论文链接
🏢 企业动态
1️⃣ 讯飞 AI 眼镜 MWC 2026 全球首秀
产品特点:
- ⚖️ 轻量设计:仅 40 克,解决 AR 眼镜佩戴沉重问题
- 👄 唇动降噪:首创唇动识别多模态降噪技术,识别准确率提升 50%+
- 🗣️ 多模态翻译:实现实时字幕与译文同步播放
讯飞在 MWC 2026 上展示了其 AI 眼镜,以极致轻量化设计和创新的唇动识别降噪技术,为跨国交流提供了更自然、高效的解决方案。
🔗 详情链接

2️⃣ 可灵 3.0 登顶全球视频模型第一
核心成就:
- 🏆 全球第一:在权威基准测试中登顶文生视频赛道
- 🇨🇳 集团优势:中国 AI 有 7 款模型进入全球前 15 名
- 💡 质变突破:实现从”玩具”到”生产力工具”的质变
快手自研的可灵 3.0 系列模型在全球视频生成赛道取得领先地位,标志着中国 AI 视频生成技术达到国际顶尖水平。
🔗 详情链接
3️⃣ MiniMax 公布上市后首份财报
财务数据:
- 💰 收入增长:2025 年总收入 7904 万美元,同比增长 158.9%
- 📉 亏损情况:年内亏损 18.72 亿美元,主要源于金融负债重估
- 🌍 海外市场:海外收入占比超 70%,Talkie 全球用户 2.36 亿
MiniMax 首份年报展示了其在 AI 平台战略上的显著进展,尽管面临亏损压力,但全球市场布局和成本优势为其带来巨大增长潜力。
🔗 详情链接
💡 技术创新
1️⃣ AReaL v1.0:智能体强化学习训练框架
技术突破:
- 🛠️ 零改造接入:通过 Proxy Worker 中转层实现 RL 训练
- 🚀 原生引擎:Archon 支持 5D 并行,降低开发门槛
- 🧠 边用边训:OpenClaw 能”边用边训”,实现持续进化
AReaL v1.0 稳定版发布,解决了智能体接入训练成本高和缺乏持续进化能力的问题,为 AI Agent 的发展提供了强大的训练工具。

2️⃣ 阿里通义发布语音双模型
技术特点:
- 🎙️ Fun-CosyVoice 3.5:支持多语种语音生成和精细化控制
- 🎧 Fun-AudioGen-VD:根据描述生成”人物+场景”一体化音频
- 💡 FreeStyle 指令:支持自然语言精准控制声音风格
阿里通义实验室推出两款革命性语音生成模型,支持自然语言指令控制音色和场景,显著提升语音创作效率与质量。
🔗 详情链接

🌐 行业观察
AI 眼镜市场:机遇与挑战并存
周鸿祎直言”AI 眼镜挺难做”,指出市场虽热但存在高门槛和商业挑战。他认为硬件只是载体,未来应聚焦智能体技术。与此同时,阿里巴巴宣布将在 MWC 上推出千问 AI 眼镜,整合阿里生态系统,提供便捷的智能生活体验。
华强北”神秘力量”也在横扫亚马逊,AI 眼镜销量暴涨 80%,国产平价替代正加速”围猎”Meta。这一市场呈现出高端与平价 AI 眼镜两极分化的格局。
📊 市场数据
QM 发布 2025 年 AI 应用榜
榜单前五:
- 🥇 豆包 - 字节跳动
- 🥈 DeepSeek - 深度求索
- 🥉 元宝 - 腾讯
- 4️⃣ 蚂蚁阿福 - 蚂蚁集团
- 5️⃣ 阿里千问 - 阿里巴巴
关键发现:
- 📈 场景穿透:从”通用覆盖”到”场景穿透”的趋势明显
- 🏢 巨头主导:字节系和阿里系占据前十中的六个席位
- 🎯 垂类崛起:前十中有 4 个垂类场景的专业 AI
🔗 详情链接
🔐 安全与合规
小红书重拳治理 AI 假脸
新规要点:
- ⚖️ 强制标识:AI 生成及合成内容须显著标识
- 🔍 算法检测:平台将通过算法检测 AI 内容
- 🚫 严厉打击:违规将扣除流量,严厉打击虚假信息
小红书针对 AI 技术滥用乱象,要求创作者对 AI 生成及合成内容进行主动标识,以维护社区内容的真实性与合规性。
🔗 详情链接
🎓 教育思考
马云重返云谷学校:AI 冲击超乎想象
核心观点:
- 🧠 教育转型:从”知识驱动”转向”智慧驱动”
- 💡 能力培养:注重创造力、独立思考和责任感
- 🤖 AI 工具:教会孩子如何利用 AI 工具
马云带领阿里巴巴与蚂蚁集团核心管理层访问杭州云谷学校,探讨 AI 浪潮下的教育变革,强调教育需迅速适应 AI 带来的变化。
🔗 详情链接
本文由 AI 自动整理生成,内容来源于 AI Base 日报和 Hugging Face Daily Papers
GPT-5.3 紧急上线拒绝"爹味",DeepSeek V4 万亿参数即将发布,谷歌 Gemini 3.1 推理性能翻倍
https://daily.ailab1024.com/2026/03/04/ai-breakthroughs-march-4-2026/