跳转到主要内容

前沿动态

共收录 38 篇文章

2026

前沿动态
2026.06.25

豆包 Seed 2.1 系列:Pro 冲复杂任务,Turbo 抢规模化落地

字节跳动在火山引擎 Force 大会发布 Doubao-Seed-2.1 系列,包含 Pro 旗舰版、Turbo 高性价比版和 Seed-Evolving 周更版。Coding、Agent、VLM 三大方向实现质变,多项代码评测超越 GPT-5.5,全系标配 256k 上下文,日均 Token 使用量突破 180 万亿。

前沿动态
2026.06.25

TRAE CN:国内首个 AI 原生 IDE 的能力全景

TRAE CN 是字节跳动推出的国内版 AI 原生 IDE,内置豆包系列模型,提供 IDE 模式与 SOLO 模式双重开发模式,深度理解中文开发场景,免费且无需翻墙。CUE 智能续写、自定义智能体、MCP 工具集成、沙箱安全运行,Seed 2.1 Pro 预计近期通过版本更新内置列装。

前沿动态
2026.06.25

TRAE Work CN 上线 Design 模式:三模式时代正式到来

字节跳动 TRAE Work CN 今日正式上线 Design 模式,与 Work 模式、Code 模式构成三模式驱动。Design 模式内置分割样板选择,非设计背景用户也能直接生成 UI 和游戏界面。Doubao-Seed-2.1 Pro 已同步列装为默认模型。

前沿动态
2026.06.25

TRAE Work vs TRAE CN:同一个名字,两种工具

TRAE Work 和 TRAE CN 都是字节跳动旗下 AI 产品,但定位完全不同——一个是全员 AI 办公平台(Work+Code+Design 三模式),一个是开发者 AI IDE(IDE+SOLO 双模式)。本文基于官方文档,从产品形态、目标用户、核心模式、模型支持等维度全面对比。

前沿动态
2026.06.17

Hermes Agent v0.16.0:从终端浮上桌面,开源 Agent 开始学会做减法

2026 年 6 月 5 日,Nous Research 发布 Hermes Agent v0.16.0,代号「The Surface Release」。874 次提交、542 个 PR、1962 个文件改动背后,最大的变化不是新增功能,而是官方开始主动砍掉默认 Skill、压缩上下文成本——这标志着 Hermes 从极客工具向大众产品跨越。

前沿动态
2026.06.15

智谱 GLM-5.2:744B MoE 与真正可用的 1M 上下文

智谱于 2026 年 6 月 15 日发布 GLM-5.2,744B MoE 架构(40B 激活),1M 真实可用上下文,MIT 协议开源。LLM Benchmark Code V3 全球第三,编程能力对标 Claude Opus 4.8,在 Claude Fable 5 被禁后成为最强开源平替。

前沿动态
2026.06.12

Claude Fable 5 上线 3 天被美国政府紧急封禁:Anthropic 说「我们不同意」,但必须执行

2026 年 6 月 9 日 Anthropic 发布 Claude Fable 5,6 月 12 日即被美国政府以出口管制为由要求暂停所有外籍用户访问。Anthropic 官方声明称「我们不同意」,但必须合规。本文数据全部来自 anthropic.com 官方公告与声明。

前沿动态
2026.06.12

Kimi K2.7 Code:让 AI 学会闭嘴干活的开源编程模型

月之暗面于 2026 年 6 月 12 日发布并开源 Kimi K2.7 Code,1.1T MoE 架构(32B 激活),256K 上下文。核心突破是解决长程任务中的'过度思考'问题,思考 token 消耗直降 30%,Kimi Code Bench v2 提升 21.8%。Modified MIT 协议开源,6 月 15 日上线 5-6 倍速高速版。

前沿动态
2026.06.01

Holo 3.1:消费级显卡跑 Computer Use Agent,法国 H Company 把「本地部署」做成了核心卖点

2026 年 6 月 1 日,法国 H Company 发布 Holo 3.1,专为 Computer Use 和 UI Grounding 设计的 VLM 家族。首次提供 FP8 / Q4 GGUF / NVFP4 量化权重,35B-A3B 模型在 DGX Spark 上 NVFP4 推理速度达 BF16 的 1.74 倍,AndroidWorld 从 67% 提升到 79.3%。本文数据全部来自 hcompany.ai 官方博客。

前沿动态
2026.06.01

MiniMax M3:MSA 稀疏注意力让 1M 上下文真正可用

MiniMax M3 于 2026 年 6 月 1 日发布,428B MoE 架构,原生多模态,1M 上下文窗口。核心创新 MSA 稀疏注意力将百万 token 的每 token 计算量降至上一代的 1/20,SWE-Bench Pro 59.0% 超越 GPT-5.5 与 Gemini 3.1 Pro。

前沿动态
2026.06.01

Qwen3.7-Plus:多模态 Agent 模型,阿里把「看屏幕」做成了基准强项

2026 年 6 月 1 日,阿里通义千问发布 Qwen3.7-Plus,定位多模态 Agent 模型。官方基准显示 ScreenSpot Pro 79.0、AndroidWorld 81.0、OSWorld-Verified 73.3,在 GUI 操作上逼近 GPT-5.4。通过阿里云百炼提供服务,兼容 OpenAI API 规范。本文数据全部来自 qwen.ai 官方博客。

前沿动态
2026.05.28

Claude Opus 4.8:定价不变,诚实度翻 4 倍,Anthropic 把「不瞎编」做成了卖点

2026 年 5 月 28 日,Anthropic 发布 Claude Opus 4.8。定价与 4.7 完全相同($5/$25 per M tokens),但官方评测显示它「比前代少 4 倍概率放过自己写的代码缺陷」。同期上线 Dynamic Workflows、Effort Control,Fast Mode 降价 3 倍。本文数据全部来自 anthropic.com 官方公告与产品页。

前沿动态
2026.05.19

Gemini 3.5 Flash:Flash 级价格,Pro 级 Agent 能力

Google 于 I/O 2026 发布 Gemini 3.5 Flash,Terminal-Bench 76.2%、MCP Atlas 83.6% 双双超过自家旗舰 Gemini 3.1 Pro,而价格只有其 40%。1M 上下文 + 90% 缓存折扣 + Managed Agents API,重新定义性价比旗舰。

前沿动态
2026.05.19

Google I/O 2026:Gemini 3.5 Flash 用 Flash 的价格打出 Pro 的性能,Omni 让视频可对话编辑

2026 年 5 月 19 日,Google I/O 2026 发布 Gemini 3.5 Flash。官方基准:Terminal-Bench 2.1 76.2%、GDPval-AA 1656 Elo、MCP Atlas 83.6%,速度比其他前沿模型快 4 倍。同期发布 Gemini Omni(视频对话编辑)和 Gemini Spark 个人 Agent。本文数据全部来自 deepmind.google 和 blog.google 官方公告。

前沿动态
2026.05.04

阿里 HappyHorse 1.0 登顶:这款神秘的“快乐马”如何用音画合一重塑 AI 电影感?

2026 年 4 月 27 日,一款代号为 HappyHorse 1.0 的模型空降全球 AI 视频竞技场并夺得冠军。作为阿里淘天未来生活实验室的秘密武器,HappyHorse 不仅实现了 1080p 的电影级画质,更通过‘音画统一架构’完美解决了 AI 视频的声画同步难题。本文带你揭秘这款由‘可灵之父’张递带队研发的新一代视频之王。

前沿动态
2026.05.04

阿里 Wan2.7-Video 重磅发布:从“盲盒生成”到“指令级控制”,AI 视频正式进入精修时代

2026 年 4 月 8 日,阿里正式发布 Wan2.7-Video。这款模型彻底终结了 AI 视频‘生成靠运气’的抽卡时代,通过引入指令级局部编辑、五人角色长效一致性以及独特的 Thinking Mode 规划算子,它将 AI 视频从视觉奇观推向了真正可落地的工业生产工作流。

前沿动态
2026.05.04

Anuttacon LPM 1.0 发布:蔡浩宇带队的 170 亿参数模型,开启数字人“全双工”实时表演

2026 年 4 月 11 日,由米哈游联合创始人蔡浩宇创办的 AI 公司 Anuttacon 正式发布 LPM 1.0。作为 170 亿参数的 Diffusion Transformer 模型,它突破了数字人的‘表演三难困境’,实现了毫秒级的全双工音画交互。本文深度解析这款空降行业的‘全双工’数字人内核及其背后的因果流式技术。

前沿动态
2026.05.04

美团 LongCat 2.0:从视频黑马到万亿参数 MoE 智能体内核的跨代进化

2026 年 4 月 24 日,美团正式发布了 LongCat-2.0-Preview。这款突破性的万亿参数 MoE 模型彻底改变了 LongCat 系列‘专注视频’的固有印象。它凭借 100 万长度的超长上下文窗口、极致的工具调用能力,以及在数万张国产算力卡上的成功训练,标志着国产大模型正式进入‘万亿 Agent 时代’。

前沿动态
2026.05.04

OpenAI Sora 的终章:视频生成时代的先驱为何在巅峰期宣告退场?

2026 年 4 月 26 日,OpenAI 关停了 Sora 的所有 C 端入口。作为视频生成领域的技术图腾,它的退场引发了全球关于算力成本、AGI 战略以及版权合规的剧烈讨论。本文将深度解析 Sora 的技术遗产,并为后 Sora 时代的开发者提供一套完备的替代方案与避坑指南。

行业动态
2026.04.30

GPT-5.5 深度解析:推理能力的第二次进化,通往 AGI 的关键拼图

GPT-5.5 标志着大模型从“概率对话”向“自主代理”的质变。通过原生全模态架构与系统 2 推理机制,OpenAI 重新定义了 AGI 时代的人机协作范式。

前沿动态
2026.04.28

光鸭云盘:500TB 不限速,迅雷第三次杀回网盘战场

迅雷旗下光鸭云盘正式开放注册,注册送 2TB 永久免费空间,VIP 直接 500TB 不限速。磁力链离线下载、免登录直链分享、4K 原画播放、三方挂载 — 每一个都打在百度网盘的痛点上。

前沿动态
2026.04.28

MiniMax Music 2.6:AI 音乐第一次拥有了翻唱能力

MiniMax 发布 Music 2.6,首个支持 Cover 翻唱的 AI 音乐模型。新增器乐提升与 Agent 集成,8 种新风格覆盖配乐和电子场景,官方强调 deeper bass and richer instrumentation。

前沿动态
2026.04.27

DeepSeek-V4:开源追平闭源后,把价格打到 1/21

DeepSeek-V4 双模型同发:V4-Pro 1.6T 参数旗舰 + V4-Flash 284B 高性价比。Hybrid Attention 把 1M 上下文的 KV 缓存压到 V3.2 的 10%,代码基准全面超越 GPT-5.4,输出价格仅为 Opus 4.7 的 1/21。开源不再等于将就。

前沿动态
2026.04.27

MiniMax M2.7:让模型第一次参与了自身的进化

MiniMax 发布 M2.7,首个深度参与自身进化的语言模型。SWE-Pro 56.22% 匹配 GPT-5.3-Codex,GDPval-AA 1495 ELO 超越 GPT-5.3,MLE Bench Lite 66.6% 奖牌率仅次于 Opus 4.6 和 GPT-5.4,229B 参数开源可用。

前沿动态
2026.04.27

腾讯 Hy3 Preview:295B 做减法,到底是选择还是无奈

腾讯混元 Hy3 Preview:295B/21B 激活的 MoE 模型,姚顺雨重建后首作。Agent 能力代际跳升,SWE-bench 从 53% 到 74.4%。不追万亿参数,用产品 Co-Design 走中间路线。但做减法的底气,最终要靠下一个版本来证明。

前沿动态
2026.04.24

Suno V5.5:AI 音乐从「一键生成」迈入「精细制作」时代

Suno 3 月发布 V5.5,Voices 声音克隆让 AI 音乐从生成即完成走向生成即开始,Suno Studio 精细编辑补上可控性最后拼图,ARR 超 5000 万美元背后是真金白银的生意。

前沿动态
2026.04.23

PasarGuard v3.0.2:从伊朗走出的抗审查代理管理面板

GitHub 1.2K Star,来自伊朗的开源代理管理面板,六协议统一管理、多节点架构、周期流量限额,从审查前线诞生的工具天然对抗检测有更深理解。

前沿动态
2026.04.22

GPT Images 2.0:AI 画的图终于能用了

OpenAI 发布 ChatGPT Images 2.0,文字渲染基本零错误、最高 2K 分辨率、多尺寸多格漫画一次生成。AI 图像从'看着酷'变成'真能出活'的分水岭,但速度换质量、中文排版短板和伦理空白仍待解。

前沿动态
2026.04.21

Gemini 开始读你的邮件了

4 月 16 日 Google 推出 Personal Intelligence,Gmail、Photos、YouTube 全部接入 Gemini。不是获取新数据,是激活 20 年沉睡数据。最懂你的 AI,连你不喜欢高尔夫都不知道。

前沿动态
2026.04.21

HeartMuLa:AI 音乐的「Stable Diffusion 时刻」

HeartMuLa GitHub 4K Star,首个对标 Suno 的开源 AI 音乐模型,PPO 强化学习实现歌词可控,HeartCodec 12.5Hz 支持 6 分钟长曲,Apache 2.0 可商用,24GB 显存即可本地部署。

行业动态
2026.04.20

GPT-5.4:让 AI 学会说「我不确定」

OpenAI 4 月 17 日发布 GPT-5.4,幻觉率从 4.8% 降至 1.2%,1M 上下文,三级智能路由新增研究模式,原生 Agent 循环任务完成率 87%。AI 第一次大规模学会了拒绝编造。

前沿动态
2026.04.18

Seedance 2.0:AI 视频生成第一次有了导演思维

字节跳动发布 Seedance 2.0,三项行业首创——原生多镜头叙事、音画同步联合生成、8+ 语言口型同步,四模态输入自由组合,AI 视频从无声短片走向完整视听作品。

前沿动态
2026.04.17

Qwen3.6-Plus:开源模型第一次学会「想清楚再回答」

阿里通义千问发布 Qwen3.6-Plus,MoE 架构 305B 总参仅 38B 激活,首创深度推理模式让 MATH-500 提升 12.6 分,200K 上下文 Needle-in-a-Haystack 99.1%,Apache 2.0 无商业限制。

前沿动态
2026.04.16

Hermes Agent:让 AI 先想清楚再动手

Hermes AI 在 AgentCon 2026 发布开源智能体框架,以「推理先行」为核心理念,工具调用准确率 94.2%,平均调用次数仅 3.2 次,从根本上行改变了 Agent 从试错式调用到规划式执行的范式。

前沿动态
2026.04.15

Gemma 4:开源模型不再只是闭源的廉价替代品

Google DeepMind 发布 Gemma 4 开源系列,三档规格覆盖边缘到服务器,原生多模态 + 128K 上下文 + INT4 量化仅损 1.2%,开源模型第一次在全面性上不再需要你忍受短板。

前沿动态
2026.04.14

Muse Spark:扎克伯格的 143 亿美元豪赌

Meta 4 月 8 日发布 Muse Spark,来自秘密成立的超级智能实验室,143 亿美元买 Scale AI 49% 股权,多智能体并行推理首次做成消费级产品,强制 Facebook 登录,从开源先锋走向闭源产品。

前沿动态
2026.04.14

Nano Banana 2:Gemini 3.1 Flash 驱动的极速 AI 图像生成

Nano Banana 2 基于 Gemini 3.1 Flash Image 模型,在保持接近 Pro 级画质的同时将生成速度提升至秒级,单张成本降至一半。多图输入 + 对话式编辑,让 Flash 级模型首次覆盖 90% 的日常创作需求。

前沿动态
2026.04.02

Google Vids:用文字导演一个不存在的演员

Google Vids 四月更新:用自然语言提示词导演 AI 虚拟人物,Veo 3.1 接入 8 秒视频生成,一键导出 YouTube。从企业培训工具到消费级 AI 视频平台,Google 打的不是技术,是入口。