5 月 22 日 AI 圈重磅不断:字节跳动开源多模态小模型、智谱刷新 API 速度、剪映与 Gemini 打通、OpenAI 上线 PPT 插件,海内外大厂集中发力。
1. 字节跳动开源 Lance 3B:统一多模态,理解 + 生成一个模型搞定
字节正式开源Lance 3B统一多模态大模型,Apache 2.0 协议,平民算力可跑。
共享上下文 + 能力解耦设计,图像 / 视频理解、生成、跨模态编辑统一
3B 参数覆盖全功能,打破理解与生成模型壁垒
支持文生视频,含角色动作、双人互动、梦幻场景等创作
2. 智谱 GLM-5.1 高速版:400 tokens/s 刷新全球 API 速度
智谱发布GLM-5.1 高速版 API,速度再破纪录。
输出速度400 tokens/s,登顶全球大模型 API 最快
旗舰能力 + 超低延迟同时实现
推理引擎、调度、基础设施全链路工程优化
3. CapCut × Gemini 深度集成:剪辑能力直接嵌入 AI 助手
剪映(CapCut)与 Google Gemini 深度打通。
Gemini 内直接调用 CapCut 高级剪辑功能
无需跨 App 切换,创作流程更顺滑
未来走向对话式、一键式智能创作
4. OpenAI 推出 ChatGPT for PowerPoint:一句话生成 + 自动改 PPT
OpenAI 发布ChatGPT for PowerPoint插件,测试版开放。
一句话新建、修改、润色、生成 PPT
可分析数据、生成图表、补充演讲备注
关键修改需确认,操作安全可控
免费面向全球用户
5. WordPress 7.0 发布:原生集成三大 AI 模型
WordPress 7.0 正式版上线,AI 深度内置。
原生支持ChatGPT、Claude、Gemini
内容生成、翻译、作图、写作一站式完成
界面现代化,移动端体验大幅升级
6. Spotify × 环球音乐:正版 AI 翻唱 / 混音上线
Spotify 与环球音乐推出合规 AI 翻唱与混音。
正版授权,支持粉丝合法二次创作
遵循知情同意、署名、合理分成三原则
消息发布后股价大涨13%
7. UniClaw 2026 公测:AI 进入 “多人社交协作” 时代
本源万象推出UniClaw,打破单聊模式。
AI 从个人工具升级为群协作智能体
承担信息中枢、协调人、沟通润滑剂角色
开放 Agent 社区,一键即用
8. 美团开源 LongCat-Video-Avatar 1.5:数字人视频全面升级
美团龙猫团队开源LongCat-Video-Avatar 1.5,商用级数字人模型。
音频编码器升级为Whisper-large,唇形更准
用GRPO优化手部动作,解决畸变
DMD技术提速 15 倍,10 秒视频约 1 分钟生成
效果全面超越主流闭源模型