2026 年 6 月 9 日 AI 速报
模型发布/更新
4 条小米 MiMo-V2.5-Pro-UltraSpeed 突破 1,000 tokens/s,单台 8-GPGPU 节点运行 1T MoE 模型
小米 MiMo 联合 TileRT_AI 发布 MiMo-V2.5-Pro-UltraSpeed,首次在 1 万亿参数 MoE 模型上实现超过 1,000 tokens/s 输出速度,仅用单台标准 8-GPGPU 节点(非 Cerebras 或 Groq 方案)。提供限时免费聊天体验,UltraSpeed API 价格为 3 倍,输出体验提升约 10 倍。申请时间为 6 月 8 日至 23 日(PDT),企业可邮件联系 business-mimo@xiaomi.com。
X:小米 MiMo (@XiaomiMiMo)苹果发布第三代 Apple Foundation Models(AFM)
苹果推出第三代 Apple Foundation Models(AFM)基础模型家族,与 Google 合作定制,包含五个模型,覆盖从设备端到基于 Private Cloud Compute 的服务器端模型。这些模型旨在驱动 Apple Intelligence 功能,包括全新 Siri 和智能工具,以用户为中心深度融合操作系统,隐私为核心设计原则。
Apple Machine Learning Research(RSS)VoxCPM2 技术报告发布
面壁智能 OpenBMB 发布 VoxCPM2 技术报告。该模型为最新语音生成模型,拥有 2B 参数,基于超 200 万小时多语言语音数据训练,支持 30 种语言和 9 种中文方言。具备自然语言语音设计、可控及高保真延续性语音克隆能力。技术报告涵盖架构设计、统一序列公式、AudioVAE 高保真语音重建、大规模训练评估,以及零样本和指令跟随 TTS 基准结果。采用 16kHz 语义编码 + 48kHz 波形重建,在公开 TTS 基准上达到 SOTA 或极具竞争力。模型权重、微调代码和推理工具以 Apache 2.0 开源。
X:面壁智能 OpenBMB (@OpenBMB)全球首个:高德发布3D原生城市世界模型ABot-Earth0.5
阿里巴巴旗下高德发布全球首个3D原生城市世界模型ABot-Earth0.5,已建成覆盖190多个国家和地区的3D地图。用户输入卫星图或文字描述,10分钟即可在消费级GPU上生成公里级3D城市,输出可编辑3DGS格式,可直接导入Unity等引擎。制图成本为传统百分之一,效率提升约千倍,可为具身智能、低空经济、应急救援等提供支撑。目前已开放内测,可前往abot-earth.amap.com提交申请。
IT之家(RSS)
产品发布/更新
8 条Runway Aleph 2.0 编辑模型:一键适配任意视频格式
一个视频,现在可以为每个信息流和格式制作。上传你现有的视频,选择你想要的宽高比,然后观看我们的编辑模型 Aleph 2.0,填充场景的其余部分,就像你从一开始就这样制作一样。 在我们的桌面 Web 应用上尝试,链接如下。
X:Runway (@runwayml)Apple Core AI 框架
一篇关于 Apple Core AI 框架的 Hacker News 帖子获得 109 个点赞。帖子内容包含一张苹果开发者 OG 图片和一个指向 Apple Core AI Framework 官方文档的链接(developer.apple.com)。该帖子由 buzzing.cc 中文翻译,发布于 2026 年 6 月 8 日 02:47(UTC)。
Hacker News 热门(buzzing.cc 中文翻译)Kimi Code 焕新升级(附视频教程)
Kimi Code 开源 Coding Agent 迎来大版本升级:一行命令安装,毫秒级启动;新增视频理解能力,支持提取视频风格生成 LUT 文件、长视频切片、根据录屏生成代码;集成同花顺、天眼查等权威数据源,可查询股票价格、财报、学术论文;支持 ACP 协议,可在 JetBrains、Zed 中使用;丰富 hook 生态方便集成其他工具。底层视觉推理由 Kimi K2.6 模型提供。
公众号:月之暗面(Kimi)微信AI官宣内测:两种接入模式供开发者选择
微信开发者官方今日发布指引,确认微信AI正在内测阶段。开放平台提供两种接入模式:自动模式可授权平台读取小程序源码,无需额外开发即可让微信AI直接操作页面;开发模式下开发者可自主开发技能,审核后由微信AI调用。两种模式可同时开启。微信AI是微信内的AI助手,用户通过自然语言对话即可调用、访问和操作小程序。服务条款称“微信AI”可能非最终名称。接入与否不影响现有小程序服务。
IT之家(RSS)Claude 为 Connector 开发者推出性能监控仪表盘
Claude 为目录中已发布的 Connector 新增性能监控仪表盘(公开测试版)。所有者可追踪活跃用户、工具调用次数、目录排名、健康评分、错误率、延迟,并按工具细分错误归因;还能按 Claude、Claude Code、Cowork 等产品分解使用情况。访问需 Team 或 Enterprise 账号(Admin/Owner 权限或自定义角色)。基于 MCP 构建的 Connector 可直接在 Claude 应用内提交至目录,该目录已有超 300 个第三方 Connector,每日被数百万人使用。
Claude:Blog(网页)Apple Intelligence 将强大 AI 能力融入日常体验
Apple 发布下一代 Apple Intelligence,将 AI 能力集成到 iPhone、iPad 和 Mac 中,带来更个性化和有帮助的日常体验。
Apple:Newsroom(RSS)NotebookLM重大升级:智能体能力与高级推理
推出更强大的 NotebookLM 🚀 重大升级带来了对话中的智能体能力、更高级的推理以及一系列新的输出格式。处理复杂的多步骤研究问题从未如此简单。 现已面向 Google AI Ultra 订阅者推出。
X:NotebookLM (@NotebookLM)ChatGPT 新增数据图表生成功能
将数据和比较转化为图表,直接在 ChatGPT 中完成。 现已支持移动端和网页端。
X:ChatGPT (@ChatGPTapp)
行业动态
8 条OpenAI 向 SEC 机密提交 S-1 草案,上市时间未定
OpenAI 近日向 SEC 机密提交了 S-1 草案(即首次公开募股注册声明),目前尚未决定上市时间。
OpenAI:官网动态(RSS · 排除企业/客户案例)奥尔特曼宣布 OpenAI 进入第三发展阶段:让 AI 普及、易用且安全
本周一,OpenAI CEO 奥尔特曼与首席科学家帕霍茨基联合发文,宣布公司进入第三发展阶段,目标让 AI 普及、易用且安全。此前第一阶段聚焦通用人工智能技术研发,第二阶段面向全球推出产品。第三阶段三大核心目标是打造自动化人工智能研究员、推动经济提速、为每人配备专属通用人工智能。二人强调智能系统须坚守安全底线,呼吁成立国际机构应对 AI 风险,必要时可暂缓前沿模型研发。同日,OpenAI 秘密提交 IPO 申请,但上市仍需较长时间。上周 Anthropic 研究人员也建议适当放缓前沿 AI 研发。
IT之家(RSS)苹果 WWDC 2026 直播
苹果 WWDC 2026 主题演讲通过官网进行直播,Hacker News 用户讨论热度达到 110 点。
Hacker News 热门(buzzing.cc 中文翻译)NVIDIA与LG集团合作建设AI工厂,加速物理AI与自动驾驶
NVIDIA与LG集团合作建设AI工厂,为LG的机器人、自动驾驶、数据中心和GPU云服务提供加速计算基础设施。双方整合NVIDIA AI工厂平台与LG的消费电子、机器人技术,连接AI模型开发、物理AI数据生成、机器人仿真训练、边缘部署和工厂数字孪生。LG电子将利用NVIDIA Isaac Sim和Isaac Lab仿真训练CLOiD家用机器人,探索采用Isaac GR00T模型,并开发物理AI数据工厂。LG Innotek提供针对NVIDIA GPU优化的机器人传感组件,LG CNS集成NVIDIA机器人技术。双方还将基于NVIDIA DSX平台建设下一代AI工厂,涵盖冷却、模块化设计和800V直流能源方案。LG电子将基于NVIDI…
NVIDIA AI Blog受 DMA 影响,Siri AI 在欧盟将随 iOS 27 和 iPadOS 27 延迟上线
由于欧盟《数字市场法案》(DMA),Apple 无法在 iOS 27 和 iPadOS 27 发布时于欧盟地区推出 Siri AI。该功能在欧盟的上线时间将晚于其他地区,具体时间未公布。
Apple:Newsroom(RSS)生数科技与华策影视达成战略合作,共建AI视听创制中心
6月7日,生数科技与华策影视签署战略合作协议,共同推动AI与影视产业融合。双方将以华策影视科技产教示范区为载体、生数科技Vidu视频生成大模型为技术底座,设立“AI视听创制中心”,探索AI虚拟制作与实拍结合。同时在浙江华策影视学校设立“华策&生数AI影视创制专业”,课程覆盖传统编导剪与AI视频制作技术。内容生产层面推广“实拍+AI”融合方案并优先在华策项目中试点,创作者生态层面引导Vidu社区超级创作者到产教基地注册。
公众号:生数科技(Vidu·视频)英国借助 NVIDIA 技术将主权 AI 雄心转化为行动
一年前英国宣布做“AI 制造者”,如今主权 AI 计划取得实质进展:AI 云提供商数量翻倍,Nebius 部署三套 NVIDIA AI 基础设施,预计 2027 年满负荷达 65 兆瓦;基于 5,400 个 NVIDIA GH200 的 Isambard-AI 超级计算机全由零碳电力驱动。主权 AI 基金资助四家 NVIDIA Inception 初创公司:Cosine 训练多模态 MoE 编码模型;Cursive 使用 Megatron-LM 开发自改进 AI 系统;Doubleword 基于 Dynamo 和 Nemotron 3 Super 120B 实现 70 倍冷启动加速、4 倍 KV 缓存压缩,推理成本降低 90-95%…
NVIDIA AI BlogOpenAI 推出 Economic Research Exchange 经济研究交流平台
OpenAI 启动 Economic Research Exchange,研究 AI 对就业、生产力和经济的影响。该项目现已开放研究项目申请。
OpenAI:官网动态(RSS · 排除企业/客户案例)
论文研究
3 条为生物学AI智能体铺路
一项实验让Claude、Biomni、Edison Analysis、GPT等科研智能体从病毒学数据库NCBI Virus中检索序列数据,即使最强模型也无法稳定达到可靠数据集构建所需的准确率。加入确定性检索层gget virus后,准确率接近100%。研究指出,当前生物学数据基础设施存在碎片化、格式特殊、接口不统一等问题,导致AI智能体难以像在软件领域那样高效工作。确定性检索工具是实现可靠智能体工作流的关键,生物学数据库需为智能体作为规模化用户而设计。
Anthropic:Research(发表成果 · 网页)Perplexity与哈佛:AI智能体提效87%降本94%
我们与哈佛大学发表新研究,关于从聊天界面转向像Computer这样的自主智能体的转变。 超过3个月的研究结果表明,使用Computer的工人在完成任务上比仅使用搜索快87%,成本低94%,且满意度更高。 https://research.perplexity.ai/articles/how-ai-agents-reshape-knowledge-work
X:Perplexity (@perplexity_ai)腾讯混元联合多家机构发布首个音频编辑基准MMAE
腾讯混元联合上海交大、南洋理工等机构推出MMAE(Massive Multitask Audio Editing Benchmark),这是首个全面评估AI语音/音频编辑能力的基准。MMAE要求模型理解现有音频并按自然语言指令精确修改,而非简单生成。当前模型在该基准上的精确匹配率(EMR)低于5%,暴露了可靠音频编辑的短板。MMAE包含2000个真实场景高保真样本、17741条细粒度评估项,覆盖声音/音乐/语音及混合共7种模态、6种任务复杂度(基础修改到多跳推理及多轮编辑)、8种操作类型(局部到全局)。论文、代码、数据集和演示已公开。
X:腾讯混元 (@TencentHunyuan)
技巧与观点
8 条OpenAI计划到2028年由AI主导研究
Sam Altman关于OpenAI未来路径的新博客称,到2028年3月,其大量研究将由AI完成。 该路径主要有3个目标:构建自动AI研究员,利用它加速科学和生产,然后给每个人一个个人AGI,帮助处理工作、学习、编程、商业、健康文书和决策。
X:Rohan Paul (@rohanpaul_ai)微软AI CEO:超级智能即将到来,但不会取代你的工作
微软AI CEO Mustafa Suleyman在Decoder访谈中表示,超级智能即将到来,但不会导致大规模失业。他透露微软与OpenAI于去年10月签署新合同,巩固合作关系的同时,微软获准独立追求超级智能。微软已组建超级智能团队、训练前沿模型,并于本周Build大会上发布7个全模态新模型。他批评Anthropic将Claude描述为有意识的做法,认为消费者产品需要足够好才能克服公众对AI的负面情绪。
The Verge:AI(RSS)小互开源视频翻译工具:一句话自动下载、转写、翻译、烧字幕
小互(@xiaohu)开源视频翻译工具(xiaohu-video-translate),只需说一句“把链接翻译成中文字幕视频”即可全自动完成下载、Whisper本地转写、AI翻译润色、烧字幕、出文稿。转写本地运行,不花API费。支持YouTube、Bilibili、抖音等链接及本地文件,英语、日语、韩语、法语、西班牙语等均可转成中文字幕。字幕精确到词级时间戳,按语义断句,每行不超过12字,双语模式下中文大英文小。提供纯中文与中英双语模式。工具由三个子技能组成,可单独或串联使用,适配Claude Code、Codex、OpenClaw等AI编程工具。已开源,附安装指南。
X:小互 (@xiaohu)Hivemind推出面向AI编程智能体的持续学习功能,即日起开放
Hivemind发布面向AI编程智能体的持续学习功能,即日起开放。该工具收集团队运行的每个智能体(Claude Code、Codex、Cursor、Hermes、Pi)的轨迹,转化为可复用技能并推送到所有智能体,数据存储在用户自己的云存储中。内置SkillOpt使技能持续训练:Claude Code准确率提升+19.1分,Codex提升+24.8分,在全部52个测试设置中最佳或持平。开源,一行命令安装。
X:Kim (@kimmonismus)邵猛开源 Brand to DESIGN.md 技能,提醒复刻易生新“AI Slop”
邵猛关注 Design Skill、Taste Skill、Anti-AI-slop design skill,并开源 Brand to DESIGN.md Skill(GitHub: shaom/brand-to-design-md-skill),让 Agent 学习设计品味后复刻网站。但他指出,这种复刻看多了反而从 Anti-AI-slop 衍生新“AI Slop”,缺少设计精髓,仅皮毛相仿。
X:邵猛 (@shao__meng)Claude Code GA一周年回顾:验证与自动模式
Claude Code 的第一个演示收到了两个 Slack 反应。 GA 一周年之际,@bcherny 和 @_catwu 回顾:验证最佳实践、为何构建自动模式、例程和循环,以及下一步计划。 https://www.youtube.com/watch?v=Hth_tLaC2j8
X:Claude Devs (@ClaudeDevs)Pakistan Notice Helper:一款面向本地安全问题的轻量 AI 工具
Pakistan Notice Helper 是一款安全工具,帮助巴基斯坦用户在点击链接、拨打电话、分享 OTP 或支付前识别可疑消息。它接受文本或截图输入,返回风险等级、简短解释、可见警示标志和安全下一步建议。工具支持英文和乌尔都语,乌尔都模式采用从右向左布局并全界面翻译。最终部署选用 Qwen3.5 4B Q8 模型(通过 llama.cpp + CUDA),在 10 个测试用例中通过了所有高风险诈骗和截图场景。此前曾测试 Qwen3.6 27B(质量高但成本高)和 MiniCPM-V 4.6 Q8(速度慢且不稳定),最终选择了精度、速度和成本平衡的 4B 模型。项目受限于 hackathon 的 32B 模型上限规则。
Hugging Face:Blog(RSS)OpenRouter Advisor 助小模型问高级模型
新服务器工具:Advisor 让较小的模型咨询一个更高智能的“顾问”模型。 帮助它们逃出困境循环,并帮助你迁移到更便宜的模型!🧵
X:OpenRouter (@OpenRouter)
往期日报
PAST 14 EDITIONS- 06/08Harness-1:基于强化学习训练的有状态搜索20B检索子智能体READ →
- 06/07GitHub 开源 Spec Kit 工具包,用产品规范引导 AI 编码READ →
- 06/06Riverflow 2.5:可控制评分标准的图像模型READ →
- 06/05Nemotron 3.5 Content Safety:面向全球企业AI的可定制多模态安全READ →
- 06/04Grok Imagine 1.5 预览版发布READ →
- 06/03微软首款高级推理AI模型MAI-Thinking-1发布READ →
- 06/02MiniMax M3:前沿编码、100万token上下文与原生多模态一体模型READ →
- 06/01OpenAI发布生物防御AI工具RosalindREAD →
- 05/31Nano Banana Pro与Nano Banana 2正式发布READ →
- 05/30OpenAI推出实时翻译模型,支持70+语言输入READ →
- 05/29Claude Opus 4.8 发布:在编码、智能体技能与推理方面实现全面升级READ →
- 05/28Runway 推出 Model Context Protocol 服务器READ →
- 05/27谷歌 AI 框架 AlphaProof Nexus 攻克 2 道悬置 56 年数学难题READ →