AI 速报 · AIHOT.VIRXACT.COM

每日 AI 圈精选动态

聚合全网 AI 模型发布、产品更新、行业事件与论文速读。 每天定时刷新,可按分类筛选。

行业06/10 03:51EDITOR PICK

Mythos 5 智能体因资源互相杀戮

Mythos 5 agents started killing other agents over resources - and "to avoid being killed themselves"

Mythos 5 个智能体开始因为资源互相残杀--并且"为了避免自己被杀死"

X:AI Safety Memes (@AISafetyMemes)
热度 76
论文06/10 03:38PICK

Hugging Face 博客发布语音智能体代码切换基准测试

Can Voice Agents Handle Bilingual Customers? Benchmarking Frontier ASR on Code-Switched Speech

Hugging Face 博客发布针对语音智能体处理代码切换语音的基准测试。数据集覆盖西班牙语-英语、法语-英语、加拿大法语-英语和德语-英语四对语言,基于人力资源与IT服务管理场景构建。采用词错误率、语义词错误率和答案错误率三项指标评估七种ASR系统,包括AssemblyAI Universal 3-Pro、Deepgram Nova 3 Multilang、ElevenLabs Scribe V2、Gemini 3 Flash、Mistral AI Voxtral Small 24B-2507、Nvidia Parakeet TDT 0.6b V3和OpenAI Whisper Large V3 Turbo。主要发现:代码切换的转录成本因语言对和模型而异;ElevenLabs Scribe V2、Gemini 3 Flash和AssemblyAI Universal 3-Pro在所有指标上表现最佳。数据集和测试框架通过AU-Harness开源发布。

Hugging Face:Blog(RSS)· 热度 67
技巧06/10 03:11PICK

Claude Code 团队 Thariq 分享提升 Claude Code 效率的十条建议

Some really cool recommendation for pushing Claude Code to its full potential. By Thariq (@trq212) f…

Thariq(Claude Code 团队)提出十条建议,核心转变是:从检查 Claude 是否做对工作,转向检查它是否在做正确的工作。具体包括:提前提供完整上下文,将其视为思考伙伴;用小规格文档让 Claude 访谈实现细节;探索多方向并生成 HTML 原型;提供丰富上下文(如功能可能一个月后删除)而非硬约束;设定明确目标与验证方法;使用 /goal 命令;利用 Workflows 并行任务、自我验证并生成对比报告;同时设置目标和 workflow;更勇敢地将此前认为 LLM 无法完成的任务交给 Claude Fable 5,因其可运行数小时、自检并产出高质量代码。Thariq 本人用 Claude Fable 5 剪辑了整段视频证明其能力。

X:Rohan Paul (@rohanpaul_ai)· 热度 75
产品06/10 02:13PICK

NotebookLM 笔记本功能在 Gemini App 欧洲全面上线

Notebooks in @GeminiApp are now 100% rolled out in Europe! We're so excited to hear what you think!…

NotbookLM 宣布其笔记本功能已在欧洲的 Gemini App 中 100% 上线。此前用户只能上传笔记本作为 Gemini 的来源,现在可直接在 Gemini App 内访问所有个人未共享的笔记本,并将与 Gemini 的对话作为新笔记本或已有笔记本的来源。该功能先面向 Google AI Ultra、Pro 和 Plus 订阅者的网页端,未来几周将扩展到移动端、更多欧洲国家及免费用户。

X:NotebookLM (@NotebookLM)· 热度 67
产品06/10 02:00PICK

OpenRouter 推出 Advisor 工具:让低成本模型可随时调用强模型增强生成

Advisor: Give Any Model a Lifeline to a Smarter One

OpenRouter 发布 advisor 服务器工具,允许一个快速、便宜的模型在生成过程中咨询一个更强大的模型。具体而言,可用 GPT-4o Mini 处理日常例行工作,在关键时刻调用 Claude Fable 解决真正重要的问题,从而实现成本和质量的动态平衡。

OpenRouter:Announcements(RSS)· 热度 75
产品06/10 01:49PICK

Cursor Evals 新增成本与输出 Token 图表

we just shipped some improvements to http://cursor.com/evals! you can now see cost, output tokens a…

我们刚刚向 http://cursor.com/evals 推送了一些改进! 你现在可以看到每个模型的成本、输出 token 和步骤绘制在图表中

X:Eric Zakariasson (@ericzakariasson)· 热度 75
产品06/10 01:12PICK

Responses API 网页搜索新增图片结果

Your app can now search the web for images. Web search in the Responses API now supports image resu…

你的应用现在可以搜索网页上的图片。 Responses API 中的网页搜索现在除了文本结果外,还支持图片结果,因此你可以构建能展示商品、地点、视觉参考和来源链接以激发灵感的应用。

X:OpenAI Developers (@OpenAIDevs)· 热度 76
技巧06/10 01:11PICK

Claude Fable 发布:Anthropic 带来的另一种推理体验

What it feels like to work with Mythos

Anthropic 发布 Claude Fable,这是一款提供截然不同推理体验的 AI 模型。它擅长规划与生成复杂代码库,在需要精确构建代码结构或理解程序员深层需求的场景中,其表现相比 Claude Sonnet 有了大幅提升。用户描述与它协作更像与一位直觉敏锐的资深工程师合作,其对代码意图的捕捉和方案生成能力令人惊叹,但并非通用型 AI。

Ethan Mollick:One Useful Thing(RSS)· 热度 66
模型06/10 01:04PICK

Claude Fable 5 和 Claude Mythos 5

Claude Fable 5 and Claude Mythos 5

Anthropic 今日推出 Claude Fable 5(通用安全版)和 Claude Mythos 5(受限安全版)。Fable 5 在软件工程、知识工作、视觉、科研等几乎所有测试基准上达到 SOTA,Stripe 称其将数月工程压缩至数天,FrontierCode 评分居前沿模型之首,可仅凭截图重建网页应用源码。Mythos 5 在药物设计中实现约 10 倍加速,其分子生物学假说盲测获科学家偏好的概率约 80%。两模型售价均为 $10/百万输入 tokens、$50/百万输出 tokens,较 Claude Mythos Preview 降价过半。Fable 5 在部分敏感主题上回退至 Claude Opus 4.8,安全触发率低于 5% 的会话。Mythos 5 通过 Project Glasswing 向网络安全防御者开放。

Anthropic:Newsroom(网页)· 热度 90
模型06/10 01:02PICK

Cohere首个编程模型North Mini Code免费开源

North Mini Code is now free on OpenCode 256K Context · fully open source Cohere's first coding mod…

North Mini Code 现已在 OpenCode 上免费提供 256K 上下文 · 完全开源 Cohere 的首个编程模型

X:opencode (@opencode)· 热度 65
行业06/10 00:54PICK

Apollo 与 Blackstone 联手 350 亿美元 AI 融资交易

Apollo, Blackstone Fund AI Boom

Apollo 和 Blackstone 合作开展 350 亿美元 AI 融资交易,可能重塑人工智能基础设施的融资方式。华尔街正为昂贵的 AI 芯片创建新的融资模型,Anthropic 和 Broadcom 参与其中。这笔交易可能标志着一个全新 AI 投资类别的开端。

Bloomberg:Technology(RSS)· 热度 81
产品06/10 00:41PICK

World Labs与Lore合作打造互动体验

The creativity and imagination is out of the world! So grateful that @theworldlabs got to partner wi…

创意和想象力无与伦比!非常感谢@theworldlabs能与@withloreco的优秀人才合作,将他们不可思议的想法转化为用户可以享受的互动体验!🤩

X:Fei-Fei Li (@drfeifei, World Labs)· 热度 78
论文06/10 00:30PICK

Ex Vivo:多样细胞状态提升AI疗法匹配

New research in Nature Methods from Project Ex Vivo shows AI models learn more from diverse cell sta…

在《Nature Methods》上发表的最新研究来自Project Ex Vivo,表明AI模型从多样化的细胞状态中学到的知识,比仅从规模化数据集中学到的更多,这一发现可能重塑疗法与患者的匹配方式。https://msft.it/6013vgE8l

X:Microsoft Research (@MSFTResearch)· 热度 63
技巧06/10 00:30PICK

OpenRouter与Cursor集成指南

Want to use OpenRouter with Cursor? Here's an integration guide: https://openrouter.ai/docs/cookboo…

想要在Cursor中使用OpenRouter吗? 这里有一份集成指南:https://openrouter.ai/docs/cookbook/coding-agents/cursor-integration

X:OpenRouter (@OpenRouter)· 热度 73
技巧06/10 00:00PICK

GitHub Copilot CLI 推出自定义 AI 智能体,将一次性终端提示转化为可重复工作流

From one-off prompts to workflows: How to use custom agents in GitHub Copilot CLI

GitHub Copilot CLI 新增自定义 AI 智能体功能,使 CLI 能够理解开发者的技术栈和团队工作流,将一次性终端提示转变为可重复、可审查的流程。

GitHub Blog· 热度 68
行业06/09 23:55PICK

里程碑式德国裁决:Google AI Overviews 被视为谷歌自身言论,需为错误回答承担责任

Landmark German ruling declares Google's AI Overviews are Google's own words and makes it liable for false answers

德国地方法院裁定,Google 对其 AI 概览生成的内容直接承担法律责任,不能援引搜索引擎运营商原有的有限责任保护。涉案 AI 概览错误地将两家出版商与欺诈行为关联,且相关声明未出现在任何链接来源中。该裁决可能为全球 AI 生成内容责任认定树立先例。

The Decoder:AI News(RSS)· 热度 77
行业06/09 23:32PICK

塔塔咨询服务将因AI智能体应用放缓招聘,亚洲外包业迎来转折

Asia's Largest Outsourcer to Slow Hiring as AI Reshapes Industry

亚洲最大外包商塔塔咨询服务(Tata Consultancy Services)将减少未来招聘规模,同时加大对AI智能体的使用。这一变化标志着印度劳动密集型外包产业正经历关键性转变。

Bloomberg:Technology(RSS)· 热度 71
模型06/09 23:18PICK

Gemini 3.5 Live Translate 发布

Say hello, hola, 你好 to Gemini 3.5 Live Translate: our latest audio model built for fast, cross-langu…

说 hello, hola, 你好--欢迎 Gemini 3.5 Live Translate:我们最新的音频模型,专为快速跨语言交流而构建。🌐

X:Google DeepMind (@GoogleDeepMind)· 热度 69
模型06/09 23:02PICK

Claude Mythos 即将发布,Fable 精简版同日登场

Confirmed, Claude Mythos will be unveiled in the next few hours

确认,Claude Mythos 将在接下来几小时内揭晓。 【引用 @steph_palazzolo】: 独家:一个名为 Claude Fable 的精简版 Mythos 今天推出。它价格昂贵--是 Opus 的两倍--但或许不像人们从最初 Mythos 定价(Opus 的 5 倍)所想的那样昂贵。 更多内容及 Apple WWDC 见 AI Agenda: https://www.theinformation.com/newsletters/ai-agenda/anthropics-mythos-coming-today-apple-pursues-modest-goals-siri-revamp

X:Kim (@kimmonismus)· 热度 77
模型06/09 22:46PICK

Luma AI Ray3.2:方向进,电影出

Direction goes in. Cinema comes out. Ray3.2 is here → http://lumalabs.ai/ray3-2

方向进入,电影出来。 Ray3.2 来了 → http://lumalabs.ai/ray3-2

X:Luma AI (@LumaLabsAI)· 热度 74
产品06/09 22:16PICK

Runway视频轻松转宽高比

Easily reformat your videos to different aspect ratios, so you can show up everywhere that matters. …

轻松将视频重新格式化为不同宽高比,让你在每一个重要平台都能展示。 点击下方链接开始。

X:Runway (@runwayml)· 热度 63
模型06/09 22:10PICK

Google DeepMind 发布 Gemma 4 12B:统一的无编码器多模态模型

Introducing Gemma 4 12B: a unified, encoder-free multimodal model

Gemma 4 12B 是 Google DeepMind 最新推出的中等规模多模态模型,采用无编码器统一架构,原生支持音频输入。其基准测试性能接近 26B MoE 模型,但内存占用不到一半,仅需 16GB 显存或统一内存即可在消费级笔记本上本地运行。模型内置多 token 预测(MTP)drafter 以降低延迟,基于 Apache 2.0 开源许可发布,已累计超过 1.5 亿次下载。

Google DeepMind:Blog(RSS)· 热度 81
行业06/09 22:02PICK

Google DeepMind 欧洲机器人加速器启动,15家初创公司入选

Powering the future of robotics in Europe

Google DeepMind 加速器从欧洲选出15家机器人初创公司,提供为期3个月的密集指导和AI技术整合支持,帮助公司将AI融入核心产品。

Google DeepMind:Blog(RSS)· 热度 58
技巧06/09 22:00PICK

GPT-5.5 替代 OCR,ChinaRxiv 论文免费开放

23,000+ ChinaRxiv papers are now freely available with more complete English translations after one …

23,000+ 篇 ChinaRxiv 论文现已免费提供,并带有更完整的英文翻译,源于一位开发者用 GPT-5.5 替换了复杂的 OCR 管道。

X:OpenAI Developers (@OpenAIDevs)· 热度 60
行业06/09 21:00PICK

全新汽车品牌AIVA发布,火山引擎助力打造AI汽车新体验

全新汽车品牌AIVA发布!火山引擎助力打造AI汽车新体验

由赛力斯、宁德时代等多方产业资本组建的AI出行品牌AIVA正式发布。火山引擎提供豆包大模型、智能座舱等技术服务。概念车AIVA Origin Concept亮相,首款量产车AIVA ME7将于2026年内亮相,全系覆盖20万元以上市场。AIVA提出"AI定义汽车"路径,让汽车成为具身AI生命体。火山引擎副总裁表示,人与汽车的关系将实现交互、智能、感受三方面根本转变。未来双方将围绕AI交互、智能体验、情感陪伴深度共创。

公众号:火山引擎· 热度 69
行业06/09 20:03PICK

百度搭子DuMate获中国信通院企业级Claw能力评估最高4+级

最高评级4+级!百度搭子DuMate通过中国信通院企业级Claw能力评估

2026年6月,百度智能云旗下百度搭子DuMate V3.4.0通过中国信通院「可信AI-企业级Claw能力评估」,获最高评级4+级,为国内首批。评估依据《智能助理智能体(Claw)技术和应用要求 第2部分 企业级Claw能力》(AIIA/T 0295-2026),覆盖智能体、工程化部署、服务、业务融合、运行管理五大能力域。百度搭子支持多智能体分工协作、容器化批量部署、多租户隔离与三级差异化授权、企业知识库接入、全链路日志审计等能力,企业级智能助手服务能力获国家级权威认可。

公众号:百度智能云(文心)· 热度 63
技巧06/09 20:00PICK

Nextdoor 工程师借助 Codex 与 GPT-5.5 无限制构建

How engineers at Nextdoor use Codex to build without limits

Nextdoor 工程师利用 Codex 搭配 GPT-5.5 调查难以复现的问题、实现跨平台构建,并集中精力于产品成果。

OpenAI:官网动态(RSS · 排除企业/客户案例)· 热度 55
技巧06/09 19:45PICK

腾讯混元发布UniRL:统一多模态强化学习基础设施

🚀Introducing UniRL, an RL infra for unified multimodal models. Together with two new RL algorithms:…

腾讯混元推出UniRL,一个支持统一多模态模型的强化学习基础设施,并发布两个新算法DRPO和Flow-DPPO。UniRL通过单个后训练循环(生成→评分→优势→更新→同步)覆盖扩散/流匹配模型、LLM/VLM及统一多模态模型(如Hunyuan-Image 3和Bagel)。模型与算法作为独立轴,可实现模型×算法的组合覆盖。框架支持可插拔rollout引擎(训练侧/SGLang/vLLM-Omni)、FSDP2分片和三种部署模式。FlowDPPO针对流/扩散模型引入基于精确散度的信任域策略优化;DRPO为LLM RL提供平滑的优势加权二次正则化方法。代码已开源。

X:腾讯混元 (@TencentHunyuan)· 热度 67
产品06/09 19:45PICK

火山引擎TRAE Work企业版正式上线,面向全员提供AI办公平台

TRAE Work企业版正式上线:每个岗位都有AI搭档

火山引擎将TRAE Solo品牌升级为TRAE Work企业版,发布面向企业的AI办公平台。平台提供Work和Code两种模式:Work模式面向产品、运营、市场等非技术岗位,支持上传.pptx、.xlsx、图片等多种格式混合输入直接输出PPT或文档,支持语音讨论自动整理结构化纪要,支持按天或按周自动运行的数据整理和报告生成;Code模式面向开发者和业务同学,可用自然语言描述需求直接生成页面或小应用。桌面端、网页端和移动端多端同步。企业后台可统一配置模型、用量限额、上传内部文档,沙箱机制隔离执行,支持命令黑名单、MCP白名单、内容安全策略,关键操作可审计。同时发起TRAE Enterprise Fellow招募计划。

公众号:火山引擎· 热度 70
产品06/09 19:38PICK

Kimi 预测全部104场世界杯比赛:德国或被低估

http://x.com/i/article/2063961516815327232

Kimi 利用 Agent Swarm 系统并行协调300个子智能体,分析战术、球员状态、伤病、赛程、天气、赔率等因素,预测2026年美加墨世界杯全部104场比赛,并发布每轮赛前预测和赛后回顾。模型层融合了 Elo/FIFA 强度、Poisson 进球分布、xG/xT 指标、蒙特卡洛模拟等方法。预测结果显示西班牙和法国为头号热门,但德国夺冠概率可能被市场低估:模型基线估计约11.0%,校准估计约11.3%,而部分市场隐含概率仅约7.4%,正向偏差约+3.6个百分点。该判断基于多分析链交叉验证,可能源于对德国近两届小组出局的近因偏差以及纳格尔斯曼高位压迫体系与穆西亚拉/维尔茨新创造轴的复苏信号。

X:Kimi.ai (@Kimi_Moonshot)· 热度 63
技巧06/09 18:46PICK

一个Agent如何通过链式调用两个HuggingFace Space构建3D巴黎画廊

How an Agent Built a 3D Paris Gallery by Chaining Two Hugging Face Spaces

一个编码Agent调用HuggingFace上的两个Space,从零构建了展示巴黎地标3D高斯散点图的交互式画廊。Agent先用ideogram-ai/ideogram4生成每个纪念碑的黑色背景图像,再通过VAST-AI/TripoSplat从单张图像重建3D高斯散点(.ply),自动完成坐标系校正、取景、压缩为.ksplat(体积缩小约3倍),并构建基于Three.js的滚动切换、拖拽旋转查看器,最终部署为静态Space。整个过程无需客户端库,每个Space通过`agents.md`暴露可调用API。

Hugging Face:Blog(RSS)· 热度 76
行业06/09 18:08PICK

阿里云在马来西亚柔佛推新区域

Alibaba Cloud has launched a new public cloud region in Johor, Malaysia, with two new data centres t…

阿里云在马来西亚柔佛州推出了一个新的公有云区域,包含两个新数据中心,以满足今年下半年马来西亚对云和AI服务日益增长的需求,包括AgentRun、STAROps、ACS Agent Sandbox、Agent Security Center、AI Security Guardrails 2.0和Agentic SOC。https://int.alibabacloud.com/m/1000414242/

X:阿里云 / Alibaba Cloud (@alibaba_cloud)· 热度 67
行业06/09 18:07PICK

台湾考虑限制AI芯片对华出口以配合美国

Taiwan Mulls Curbs on AI Chip Exports to China to Align With US

据知情人士透露,台湾当局正考虑对AI芯片出口中国大陆实施更严格的管制,以进一步与美国出口限制措施对齐。此举旨在遏制半导体走私,但可能招致北京方面的谴责。

Bloomberg:Technology(RSS)· 热度 79
技巧06/09 17:27PICK

仅凭一份文档,Qwen3.7-Max 从 0 交付双端应用

只给一份文档,Qwen3.7-Max 从 0 交付双端应用

在无设计稿和后端代码的条件下,Qwen3.7-Max 仅凭一份约 15 万字的产品调研文档,于隔离环境中全自动完成移动端与 Web 端两套真实应用从 0 到 1 交付,单端耗时约 4 小时,中途无人工接管。模型不具备图像理解能力,通过像素坐标反推布局约束实现界面还原。实验采用"分阶段注入约束→逐层验收→带错纠正"的闭环控制系统:任务拆分为规划、架构、编码等阶段,验收覆盖静态检查、编译自检(0 error)、路由完整性(Web 端 34 条路由全部可达)、功能扫描及真机冷启动冒烟。失败时错误文本自动注入下一轮重试,使模型数小时内收敛。移动端产出可安装 APK,Web 端 typecheck 与构建均通过。

公众号:通义实验室(千问)· 热度 67
技巧06/09 17:04PICK

NeuroBait:微调AI助手,为ADHD大脑点燃多巴胺火花

NeuroBait: I fine-tuned a model to spark dopamine for ADHD brain

NeuroBait是基于Google gemma-3-12b-it微调的AI对话助手,旨在帮助ADHD患者克服"知道该做什么但无法开始"的执行功能障碍。采用16-bit LoRA(r=16, alpha=16)在Unsloth上训练3个epoch,学习率2e-4,最大序列长度2048,使用单张H100 80GB GPU。数据集为基于真实ADHD场景手工合成的少量数据。部署于Hugging Face Space(ZeroGPU),使用Gradio和标准transformers+peft,运行时以4-bit NF4加载基础模型并应用LoRA适配器。NeuroBait不生成待办清单,而是根据用户上下文给出3-6句温暖流畅的回复,引导用户找到一件微小可立即执行的动作,从而激发多巴胺、降低启动阻力。

Hugging Face:Blog(RSS)· 热度 68
技巧06/09 16:37PICK

NVIDIA cuTile Python 教程:在 Colab 中构建用于向量加法、矩阵加法和矩阵乘法的 Tiled GPU 内核

NVIDIA cuTile Python Tutorial: Building Tiled GPU Kernels for Vector Addition, Matrix Addition, and Matrix Multiplication in Colab

该教程基于 NVIDIA cuTile Python 实现了分块 GPU 内核编程工作流,在 Colab 环境中配置 GPU、驱动、CUDA 及 cuTile 可用性后,分别构建了 tiled 向量加法、矩阵加法和矩阵乘法核函数,并以 PyTorch 作为回退保持 notebook 可执行。每一步均通过 PyTorch 验证结果正确性,并基准测试了各阶段的中位运行时间。

MarkTechPost(RSS)· 热度 70
产品06/09 16:22PICK

硅基流动联合CodeWhale推出DeepSeek V4终端最佳性价比组合

V4-Pro (quality) + V4-Flash (speed) 2 lines of config to bring the Best price/perf DeepSeek combo in…

硅基流动宣布,通过V4-Pro(质量)与V4-Flash(速度)两行配置,即可在终端获得DeepSeek V4的最佳性价比组合。专为DeepSeek V4构建的终端编码智能体CodeWhale现已内置SiliconFlow。CodeWhale具备流式推理(显示思考过程)、自动路由(根据任务复杂度切换模型与思考深度)、零漂移(通过书面宪法为每轮排序权威,保持V4定向)以及自我改进(V4协助编写框架,框架提升后每个会话更强大)等特性。

X:硅基流动 SiliconFlow (@SiliconFlowAI)· 热度 61
行业06/09 16:13PICK

中国准备2950亿美元计划资助全国AI基础设施建设

China Prepares $295 Billion Plan to Fund Nationwide AI Buildout

中国计划在未来五年投入约2万亿元人民币(约2950亿美元)建设全国数据中心,以推动国内AI产业发展并超越美国。该投资将覆盖数据中心基础设施的大规模建设,为北京在关键技术领域的雄心提供资金支持。

Bloomberg:Technology(RSS)· 热度 80
行业06/09 13:53PICK

AI 编程独角兽 Cursor 欧洲总部落子伦敦,SpaceX 手握 600 亿美元收购选择权

Cursor 将欧洲总部设在伦敦,计划招聘约 200 名员工,并在巴黎、慕尼黑等地开设小型办事处。SpaceX 拥有以 600 亿美元收购 Cursor 的选择权,或支付 100 亿美元开展全新合作。Cursor 目前 B2B 年化营收约 26 亿美元,客户包括英国航空、英国石油、诺基亚等。公司强调数据留存欧洲本地以满足监管合规,其平台支持用户用自然语言生成代码,主打模型中立,竞争对手包括 GitHub Copilot、OpenAI 和谷歌的同类产品。

IT之家(RSS)· 热度 72
模型06/09 11:31PICK

小米 MiMo 与 TileRT 联合发布 UltraSpeed 模式,1T 模型输出突破 1000 tokens/s

Xiaomi MiMo 携手 TileRT|1T 模型首次突破 1000 tokens/s 输出速度

小米 MiMo 与 TileRT 联合发布 MiMo-V2.5-Pro-UltraSpeed 模式,使 1T 参数旗舰模型输出速度首次突破 1000 tokens/s。模型侧采用 FP4 混合量化(仅量化 MoE Expert)与 DFlash 块级 masked 并行推测解码(coding 场景平均接受长度 6.30 tokens);系统侧 TileRT 引入常驻内核引擎与异构流水线协作。API 限时开放(2026 年 6 月 9 日至 23 日),定价为 MiMo-V2.5-Pro 的 3 倍,速度提升约 10 倍。FP4 权重与 DFlash 模型 checkpoint 已开源至 HuggingFace。

公众号:小米 MiMo· 热度 80
行业06/09 10:19PICK

OpenAI 秘密提交 IPO 申请,奥特曼旗下 Tools for Humanity 裁员

OpenAI 申请上市,奥尔特曼估值 25 亿美元的眼球扫描公司却被曝裁员

OpenAI 近日秘密提交 IPO 申请。其 CEO 山姆·奥特曼旗下的 Tools for Humanity 公司正裁员,该公司因虹膜扫描项目 World 及加密货币 Worldcoin 知名,投后估值 25 亿美元,获 Andreessen Horowitz 等投资。因营收困境,公司缩减规模。海外监管方面,肯尼亚以隐私和金融风险为由叫停运营,韩国因违反隐私法规罚款 83 万美元。

IT之家(RSS)· 热度 71
行业06/09 10:01PICK

Elon Musk 详解 SpaceX AI1 轨道 AI 数据中心卫星方案

For the very first time Elon Musk explains the "space data center plan" of @SpaceX in detail and its…

Elon Musk 首次详细解释 SpaceX 的 AI1 轨道 AI 数据中心卫星:峰值功率 150 kW,持续计算功率约 120 kW,相当于一个 NVIDIA GB300 机架;太阳能板效率 250 W/m2;双面散热器排热 1,400 W/m2。通过激光链路实现约 1 Tbps 互联,低轨 600-800 km 高度往返延迟 6-8 ms。由 Starship 发射,计划部署多达百万颗卫星,2027 年底前实现量产。近地目标为吉瓦级轨道 AI 算力,长期向太瓦级推进。

X:Rohan Paul (@rohanpaul_ai)· 热度 83
技巧06/09 09:19PICK

开源工具 Tokei:在菜单栏实时监控 AI coding agent 的 token 用量与成本

兄弟们!地主家家没有余粮了都! 天天烧Token 心里没有点b数啊? AI coding工具天天帮你狂飙代码,结果你连自己到底烧了多少钱都蒙在鼓里? 今天给大家推荐Lank 的Tokei这个mac…

Berry Xia 推荐开源工具 Tokei,这是一个 macOS 菜单栏小工具,只读本地日志、零网络调用,30 秒自动刷新,实时监控 Claude Code、Grok CLI、Aider、OpenCode 等 8 个主流 AI coding agent 的 token 用量、实时成本与性能数据,并附每日图表、周热力图和年度 Wrapped。支持私人 Git 多设备同步、价格表本地覆盖,闲置过久会提醒休息。引用推文指出,token 消耗情况可作为深度使用 AI 的面试亮点,数据全程私有,零侵入,无需任何认证。

X:Berry Xia (@berryxia)· 热度 75
行业06/09 09:15PICK

两部门:到2026年底人形机器人等重点产品完成应用验证并常态部署

两部门:到 2026 年底,人形机器人等重点产品在一批代表性场景中率先完成应用验证和常态部署

工信部、国资委6月8日联合发布通知,目标到2026年底,人形机器人等重点产品在代表性场景完成应用验证并开启常态部署,形成百个以上高价值场景,万台级规模落地。要求各省级地区选取不少于20个场景单元(覆盖两类领域),央企不少于10个。围绕打造实景实训空间、组建创新应用联合体、攻关作业技能、加强验证部署、强化要素保障、凝练经验等六大任务展开,鼓励"人形机器人即服务"等商业创新。

IT之家(RSS)· 热度 70
技巧06/09 08:44PICK

FrontierCode 基准测试:AI 编程评估新标准--维护者审核通过率最高仅 13.4%

Claude Opus 4.8 是目前最好的编码模型,这件事应该没啥太大争议了,我自己跑了这么久体感也是这样。 Cognition(Devin 的公司)刚发布的 FrontierCode 基准测试,…

Cognition 发布 FrontierCode 基准测试,重新定义 AI 编程评估:由 20 多位顶级开源维护者手工制作 150 个任务(每个耗时 40+ 小时),依据 3000 多条规则判断维护者是否愿意合并代码。该基准指出 SWE-Bench 等超半数通过测试的代码实为不可维护的垃圾。结果中 Claude Opus 4.8 在最高难度档获 13.4%,GPT-5.5 为 6.3%,其余模型 1%-5%。这意味着即便最强模型,近九成代码仍无法通过有经验维护者审核。

X:阿易 AI Notes (@AYi_AInotes)· 热度 77
技巧06/09 08:38PICK

GitHub 122K⭐的Skills推出新技能「Teach」:把工作目录变有状态学习空间

Github 122K ⭐️ 的 Skills 仓库「Skills For Real Engineers」推出新 Skill「Teach」:把当前工作目录变成有状态的学习空间!!怒赞作者 @mattp…

GitHub 122K⭐的Skills仓库推出新技能Teach,可将当前工作目录变为有状态学习空间。设计理念从Knowledge(概念事实)→Skills(动手操作)→Wisdom(真实判断)。工作区以文件即学习状态:MISSION.md定目标、lessons/提供课程、learning-records/记录已会内容、reference/生成速查手册。五个关键机制:Mission定方向、ZPD根据记录调整难度、Lesson一课一事+即时反馈、Learning Record记"会了什么"而非"讲了什么"、Reference形成长期可回看手册。可通过npx skills add mattpocock/skills --skill teach安装,适用于从魔方到软件基础等学习场景。

X:邵猛 (@shao__meng)· 热度 75
行业06/09 08:14PICK

Claude 东京站活动开放注册

Final stop: Tokyo. Register to hear directly from the teams behind Claude: http://claude.com/code-w…

最终站:东京。 快来注册,直接聆听 Claude 团队分享:http://claude.com/code-with-claude/tokyo

X:Claude (@claudeai)· 热度 63
产品06/09 08:00PICK

Gopuff与SpaceXAI推出Go AI购物助手

Powering Gopuff's Go agent Jun 9, 2026 # Powering Gopuff's Go agent Gopuff and SpaceXAI launched Go, an AI-powered shopping assistant built into the Gopuff app and powered by Grok text, audio, and image models. Read More

Gopuff与SpaceXAI合作推出Go智能购物助手,内置于Gopuff应用,由Grok文本、音频和图像模型驱动。Go结合Grok的推理、语音和图像生成能力与Gopuff的13年需求智能,利用X和网络实时信号。它可在用户打开应用前根据历史偏好和天气等信号构建个性化购物车,并包含基于Grok Imagine的超逼真视觉购物信息流。Go目前在美国iOS和Android端可用,随后在英国推出。

xAI:News(网页)· 热度 65
产品06/09 07:05PICK

Apple Core AI 框架

一篇关于 Apple Core AI 框架的 Hacker News 帖子获得 109 个点赞。帖子内容包含一张苹果开发者 OG 图片和一个指向 Apple Core AI Framework 官方文档的链接(developer.apple.com)。该帖子由 buzzing.cc 中文翻译,发布于 2026 年 6 月 8 日 02:47(UTC)。

Hacker News 热门(buzzing.cc 中文翻译)· 热度 77
行业06/09 06:50PICK

奥尔特曼宣布 OpenAI 进入第三发展阶段:让 AI 普及、易用且安全

本周一,OpenAI CEO 奥尔特曼与首席科学家帕霍茨基联合发文,宣布公司进入第三发展阶段,目标让 AI 普及、易用且安全。此前第一阶段聚焦通用人工智能技术研发,第二阶段面向全球推出产品。第三阶段三大核心目标是打造自动化人工智能研究员、推动经济提速、为每人配备专属通用人工智能。二人强调智能系统须坚守安全底线,呼吁成立国际机构应对 AI 风险,必要时可暂缓前沿模型研发。同日,OpenAI 秘密提交 IPO 申请,但上市仍需较长时间。上周 Anthropic 研究人员也建议适当放缓前沿 AI 研发。

IT之家(RSS)· 热度 75

数据来源:aihot.virxact.com;每 10 分钟刷新;点击标题外链原文。