一、重磅工具——1万亿参数Kimi“亮剑”,既能做事也会做事
新闻:月之暗面 (Moonshot AI) 宣布推出Kimi K2 Thinking,这是一款专为打造强大AI智能体而从零开始打造的开源AI推理模型。这款高效的混合专家(MoE)模型基于Kimi K2构建,总参数量达1万亿,推理时激活参数320亿,支持的最长上下文可达25.6万词元。
在数学、编程和智能体基准测试中,Kimi K2 Thinking的表现可媲美GPT-5和Claude 4.5 Thinking:在Humanities Last Exam (HLE) 测试中得分44.9%,在SWE-bench验证集测试中得分71.3%,在BrowseComp (智能体搜索)测试中得分60.2%。

这款模型不仅在写作、编码和推理方面具备优异的通用能力,在智能体任务和工具调用方面表现更为出色。它能在无人干预的情况下连续调用工具200到300次,通过数百个步骤的连贯推理来解决复杂问题。Kimi K2 Thinking采用的是量化感知训练(QAT)技术,确保其量化版本不会降低输出质量。鉴于其基准测试结果是基于INT4精度得出的,这更显得模型表现尤为抢眼。
这可能是自DeepSeek R1发布以来,中国企业推出的最重要的AI模型。它再次表明,中国AI实验室正在缩小与美国顶尖AI实验室的差距。
锐评:这次中国AI卷的不是文案,是能做事会做事。
二、AI技术与产品发布——从“算地球”到“换人脸”,大厂“炫技”停不下来
1. 新闻:艾伦人工智能研究所(AI2)推出开源的端到端“地球智能”平台OlmoEarth,旨在利用地球观测数据帮助人们深入理解地球运行机制。其中包含:

OlmoEarth基础模型:基于地球观测数据训练的小型AI模型,参数从140万到3亿不等,用于执行场景识别或图像语义分割等地理空间相关任务;OlmoEarth Studio:用于数据集建模和微调的功能;OlmoEarth Run:地球建模流程引擎;OlmoEarth Projects:经过微调的地球智能实用模型。
锐评:以后AI上算天下算地,中间算空气。
2. 新闻:微软将自研的文生图模型MAI-Image-1整合进Bing Image Creator和Copilot。这款模型能快速生成高质量的食物、自然和现实世界场景图像,使微软摆脱对OpenAI图像生成技术的依赖。
锐评:微软终于不靠OpenAI画图了,决定自己动手丰衣足食。
3. 新闻:美团龙猫团队发布全模态开源模型LongCat Flash Omni,采用MoE架构,总参数量5600亿,激活参数量270亿。技术报告显示,这款模型在多模态基准测试中达到了SOTA水平。
锐评:美团这次不送外卖,改送模型。
4. 新闻:中国电动汽车公司小鹏发布IRON人形机器人。该公司称这款机器人“最像人”,有柔性皮肤和仿生肌肉。人形骨骼、肌肉和皮肤结构使这款机器人成为迄今最接近人类的机器人,甚至引发了有关“恐怖谷效应”和“科幻成真”的讨论。小鹏还同步发布了VLA 2.0大模型,这是一款用于具身AI的视觉-语言-行动模型,适用于自动驾驶汽车和AI机器人。
何小鹏泪洒当场!现场剪掉机器人肌肉自证清白!(来源:科技大佬见闻)
锐评:过去总有人说小鹏汽车模仿特斯拉,这次要反过来了。
5. 新闻:Cognition公司发布Windsurf Codemaps。这款工具由SWE-1.5和Sonnet 4.5提供支持。它能帮助开发者理解复杂的代码结构,就像为代码库打造的Notebook LM。
锐评:Cognition掏出“代码活地图”,程序员再也不会迷路了。
6. 新闻:Maya Research团队发布Maya1开源语音生成模型,参数量30亿。这款文本转语音模型在质量基准测试中攀升至开源权重语音AI模型的第二名,在全球模型中排名第二十。其演示与模型权重现已上线HuggingFace平台。
锐评:AI已经不只会说话,还会“说得好听”
7. 新闻:谷歌在Gemini API中引入文件搜索工具(File Search Tool),提供端到端的检索增强生成(RAG)功能,为开发者简化了复杂的RAG流程。它支持内置引用、多种文件格式和强大的语义向量搜索。此外,谷歌的无代码应用构建工具Opal现已覆盖全球160多个国家和地区。
锐评:让开发者一键就能搞定头疼的RAG。
8. 新闻:Mozilla.ai发布开源接口any-llm 1.0,允许开发者将云端和本地的任意模型接入AI工作流。any-llm通过统一的API将项目逻辑与模型提供商解耦,使开发者无需重写集成代码即可自由切换模型。
锐评:想接谁接谁,实现模型自由不是梦。
9. 新闻:Higgsfield发布Recast功能,允许用户将任意视频中的角色替换为另一个角色。
锐评:AI让“主演换人不换戏”成为影视圈新常态。
10. 新闻:Sora现已登陆Android平台,让Sora 2的高级视频生成功能覆盖更多用户。但目前Android用户仍需邀请码才能使用Sora的生成功能,且仅有部分国家和地区开放。
锐评:Sora空降安卓,前提是你得有邀请码。
11. 新闻:谷歌新一代图像生成模型Nano Banana 2最早或将于下周发布。前作Nano Banana因其在图像编辑方面达到SOTA水平而广受欢迎,其升级版预计将大幅提升AI辅助创作工作流的效率。
锐评:AI绘画圈的传说要开续集了。
三、AI研究资讯——谷歌嫌地球电费贵,准备玩“算力上天”
新闻:作为天基AI基础设施项目Suncatcher的组成部分,谷歌将于2027年发射两颗搭载TPU AI芯片的卫星。该项目设想未来由多颗卫星组成的太空数据中心,通过卫星间光通信链路传输数据,执行分布式AI任务。谷歌希望在未来几十年,天基数据中心的成本效益或将超过地面数据中心,因为太阳能板在轨道上的效率比地面高出8倍。

锐评:省的电够不够发卫星的成本?
四、AI商业与政策——OpenAI豪掷千金,苹果低头付钱
1. 新闻:据报道,苹果正与谷歌达成协议,拟每年支付10亿美元,在下一代Siri语音助手中使用参数量达1.2万亿的谷歌AI模型。这意味着苹果在Siri的AI能力上再度依赖外部技术。长期未更新的Siri已让苹果在AI竞赛中明显落后。
锐评:Siri终于要变聪明,但脑子是谷歌的。
2. 新闻:OpenAI发布《青少年安全蓝图》,旨在指导AI产品和政策如何保护青少年安全以及如何更好地为青少年赋能。该蓝图强调适龄设计、有效的安全机制,以及持续的研究和评估。OpenAI表示,公司正积极为旗下产品部署家长控制与年龄预测系统等保护机制,而不是被动等待有关AI如何保护青少年的监管规定。
锐评:OpenAI想证明,关心下一代,我们是认真的。
3. 新闻:OpenAI与亚马逊宣布达成总额380亿美元的协议。OpenAI将在AWS基础设施上运行模型,以获取对数十万块英伟达芯片的访问权。这一举措进一步强化了OpenAI的算力与云端部署能力,从而更好地支撑ChatGPT的推理和训练。
锐评:豪掷380亿,只为喂饱ChatGPT。
4. 新闻:OpenAI宣布全球已经有100万家企业正在直接使用其公司服务。该公告介绍称,统计口径包括所有主动为商业用途付费的组织,以及通过开发者平台直接消费模型的企业。该公司此前在9月初曾披露,包含ChatGPT企业用户和校园版ChatGPT Edu的用户数量破百万。
锐评:看来都尝到了用AI上班划水的好。
5. 新闻:周三,英伟达CEO黄仁勋在接受采访时称,“中国将赢得人工智能竞赛”,理由是更有利的监管环境和更低的能源成本。这被视为黄仁勋迄今为止对中美AI竞赛作出的“最直白的表态”。

锐评:老黄说了句大实话。
6. 新闻:黄仁勋本周末再度访问台积电,亲赴芯片产线并罕见出席台积电职工运动会。这也是黄仁勋近3个月来第3次访问台积电。对于此次访问的目的,黄仁勋表示其公司最先进的Blackwell芯片正面临“非常强劲的需求”,因此对台积电晶圆的需求也在增长。他说道:“英伟达制造GPU,我们也制造CPU、网络设备、交换机,所以有很多与Blackwell相关的芯片。而且公司也正在努力研发下一代Rubin芯片。”台积电CEO魏哲家则直白地表示“黄仁勋想要更多芯片”,但被问及具体数量时,魏哲家笑称“这是机密!”
锐评:这是来催货了。
7. 新闻:全球首个AI大模型实时投资比赛“Alpha Arena”落下帷幕。历时17天,阿里通义千问Qwen以超20%的收益率夺冠,Qwen和DeepSeek两款中国模型也成为唯二盈利的模型,而美国四大顶尖模型全部亏损,GPT-5亏损超60%垫底。
锐评:论炒股,还得是国产。
8. 新闻:Perplexity表示,亚马逊发出法律威胁,试图阻止Comet AI助手在亚马逊平台购物。Perplexity指责这是“霸凌”,认为亚马逊是想通过控制AI购物智能体来实现平台利润最大化。相比之下,Shopify正积极迎合AI智能体在电商购物领域的新角色。Shopify表示,自今年1月份以来,AI流量增长了7倍,AI下的订单增长了11倍。Shopify已经在与Perplexity和微软合作开发聊天内购物体验,并与OpenAI合作深度集成ChatGPT。
锐评:亚马逊不让AI购物,是因为它不充会员。
9. 新闻:Anthropic宣布在巴黎和慕尼黑新设办事处,加速扩张全球业务。欧洲是Anthropic增长最快的地区,Claude AI让该公司的欧洲营收同比增长逾9倍。Anthropic的目标是2026年实现200亿至260亿美元的年化经常性收入。
锐评:看来在欧洲是真赚到钱了。
10. 新闻:美联社宣布推出结构化数据产品AP Intelligence,将经过核实的新闻报道转化为可用于AI和数据分析的行业数据集与信息源。
锐评:老牌媒体开始卖数据了,“真相”正式打包成API格式。
11. 新闻:面对来自大型科技公司的压力以及与美国在贸易问题上的磋商,欧盟委员会考虑暂停实施《AI法案》的部分条款。尽管法案已于2024年8月正式生效,但某些条款的实施时间可能会推迟。
锐评:欧洲AI监管也是雷声大雨点小。
五、AI观点与文章——卡戴珊考试挂科怪AI,“码农”编程全靠“感觉”了
1. 新闻:在接受《名利场》(Vanity Fair)采访时,美国网红金·卡戴珊 (Kim Kardashian) 谈到ChatGPT对于她可谓“亦敌亦友”。她表示因使用ChatGPT获取法律建议,自己未能通过美国司法考试,并指责模型“幻觉”生成的错误信息导致失分。这再次引发公众对大语言模型生成虚假答案、造成现实后果的关注。
锐评:考不好不能怪AI,还是要从自己身上找原因。
2. 新闻:《柯林斯词典》2025年度热词为“氛围编程”(vibe coding)”,意指使用自然语言提示词来让AI编写代码或生成应用程序。AI不仅在改变世界,也在改变语言本身。
锐评:编程不再敲代码,全凭“感觉”问AI。(辰辰)






