关键词:AI, TPU, 第七代TPU Ironwood, A2A智能体协作协议, SK海力士HBM市场份额, AI智能体协议MCP, 谷歌Gemini 2.5模型

🔥 聚焦

谷歌发布第七代TPU与A2A智能体协作协议: 谷歌在Cloud Next ’25大会上发布专为AI推理设计的第七代TPU “Ironwood”,大规模部署算力高达42.5 Exaflops,远超现有超算。该芯片内存和带宽大幅提升(192GB HBM,7.2Tb/s带宽),能效翻倍,旨在支持Gemini 2.5等需要复杂推理能力的“思维模型”。同时,谷歌推出Agent-to-Agent (A2A)开源协议,旨在标准化不同AI智能体间的安全通信与协作,已有超50家企业支持。A2A定义了智能体能力发现、任务管理、协作方式等,与用于连接工具的MCP协议互补。谷歌还宣布在其Gemini模型和SDK中支持MCP协议,进一步推动AI智能体生态的互联互通。 (来源: 机器之心, 36氪, 卡兹克, 机器之心, AI前线)

42.5 Exaflops:谷歌新TPU性能超越最强超算24倍,智能体协作协议A2A出炉

SK海力士凭借HBM优势首次登顶全球DRAM市场: 市场研究公司Counterpoint Research报告显示,2025年第一季度,SK海力士以36%的市场份额首次超越三星(34%),成为全球最大的DRAM供应商,美光以25%位居第三。SK海力士的成功主要归功于其在高带宽内存(HBM)领域的统治地位(据称市场份额达70%),AI的蓬勃发展极大地推动了HBM需求。SK海力士凭借其HBM3E芯片独家供应英伟达AI加速器,预计HBM需求将持续高速增长。同时,韩媒报道SK海力士在1c DRAM(约11-12nm)制程良率上达到80%,技术上暂时领先于仍在努力提高良率的三星,这为其HBM4的量产奠定了基础。 (来源: 半导体行业观察)

DRAM,史上首次

AI Agent协议MCP与A2A引发关注与生态博弈: 近期,Anthropic提出的模型上下文协议(MCP)和谷歌推出的智能体间协议(A2A)成为AI领域热点。MCP旨在标准化AI模型与外部工具、数据源的交互,被比作AI应用的“USB-C”接口,已有微软、谷歌及众多初创公司和开源社区支持。A2A则专注于不同供应商AI智能体之间的安全通信与协作,已有超50家企业参与。这些协议旨在解决AI智能体间互操作性差、生态割裂的问题。然而,分析认为,巨头们推广这些协议的背后,也存在构建自身生态壁垒、防止数据外流的战略意图。例如,谷歌A2A的首批合作伙伴多与其生态相关,而阿里云推出的MCP服务也主要整合其体系内应用。美团、滴滴等平台因数据主权和生态话语权考量,可能不会轻易接入开放协议。这场协议之争本质上是AI生态系统的主导权和数据控制权的博弈。 (来源: 卡兹克, 王智远, AI前线, 机器之心)

🎯 动向

DeepSeek引发对企业软件未来的思考: DeepSeek的开源对企业软件行业带来冲击,引发关于SaaS厂商技术壁垒、AI数字员工是否终结传统软件的讨论。沃行科技CEO郭舜日认为,单一功能的工具型SaaS(如RPA)最危险,因其易被大模型的多模态能力替代。53AI CEO杨芳贤判断,大模型落地应用尚有限,但10-20年后传统SaaS将消失,被AI生产力(数字人+SaaS融合)取代。信息化与数字化主理人沈旸观点更激进,认为半年到一年内SaaS模式可能被颠覆,未来需靠实时数据或服务效果收费。对话强调AI将重构商业模式,能用好AI的企业将获得竞争优势,反应迟缓则面临淘汰。目前AI落地瓶颈在于企业数据孤岛和知识整合不足,而非AI技术本身。 (来源: 36氪)
AI在大家电领域的应用现状与反思: AI技术正被整合到冰箱、洗衣机、空调等大家电中,提供语音交互、智能控制(如AI省电、AI洗护)等功能。海尔、TCL、三星等品牌纷纷推出AI家电,如搭载DeepSeek的海尔冰箱可提供食材管理建议,TCL空调能播报天气。然而,文章指出,目前AI家电的“AI含量”参差不齐,部分功能(如空调报汇率)显得多余和不实用。与扫地机器人等已实现较完整“感知-决策-执行”闭环的AI产品相比,大家电的AI应用多停留在感知和建议层面,未能完全自主决策执行。文章质疑某些“AI”功能是否为刚需,指出消费者更需要的是核心功能好用、解决痛点的家电,而非强行蹭AI热点。文章认为,大家电在AI时代的角色应是智能家居生态中的一环,需在核心功能上做到极致,并提升协同能力,而非都变成聊天工具。 (来源: 36氪)

大家电搞AI了,但我劝你买之前擦亮眼

MoE模型成新趋势,阿里云升级AI基础设施应对挑战: 混合专家(MoE)架构正成为AI大模型的主流趋势,从Mixtral到DeepSeek、Qwen2.5-Max及Llama 4均采用此架构。针对MoE带来的挑战(如token路由、专家选择等),阿里云发布了基于PAI-DLC的FlashMoE训练框架,支持超大规模MoE混合精度训练,在万卡规模上可提升MFU至35-40%。同时,阿里云推出针对MoE的分布式推理引擎Llumnix,显著降低延迟。此外,阿里云还发布了ECS第9代实例、优化灵骏集群(HPN 7.0网络、CPFS高性能存储、故障自愈系统)、升级OSS对象存储(OSSFS 2.0),并推出MaxCompute AI Function及支持MCP协议的DataWorks Agent服务,全面升级AI基础设施以应对MoE和推理模型带来的新范式。 (来源: 机器之心)
擎朗智能发布人形服务机器人XMAN-R1: 全球服务机器人头部企业擎朗智能发布了首款人形具身服务机器人XMAN-R1,定位“为服务而生”。该机器人基于擎朗在餐饮、酒店、医疗等场景积累的海量真实数据打造,注重岗位化、亲和力与安全性。XMAN-R1能完成服务场景中的点单、配餐、送餐、收餐等闭环任务,具备双手递物、移动控制、拟人交互(大语言模型、表情反馈)等能力,并搭载11项多模态传感器和智能避障技术以适应人群密集环境。XMAN-R1将与擎朗现有的配送、清洁等专用型机器人形成多形态协作生态,共同完成更复杂的商业服务任务,进一步完善擎朗的多形态具身服务机器人矩阵。 (来源: InfoQ)
西安交大等提出无需训练的绘画动态化框架Every Painting Awakened: 针对现有图像到视频(I2V)方法在绘画动态化中存在的“不动”或“乱动”问题,西安交通大学、合肥工业大学及澳门大学联合提出零训练框架“Every Painting Awakened”。该框架利用预训练图像模型生成代理图像作为动态指导,通过双路径分数蒸馏技术分别保留原画静态细节和提取代理图像的动态先验,再利用混合潜在融合机制(球面线性插值)在潜在空间融合动静态特征,输入给现有I2V模型生成视频。此方法无需额外训练即可增强现有I2V模型,能精准执行文本提示中的运动指令,同时保持原画的风格和笔触,实现自然流畅的绘画动态化。实验证明该框架在提升语义契合度和保持风格完整性方面效果显著。 (来源: PaperWeekly)
滑铁卢大学与Meta提出MoCha:基于语音和文本生成多角色对话视频: 为解决现有视频生成技术在角色驱动叙事上的不足(如仅限面部、依赖辅助条件、仅支持单角色),加拿大滑铁卢大学与Meta GenAI提出MoCha框架。MoCha是首个面向Talking Characters任务的方法,仅需语音和文本输入,即可生成角色近景至中景的全身对话视频,支持多角色、多轮对话。核心技术包括:1) Speech-Video Window Attention机制,通过局部时间条件建模精准对齐语音与视频时序特征,保证口型与动作同步;2) 联合语音-文本训练策略,利用现有语音和文本标注视频数据,提升模型泛化能力和可控性;3) 结构化提示模板与角色标签,首次实现多角色、多轮对话生成,保持上下文连贯和角色身份一致。实验验证了其在真实感、表现力、可控性上的优势,推动自动化电影叙事生成。 (来源: PaperWeekly)
华科&小米汽车提出自动驾驶框架ORION: 针对端到端自动驾驶在闭环交互中因果推理能力有限的问题,华中科技大学与小米汽车提出ORION框架。该框架创新性地结合了视觉语言大模型(VLM)和生成模型(如VAE或扩散模型),利用VLM进行场景理解、推理和指令生成,再通过生成模型将VLM的语义推理空间与纯数值的轨迹动作空间对齐,指导轨迹生成。同时,引入QT-Former模块有效聚合长期历史视觉上下文信息,克服了VLM处理多帧图像时的Token限制和计算开销问题。ORION实现了视觉问答(VQA)和规划任务的统一端到端优化。在Bench2Drive闭环评测中,ORION驾驶得分达77.74分,成功率54.62%,显著优于先前最佳方法。代码、模型和数据集将开源。 (来源: 机器之心)
新加坡国立大学提出GEAL:利用2D大模型赋能3D Affordance预测: 为解决3D Affordance Learning(物体可交互区域预测)中3D数据稀缺、标注昂贵及模型泛化性、鲁棒性不足的问题,新加坡国立大学提出GEAL框架。GEAL利用3D Gaussian Splatting将稀疏点云渲染成真实感图像,送入预训练的2D视觉大模型(如DINOV2)提取丰富的语义特征。通过创新的跨模态一致性对齐(Cross-Modal Consistency Alignment),包括颗粒度自适应融合模块(GAFM)和一致性对齐模块(CAM),有效融合2D视觉特征与3D空间几何特征。GAFM根据文本指令自适应聚合多尺度特征,CAM则通过渲染3D特征到2D并施加一致性损失,促进双向信息对齐。GEAL无需大规模3D标注,显著提升了对新物体、新场景的泛化能力和在噪声环境下的鲁棒性。团队还构建了包含多种真实扰动的基准数据集以评估模型稳健性。 (来源: 机器之心)
月之暗面发布Kimi-VL MoE大小模型,主打多模态推理与长上下文: 月之暗面(Moonshot AI)推出了Kimi-VL和Kimi-VL-Thinking两款视觉语言混合专家(MoE)模型。这两款模型总参数量为16B,激活参数量仅约3B,但在多项基准测试中表现出色。Kimi-VL-Thinking在多模态推理(MathVision达36.8%)和智能体技能(ScreenSpot-Pro达34.5%)方面表现优异,性能媲美参数量大10倍的模型。模型采用MoonViT技术原生处理高分辨率视觉输入(OCRBench达867),并支持高达128K的长上下文窗口(MMLongBench-Doc达35.1%,LongVideoBench达64.5%),在关键基准上超越了GPT-4o等更大模型。相关论文和Hugging Face模型已发布。 (来源: Reddit r/LocalLLaMA)

🧰 工具

Firebase Studio:谷歌集成AI的在线全栈开发平台: 谷歌将Project IDX开发工具并入Firebase,更名为Firebase Studio,提供免费的浏览器内全栈应用开发环境。新平台主要特点包括:1) AI辅助项目创建,可根据自然语言提示生成Next.js等应用的初始代码框架;2) 双工作模式切换,支持AI智能模式快速生成内容和传统云开发环境(基于VM的云工作空间)无缝切换;3) 继承IDX功能,如全栈模板、安卓模拟器、团队协作、一键部署等。Firebase Studio深度整合了Firebase后端服务(数据库、认证等),旨在打造集前后端开发、云服务于一体的全家桶开发体验。用户反馈显示该工具非常强大,交互体验良好,能通过提示词构建应用并实时预览,甚至支持截图标记UI进行修改。但目前访问可能因用户过多受限。 (来源: 36氪, dotey)

Google今晚杀疯了:定标准(A2A),发武器(firebase),祭免费(2.0 Flash)

OpenManus:快速复刻Manus核心功能的开源Agent项目: 针对Manus AI Agent引发热潮但代码未开源的情况,华东师范大学研究生梁新兵与DeepWisdom研究员向劲宇等00后开发者利用业余时间迅速开发并开源了OpenManus项目。该项目旨在复刻Manus核心功能,并以简洁、易懂的代码(约几千行)展示Agent的核心逻辑(基于Tool和Prompt)。项目利用了function call的React模式,并设计了浏览器操作、文件编辑、代码执行等核心工具。OpenManus在GitHub上快速获得超4万Star,体现了开源社区对Agent技术的热情。开发者分享了利用大模型辅助理解代码库、设计架构及生成代码的工作流,并讨论了MCP协议(AI界的Type-C接口)和多Agent协作的挑战。项目持续开发中,计划完善工具生态、MCP支持、多Agent协调机制和测试用例。 (来源: CSDN)

180分钟复刻40k Star神话背后:OpenManus 00后主创现场演示,Agent开发的“快”与“痛”

AI智能体概念普及与应用场景: AI智能体(AI Agent)是一种能自主感知环境、做决策并执行任务的软件,区别于仅提供信息的普通AI(如聊天机器人),它能为你“采取行动”。其关键特点包括自主性、记忆能力、工具使用能力和学习适应能力。应用场景广泛,如个人生活助手(自动规划旅行、管理日程邮件)、商业应用(提升软件开发、客服、药物发现效率)、企业效率提升(自动化HR流程、内容创作管理)。构建AI智能体涉及感知(收集数据)、思考(AI模型分析规划)、行动(调用工具API)和学习(从结果改进)等环节。微软、谷歌、BAT等大厂均在布局。用户可通过Coze等平台或编写提示词模板开始使用,从简单任务入手,逐步探索其潜力。 (来源: 周知)
Color Reshape:修正GPT-4o图像色偏的批量处理工具: 针对GPT-4o生成图像时常出现的蓝色或黄色色偏问题,开发者“归藏”推出了一款名为“Color Reshape”的工具。该工具旨在通过一键操作,批量修正AI生成图像的色彩平衡,使其看起来更像专业摄影作品,还原真实色彩。其特点包括支持批量处理、提供带滑块的原图与效果图对比功能、以及包含专业的色彩平衡控制选项。这解决了用户在使用GPT-4o生成图片后,需要手动调整色彩的痛点,提高了AI艺术创作的效率和最终效果。 (来源: op7418)

op7418

Notion推出MCP Server: Notion发布了其MCP(Model Context Protocol)服务器的实现,现已在GitHub开源。该服务器允许AI智能体通过MCP协议与Notion进行交互,实现了包括获取页面内容、评论、执行搜索等多种Notion API功能。这意味着支持MCP协议的AI Agent(如Claude等)将能够更方便地调用和操作用户的Notion数据和功能,进一步扩展了AI Agent的应用场景和能力。 (来源: karminski3)

karminski3

OLMoTrace:探究语言模型记忆与合成信息的新工具: Ai2(艾伦人工智能研究所)推出了OLMoTrace,这是其AI Playground中的一项新功能,旨在帮助理解大型语言模型(LLM)在多大程度上是在学习和合成信息,又在多大程度上只是记忆和复述训练数据。用户现在可以通过这个工具查看可能对模型生成特定完成(completion)有贡献的训练数据片段。这对于研究LLM内部工作机制、理解其行为来源以及评估其泛化与记忆能力的平衡具有重要意义,尤其对于关注模型原创性和可靠性的研究者和开发者而言。 (来源: natolambert)

📚 学习

NVIDIA发布开放基础模型GR00T N1,推动通用人形机器人发展: NVIDIA发布了GR00T N1,一个专为通用人形机器人设计的开放基础模型。该模型旨在解决机器人训练数据稀缺的问题,通过结合多种数据源进行学习:1) 利用Omniverse创建高度精确的数字孪生环境(如工厂)生成大量自带标签的模拟数据;2) 利用Cosmos模型将模拟数据转化为更真实的视频,进一步扩充训练集;3) 开发AI系统自动标注互联网上的现有视频,提取动作、关节、目标等信息,使真实世界视频也能用作训练数据。GR00T N1采用双系统思维模式:System 2进行慢速推理规划,System 1(基于Diffusion模型)生成实时运动控制指令。实验显示,相比先前方法,成功率从46%提升至76%。该模型是开源的,支持不同形态的机器人,旨在加速通用机器人的研发和应用。 (来源: Two Minute Papers)
AI辅助缓解高中生数学焦虑: 根据费城工业与应用数学学会(SIAM)的全球调查,超半数(56%)高中生认为AI有助于缓解数学焦虑。15%的学生表示个人使用AI后数学焦虑减少,21%成绩提高。AI缓解焦虑的原因包括:提供即时帮助和反馈(61%),建立信心(允许按自己节奏提问,44%),个性化学习(33%),减少犯错恐惧(25%)。然而,仅19%的教师认为AI能减少数学焦虑。多数师生(64%教师,43%学生)认为AI应与人类教师配合使用,作为导师或学习伙伴,帮助理解概念而非直接给答案。AI的普及也引发对师生关系和教师角色转变的思考,如更重视无法使用AI的考试、教师需精通AI以指导学生、教师可更专注于个性化辅导等。 (来源: 元宇宙之心MetaverseHub)

全球调查显示:超半数高中生认为AI有助于缓解数学焦虑

💼 商业

具身智能公司「穹彻智能」完成数亿元Pre-A++轮融资: 由斯坦福背景团队创立的具身智能公司「穹彻智能」近日完成数亿元Pre-A++轮融资,盛宇投资、清科创投、嘉御资本、云启资本、上海科创集团等参投,老股东Prosperity7、红杉中国连续三轮加注。资金将用于加速具身智能基础模型、数据采集与评价等领域突破,并推动在零售履约、家庭服务、食品加工等场景的商业化。公司由上海交大教授卢策吾和非夕科技创始人王世全联合创立,专注于解决具身智能在物理世界描述与交互、数据获取等核心难题。其核心产品“穹彻具身大脑”已具备全闭环能力,并通过自研的“生产伴随”式数据采集系统(CoMiner)降低数据成本。公司已与家电企业合作研发家庭服务机器人(如AWE展示的洗护机器人),并与食品厂商达成合作意向。 (来源: 36氪)

斯坦福团队创立,红杉、P7持续加注,这家具身智能公司再融资数亿|硬氪首发

人形机器人公司「星尘智能」完成数亿元A轮及A+轮融资: 具身人形机器人公司「星尘智能」连续完成A轮及A+轮融资,总额数亿元,由锦秋基金、蚂蚁集团领投,云启资本、道彤资本等老股东跟投。公司定义“Design for AI”范式,致力于打造具备人类级操作能力的AI机器人助理。其核心产品Astribot S1采用独创绳驱传动设计,实现高负载自重比(1:1)、高速(末端超10m/s)和类人柔性操作能力。星尘智能构建了“本体+数据+模型”技术闭环,能低成本利用真实世界视频及人体动作数据,并高效收集多模态交互数据,赋予机器人复杂环境感知、认知、决策及通用操作泛化能力。目前S1已迭代三次,与高校、企业等展开落地实践,并持续优化端到端大模型。 (来源: 36氪)

连续完成A及A+轮融资,星尘智能获锦秋基金、蚂蚁集团等领投

Jony Ive与Sam Altman的AI硬件初创公司io Products或被OpenAI收购: 由前苹果设计总监Jony Ive和OpenAI CEO Sam Altman共同创立的AI硬件初创公司io Products,据The Information报道,可能以至少5亿美元的价格被OpenAI收购。io Products成立于2024年,旨在打造比智能手机侵入性更低的AI驱动个人设备,探索方向可能包括无屏幕手机、AI驱动的家用设备或可穿戴AI助手。此次潜在收购标志着OpenAI可能从软件领域扩展至消费硬件。然而,考虑到Humane AI Pin和Rabbit R1等先前AI硬件产品的失败以及用户对现有手机AI功能增强的偏好高于全新设备形态,市场对无屏幕AI设备的需求和接受度仍存疑问。 (来源: 不客观实验室)

Jony Ive 的 AI 硬件还没亮相,公司就要被收购了

3月AI应用市场观察:全球下载量达2.6亿,国内腾讯、阿里、字节“三国杀”: DataEye研究院报告显示,2025年3月全球AI应用(App Store & Google Play)预估下载量达2.6亿次。ChatGPT以23%份额遥遥领先,Google Gemini超越DeepSeek位居第二。国内市场苹果端下载量4020万次,DeepSeek、即梦AI、豆包、夸克、腾讯元宝居前五,Kimi智能助手下载量暴跌。买量方面,大陆市场AI产品(含小程序)投放素材量达95.7万组,腾讯元宝(26%)、夸克(24%)、豆包(13%)位列前三,形成腾讯、阿里、字节激烈竞争格局,Kimi暂停投放后跌出榜单。报告认为DeepSeek的爆火及阿里的“All in AI”战略促使大厂加速布局C端AI应用市场。 (来源: 36氪)

3月AI月报:全球AI双端下载2.6亿,大陆买量市场上演“三国杀”

Anthropic推出高价订阅计划Claude Max: 对标OpenAI的ChatGPT Pro(200美元/月),Anthropic推出了Claude Max订阅服务。该服务提供两档选择:100美元/月,提供比现有Claude Pro(20美元/月)高5倍的使用量上限;200美元/月,提供高达20倍的使用量上限。Max计划用户将优先获得Anthropic最新的AI模型与功能,包括即将推出的语音模式。此举被视为AI公司探索增加收入、服务重度用户的新途径。Anthropic产品主管表示,此计划主要面向编码、金融、媒体娱乐、营销等领域的专业重度用户,并不排除未来推出更昂贵方案的可能。同时,Anthropic也在探索面向教育等特定市场的服务。 (来源: dotey, op7418)

dotey

xAI发布Grok 3 API并公布定价: xAI正式开放Grok 3系列API的Beta测试,提供Grok 3和Grok 3 Mini两款模型,每款均有常规模式和快速模式(响应更快但输出成本更高)。Grok 3适用于数据抽取、编程等企业场景,定价为输入$3/百万token,输出$15/百万token(快速模式为$5/$25)。Grok 3 Mini为轻量级模型,适用于简单任务,定价为输入$0.3/百万token,输出$0.5/百万token(快速模式为$0.6/$4)。这为开发者提供了灵活的选择,以满足不同应用场景对性能和成本的需求。与此同时,谷歌也为开发者推出含免费套餐的新计划,Anthropic则推出高价Max套餐,Meta的Llama 4则以低成本(约$0.36/百万token)参与竞争,显示出AI巨头在API定价策略上的差异化竞争。 (来源: 新智元, op7418)

Grok-3四档定价揭秘:低至0.3美元/百万token,硬刚谷歌Meta

36氪发布2025 AI原生应用创新案例榜单: 36氪评选并发布了“2025 AI原生应用创新案例”榜单,最终45个案例入围。评选旨在发掘将AI技术率先落地于实际场景、创造实际价值并引领行业变革的AI原生产品及应用。入围案例涵盖智能制造、客服、内容创作、企业管理、办公、安全、营销、医疗等多个领域。评审发现入围案例呈现四大特点:1) 跨领域融合加速,创造新业务模式;2) 深度结合行业痛点,提供特色解决方案;3) 注重用户体验与个性化服务提升;4) 依托强大自研技术(大模型、多模态等)并积极构建创新生态。该榜单反映了AI原生应用正迎来爆发式增长,并深度渗透各行各业。 (来源: 36氪)

2025 AI原生应用创新案例重磅发布

🌟 社区

谷歌DeepMind被曝使用长达1年的竞业协议限制人才流动: 据Business Insider报道,谷歌DeepMind被指利用长达12个月的竞业禁止协议(包含强制带薪休假/花园假)来阻止核心AI人才流向OpenAI、微软等竞争对手。协议通常包含在劳动合同中,在员工试图跳槽至直接竞争对手时生效。竞业期时长视职位而定,一线开发者可能为6个月,高级研究员可达1年。此举引发争议,被批评为“职场金手铐”,在快速迭代的AI行业可能导致人才技能脱节、抑制创新和人才流动。由于英国法律允许执行“合理”竞业协议,而DeepMind总部在伦敦,这与禁止竞业的加州形成对比。前DeepMind高管、现微软VP Nando de Freitas在X平台公开抨击此做法,称其不应在欧洲拥有如此大的权力,引发广泛讨论。 (来源: CSDN程序人生)

强制员工“带薪休假”1年 ?谷歌DeepMind竞业条款遭炮轰:宁可花钱白养,也不肯放人

AI引发“情感茧房”担忧: 随着AI技术发展,其在满足人类情感和欲望方面的应用日益增多,如智能情趣娃娃(Wmdoll预计销量增长30%)、AI虚拟伴侣、AI代聊(提升OnlyFans主播收入)等。文章分析指出,AI能够提供稳定、耐心、肯定的情绪价值,满足人们的精神交流需求,甚至超越真人。然而,这种“过度迎合”和“过度保护”可能导致人类形成“情感茧房”,过度依赖主观感受处理关系,降低对真实人际关系中复杂性和挫折的容忍度,加剧情感脆弱性、原子化和性别对立。文章认为,AI通过处理琐事解放人类时间的同时,也可能因其迎合本性将人封锁在舒适区和最终幻想中,阻碍个人成长和真实人际交往,最终可能导致人类更加孤独并被AI“征服”。 (来源: 周天财经)

AI与「情感茧房」:人类真正的风暴即将到来

MiniMax战略调整:从“产模一体”到技术优先,押注AI视频: 面对DeepSeek等竞争压力,AI公司MiniMax调整战略。早期坚持“产模一体”,模型服务于应用(如文本模型对应MiniMax助手,视频模型对应海螺AI,以及Talkie、星野等),并通过修改Transformer底层架构(线性注意力)提升效率。创始人闫俊杰反思认为“更好的应用不一定导向更好的模型”,公司转向“技术驱动”,将技术研发与产品应用分离。产品层面,MiniMax聚焦“海螺”品牌用于视频生成,原“海螺AI”更名“MiniMax”,并传将收购AI视频生成公司鹿影科技(旗下有二次元平台YoYo)。此举或因其主要收入来源Talkie(AI陪伴应用)在海外市场面临下架风险,需寻找新的增长点。同时,MiniMax开始发力B端业务,成立智能硬件产业创新联盟,但其B端业务仍显薄弱,面临挑战。 (来源: guangzi0088)

MiniMax没有B计划

长城汽车与宇树科技合作探索“越野车+机器狗”: 长城汽车与机器人公司宇树科技达成战略合作,将在机器人技术、智能制造等领域展开合作。首期合作将围绕“越野车+机器狗”的应用场景,探索如装备运输、户外探险陪伴等可能性。文章探讨了机器人(尤其是人形机器人)在汽车行业的应用,认为目前机器人在汽车工厂主要扮演“打下手”角色(如搬运重物),替代人类尚不现实,因灵活性和适应性仍不足。而“车+机器人”的场景拓展(类似比亚迪的“汽车+无人机”)旨在拓宽汽车的使用边界。对于“越野车+机器狗”,文章认为其对硬核越野爱好者或特定行业(如野外救援)有潜在价值(如运输装备、探路),但普及面临成本高、需求小众、技术成熟度等挑战,目前更像是一种对未来户外智能场景的探索而非刚需。 (来源: 电车通)

长城和宇树牵手,「越野车+机器狗」画风清奇,是噱头还是刚需?

Llama 4架构对Mac用户特定工作流的适用性讨论: 一位Mac Studio用户(M3 Ultra, 512GB RAM)分享了Llama 4 Maverick模型对其工作流的适用性。该用户热衷于通过多步骤迭代和验证的工作流来提升LLM性能,但此前在Mac上运行大型模型(32B-70B)速度过慢(长达20-30分钟),而小型模型(8-14B)虽然速度快但质量不够理想。Llama 4 Maverick虽然参数量大(400B),需要大量内存(Mac正好满足),但其MoE架构使得实际运行速度接近17B模型(Q8量化下约16.8 T/s生成速度)。这种“内存占用大但速度相对较快”的特性恰好契合了Mac用户“内存充裕但速度受限”的痛点,使其成为该用户特定工作流的理想选择,尽管该模型整体评价不高且可能存在tokenizer问题。 (来源: Reddit r/LocalLLaMA)

💡 其他

谷歌Gemini升级Deep Research功能: 谷歌DeepMind CEO Demis Hassabis宣布,Gemini应用(需Gemini Advanced订阅)中的Deep Research功能现已由Gemini 2.5 Pro模型驱动。谷歌称这是市场上最强大的深度研究能力,相比次优竞品有2比1的用户偏好度。升级后的Deep Research能更好地分析信息,为用户生成关于几乎任何主题的深度报告。 (来源: demishassabis)

demishassabis

利用GPT-4o将照片转换为分层剪纸艺术风格: 用户分享了一个使用GPT-4o或Sora将普通照片转换为具有分层效果的剪纸艺术风格图片的提示词技巧。核心思路是要求模型识别并分离照片中的中景和背景,然后应用分层剪纸艺术风格进行重绘,并可选择添加标题。示例展示了将一张芝加哥城市照片成功转换为带有“2016年芝加哥”标题的剪纸风格作品。 (来源: dotey)

dotey

利用GPT-4o根据日期生成时尚日历插画: 用户分享了一个使用GPT-4o生成中国黄历风格时尚日历插画的提示词模板和方法。该方法分两步:第一步,输入日期,让模型检索对应的黄历信息(星期、农历、节假日、宜忌、励志语)和季节性人物穿着描述,并基于模板生成详细的图片生成提示词;第二步,让模型根据生成的提示词绘制图片。模板要求图片为竖版(9:16)清新手绘插画风格,包含时尚可爱的女生形象、醒目的公历日期、英文月份、中英文星期、农历日期、节假日、竖排“宜”事项及励志语,并注意留白和布局。示例展示了根据此方法生成的元旦日历插画。 (来源: dotey)

dotey