关键词:AI智能体, 微软Build 2025, AlphaEvolve, GPT-4, Azure AI Foundry, 英伟达Computex 2025, AI编程工具, 具身智能, GitHub Copilot VSCode扩展, 模型上下文协议(MCP), 自然语言网络(NLWeb), 美团NoCode, 腾讯QBot智能助手

🔥 聚焦

微软Build 2025开启“智能体网络”时代,全面拥抱AI原生开发: 微软在Build 2025开发者大会上宣布了其“开放的智能体网络”(Open Agentic Web)愿景,发布超50项更新,核心包括开源GitHub Copilot的VSCode扩展、推出模型上下文协议(MCP)与自然语言网络(NLWeb)开放标准,以及将xAI的Grok等1900+模型引入Azure AI Foundry。这些举措旨在打通从模型到智能体的开发链路,实现AI Agent的跨场景自主运作和互操作性。微软CEO纳德拉强调AI Agent将重塑问题解决方式,并与OpenAI CEO奥特曼、英伟达CEO黄仁勋、xAI创始人马斯克共同探讨了AI智能体在软件开发、基础设施及物理世界应用的未来。 (来源: 36氪 | GitHub Blog | VS Code Blog | The Verge)

谷歌DeepMind发布AlphaEvolve,AI智能体打破56年矩阵乘法效率纪录: 谷歌DeepMind推出由Gemini驱动的编码智能体AlphaEvolve,它通过进化算法和自动化评估系统,成功发现了比沿用56年的Strassen算法更高效的4×4复数矩阵乘法算法,将所需标量乘法次数从49次降至48次。此突破不仅在数学理论上意义重大,已在谷歌内部应用中展现价值,如将Gemini架构中大型矩阵乘法运算加速23%,使Gemini训练时间缩短1%,并提升FlashAttention性能32.5%。AlphaEvolve展示了AI在自动化科学发现和算法优化方面的巨大潜力,能够处理从数学难题到数据中心资源调度和AI模型训练加速等多种复杂问题。 (来源: Google DeepMind Blog | 量子位)

研究显示GPT-4在个性化辩论中说服力超人类64%: 《Nature Human Behaviour》发表的一项研究表明,当OpenAI的GPT-4能够获取辩论对手的性别、年龄、教育背景等个人信息并据此调整论点时,其说服力比人类高出64%。这项由洛桑联邦理工学院等机构合作的研究,涉及900名参与者,进一步证实了大型语言模型(LLM)在说服方面的强大能力。研究者警告,这揭示了AI工具在掌握少量用户信息后,便能构建复杂且具说服力的论点,对个性化虚假信息传播构成潜在威胁,呼吁政策制定者和平台重视此风险,并探索利用LLM生成个性化反叙事内容以对抗虚假信息。 (来源: Nature Human Behaviour | MIT Technology Review)

微软与Hugging Face深化合作,Azure AI Foundry集成超万个开源模型: 在Microsoft Build大会上,微软宣布扩展与Hugging Face的合作,Azure AI Foundry现已集成超过10,000个Hugging Face开源模型,涵盖文本、音频、图像等多种模态和任务。此举旨在让Azure用户能更便捷、安全地部署多样化的开源模型,用于构建AI应用和智能体。所有集成模型均通过安全测试,使用safetensors格式,且不含远程代码,确保企业级应用的安全性。双方计划未来持续引入最新和热门模型、支持更多模态(如视频、3D),并加强对AI智能体和工具的优化。 (来源: HuggingFace Blog)

Microsoft and Hugging Face expand collaboration

🎯 动向

英伟达Computex 2025发布多款AI新品,加速AI工厂转型: CEO黄仁勋在Computex 2025上发布了GeForce RTX 5060 GPU、Grace Blackwell GB300超级计算平台、个人AI超级计算机DGX Spark(搭载GB10,数周内上市)及DGX Station(784GB内存,可运行DeepSeek R1)。黄仁勋强调英伟达正从GPU供应商向全球AI基础设施提供商转型,旨在打造“开箱即用”的AI工厂。同时,英伟达联合DeepMind与迪士尼研发的物理引擎Newton将于7月开源,并推出Isaac GR00T人形机器人基础模型,推动物理AI发展。英伟达还宣布在中国台湾新建办公室,并强调中国AI人才的重要性。 (来源: 36氪 | 36氪)

微软计划允许欧盟用户更改iPhone等设备的默认语音助手: 据彭博社报道,苹果公司计划允许欧盟用户将iPhone、iPad、Mac等设备上的默认语音助手从Siri更改为其他选项,如谷歌Assistant或亚马逊Alexa。此举可能是为了应对欧盟《数字市场法案》(DMA)的反垄断压力。Siri近年来因功能落后、智能化不足而备受诟病,苹果内部对Siri发展方向存在分歧,且其现有架构难以与大语言模型(LLM)有效集成。尽管苹果正在研发基于LLM的新Siri,并推出了Apple Intelligence,但允许用户更换默认助手,可能对其生态系统造成冲击。 (来源: 36氪)

苹果内部测试自研AI聊天机器人,能力或与ChatGPT相当: 彭博社记者Mark Gurman爆料,苹果正内部测试其自研AI聊天机器人项目,在新AI负责人John Giannandrea领导下,该项目近六个月取得显著进展,部分高管认为其当前版本能力已接近ChatGPT最新版。该机器人或将具备即时网络搜索和信息整合能力。此举可能旨在减少对OpenAI等外部服务的依赖,并提升Siri的竞争力。尽管WWDC 2025可能不会重点介绍Siri升级,但苹果对AI的投入持续加大,以期在AI时代重振其语音助手。 (来源: 36氪)

Windows将原生支持模型上下文协议(MCP): 微软在Build 2025大会上宣布,Windows操作系统将原生支持模型上下文协议(MCP),旨在简化AI应用在Windows上的开发和部署。MCP被比作“AI应用的USB-C”,试图为不同AI模型和应用提供标准化的交互方式。Windows AI Foundry平台将整合此支持,使开发者能更方便地在Windows设备上运行和管理本地AI模型及智能体。 (来源: op7418 | Reddit r/LocalLLaMA)

👀 Microsoft just created an MCP Registry for Windows

微软Azure AI Foundry引入xAI的Grok大模型: 微软在Build 2025开发者大会上宣布,埃隆·马斯克的xAI公司Grok 3和Grok 3 mini大模型将加入Azure AI Foundry平台。Azure用户将可以直接通过云平台使用和付费这些模型。此举进一步扩展了Azure上可用的AI模型数量(已超1900种),此前已包括OpenAI、Meta和DeepSeek等。马斯克通过视频连线表示希望开发者提供反馈,并期待未来向更多公司提供Grok服务。 (来源: 36氪)

Percy Liang团队发起Marin项目,推动开放式AI模型开发: 斯坦福大学教授Percy Liang领导发起Marin项目,旨在以“彻底参与的方式”构建开放模型。该项目强调开放开发过程,允许任何人贡献。首批Marin模型已发布,其中8B模型已上线Together AI平台供测试。这一举措响应了对AI领域更深层次开放性的呼吁,不仅开放权重、代码和数据,更开放整个研发生态。 (来源: vipulved)

vipulved

英特尔发布Arc Pro B60专业显卡,KTransformers宣布支持Intel GPU: 英特尔发布了新款专业级显卡Arc Pro B60,拥有24GB显存和456GB/s的显存带宽,单卡售价约500美元,为AI计算提供了新的硬件选择。同时,KTransformers框架宣布支持Intel GPU,测试显示在Xeon 5 + DDR5 + Arc A770平台上运行DeepSeek-R1 Q4量化模型可达约7.5 token/s,为本地运行大模型提供了更多硬件可能性。 (来源: karminski3 | karminski3)

karminski3

DeepMind预告Google I/O大会: Google DeepMind官方账号预告了即将于5月20日(太平洋时间上午10点)举行的Google I/O大会,并将在X平台进行直播。预计大会将发布一系列AI相关的重大更新和产品,延续谷歌在AI领域的强劲势头。 (来源: GoogleDeepMind)

🧰 工具

AgenticSeek:纯本地运行的AI智能体,对标Manus AI: AgenticSeek是一个开源项目,旨在提供一个完全在本地运行的AI助手,具备自主浏览网页、编写代码和规划任务的能力,且所有数据保留在用户设备上,确保隐私。该工具专为本地推理模型设计,支持语音交互,致力于降低AI智能体的使用成本(仅电力消耗)和数据泄露风险。 (来源: GitHub Trending)

Fosowl/agenticSeek - GitHub Trending (all/monthly)

美团内测AI编程工具NoCode,定位Vibe Coding: 36氪独家报道,美团近期将上线AI编程工具“NoCode”,域名nocode.cn已注册并进入灰度测试。该产品由美团研发质量与效率团队开发,定位类似Lovable的“氛围编程”,面向非技术人群,通过对话式交互自动完成编码和部署任务,如数据分析、产品原型、运营工具生成等。NoCode采用Code Agent架构,能进行多步骤逻辑推理,并计划向商家和广大用户开放,降低中小商户IT化门槛。 (来源: 36氪)

美团要开放AI编程能力,将推出新产品NoCode|36氪独家

腾讯QQ浏览器升级AI浏览器,集成QBot智能助手: QQ浏览器宣布升级为AI浏览器,并推出名为QBot的AI助手,该助手基于腾讯混元和DeepSeek双模型。QBot集成了AI搜索、AI浏览、AI办公、AI学习、AI写作等功能,并引入了类似Manus的AI Agent能力,可执行复杂任务。首批灰度测试的Agent包括“AI高考通”,能为用户生成个性化高考志愿填报方案。QQ浏览器用户规模超4亿,此次升级旨在通过AI提升用户获取信息和处理任务的效率。 (来源: 36氪)

OpenAI Codex登陆ChatGPT iOS版,支持移动端编程任务: OpenAI宣布其编程助手Codex现已集成到ChatGPT的iOS应用中。用户可以直接在手机上启动新编码任务、查看代码差异、请求修改甚至推送PR。该功能还支持锁屏实时活动跟踪,方便用户随时掌握Codex工作进度,并在回到电脑前继续未完成的任务。这标志着AI编程向移动端和多场景协作迈出了重要一步。 (来源: karinanguyen_ | gdb)

karinanguyen_

NotebookLM移动应用上线,支持安卓与iOS: 谷歌的AI笔记工具NotebookLM正式推出移动端应用,已在安卓和iOS平台陆续上线。移动版提供了音频概览、对话等核心功能,方便用户随时随地利用AI进行内容解析和学习。一个便捷特性是用户可以直接将正在浏览的内容(公众号除外)转发至NotebookLM进行处理。 (来源: op7418)

op7418

Public推出AI投资工具“Generated Assets”: 投资平台Public发布新产品“Generated Assets”,允许用户向AI提出投资想法,AI会据此返回投资建议、自定义投资指数,并能比较历史回报及实时追踪表现。这类似于一种“氛围投资”或“主题投资”的AI实现,旨在降低用户构建和管理个性化投资组合的门槛。 (来源: op7418)

op7418

ClaraVerse:集成多种AI工具的“全家桶”应用: 一个名为ClaraVerse的AI工具套件被社区分享,它集成了聊天界面、AI组件、Ollama(本地大模型运行)、n8n(工作流/定时任务)、AI Agent模板、ComfyUI(图像生成)以及带AI索引的图片库。旨在为用户提供一个一站式的AI工作平台,简化不同AI工具的使用和切换。 (来源: karminski3)

karminski3

Qdrant向量数据库集成微软NLWeb协议: 向量数据库Qdrant宣布成为微软在Build大会上发布的NLWeb开放协议的首批合作伙伴。NLWeb旨在将传统搜索框转变为基于自然语言的语义化、意图感知界面。通过与Qdrant集成,网站可以利用其进行快速、带过滤条件的向量搜索,提供语义相关的结果,而无需大幅修改前端或后端逻辑。 (来源: qdrant_engine)

qdrant_engine

📚 学习

DeepMind提出视觉规划(Visual Planning):纯图像序列推理范式: Yi Xu等研究者提出了一种名为“视觉规划”(Visual Planning)的新型推理范式,旨在让模型完全通过图像序列进行思考和规划,模拟人类在头脑中构思步骤的方式,而无需语言或文字思维。这种方法探索了AI在非语言符号系统下进行复杂推理的可能性,为多模态AI的发展提供了新思路。 (来源: madiator)

madiator

斯坦福等机构推出Terminal-Bench:评估AI智能体终端任务能力的基准: 斯坦福大学与Laude的研究人员推出了Terminal-Bench,一个用于评估AI智能体在真实世界终端环境中完成复杂任务能力的框架和基准。鉴于许多AI智能体(如Claude Code, Codex CLI)通过与终端交互来执行有价值的任务,该基准旨在量化它们的实际效能,推动面向实际部署的智能体能力提升。 (来源: madiator | andersonbcdefg)

madiator

DeepSeek-V3技术解读:软硬件协同设计实现高效模型: DeepSeek-V3模型通过软硬件协同设计,在仅2048块NVIDIA H800 GPU上完成了训练。其关键创新包括多头潜在注意力(MLA)、专家混合(MoE)、FP8混合精度训练以及多平面网络拓扑。这些技术共同作用,旨在以更低的成本实现更优的模型性能,代表了AI模型设计向更高效费比方向发展的新趋势。 (来源: TheTuringPost)

TheTuringPost

新论文探讨深度学习中的表征乐观主义:断裂纠缠表征假说: Kenneth Stanley等人发表立场文件《质疑深度学习中的表征乐观主义:断裂纠缠表征假说》。研究指出,通过非常规开放式搜索发现的、能输出单一图像的网络,其表征优雅且模块化;而SGD学习到同样输出的网络,其表征则混乱纠缠。这表明良好输出行为下可能隐藏着糟糕的内部表征,但也揭示了表征可以更好的可能性,对模型的泛化、创造力和学习能力有深远影响,为改进基础模型和LLM提供了新思路。 (来源: hardmaru | togelius | bengoertzel)

hardmaru

RL教程更新,重点关注LLM章节(DPO、GRPO、思维链等): Sirbayes发布了其强化学习(RL)教程的新版本。本次更新主要针对大型语言模型(LLM)章节,加入了DPO(Direct Preference Optimization)、GRPO(Group Relative Policy Optimization)、思维链(Thinking)等最新内容。同时,多智能体强化学习(MARL)、基于模型的强化学习(MBRL)、离线强化学习以及DPG(Deep Deterministic Policy Gradient)等章节也有小幅更新。 (来源: sirbayes)

sirbayes

字节跳动提出预训练模型平均策略(Pre-trained Model Averaging): 字节跳动研究团队发表论文,提出在大型语言模型预训练过程中进行模型合并的新框架——预训练模型平均(PMA)策略。研究发现,合并以恒定学习率训练的检查点,不仅能达到与持续训练相当甚至更好的性能,还能显著提高训练效率。该研究为大模型预训练提供了新的效率优化思路,并验证了模型合并在提升性能和效率方面的潜力。 (来源: teortaxesTex)

teortaxesTex

通义实验室新研究ZeroSearch:LLM扮演搜索引擎,无需API提升推理能力: 阿里通义实验室提出ZeroSearch框架,通过让LLM模拟搜索引擎行为,在强化学习过程中无需实际调用搜索引擎API,从而降低成本并提升训练稳定性。该方法通过轻量微调使LLM能生成有用结果和噪声干扰,并采用课程化抗噪训练,逐步提升模型在复杂检索场景下的推理和抗干扰能力。实验表明,仅需3B参数的LLM作为检索模块即可有效提升搜索能力。 (来源: 量子位)

通义实验室新研究:大模型自己「扮演」搜索引擎,提升推理能力无需搜索API

港中文大学新算法RXTX优化矩阵乘法XXt计算: 香港中文大学研究者提出新算法RXTX,用于加速计算矩阵与其转置的乘积(XXt)。该算法基于4×4分块矩阵的递归乘法,结合机器学习搜索和组合优化技术发现。与基于Strassen递归的现有算法相比,RXTX将渐近乘法常数降低约5%,并在n≥256时展现总运算量优势,在6144×6144矩阵测试中比BLAS默认实现快9%。此研究对数据分析、芯片设计、LLM训练等领域有潜在影响。 (来源: 量子位)

矩阵乘法可以算得更快了!港中文10页论文证明:能源、时间均可节省

论文AdaptThink:让推理模型学会何时“思考”: 该研究提出AdaptThink,一个通过强化学习教会推理模型根据问题难度自适应选择是否进行深度思考(如Chain-of-Thought)的框架。其核心包含一个约束优化目标(鼓励在保持性能的同时减少思考)和重要性采样策略(平衡思考与不思考的样本)。实验表明,AdaptThink能显著降低推理成本并提升性能,例如在数学数据集上,使DeepSeek-R1-Distill-Qwen-1.5B的平均响应长度减少53%,准确率提高2.4%。 (来源: HuggingFace Daily Papers)

论文VisionReasoner:通过强化学习统一视觉感知与推理: VisionReasoner是一个统一框架,旨在通过共享模型处理多种视觉感知任务。它采用多对象认知学习策略和系统性任务重构,增强模型分析视觉输入并进行结构化推理的能力,以应对检测、分割、计数等十种不同任务。实验结果显示,VisionReasoner在COCO(检测)、ReasonSeg(分割)和CountBench(计数)等基准上均优于Qwen2.5VL等模型。 (来源: HuggingFace Daily Papers)

论文AdaCoT:通过强化学习实现帕累托最优的自适应思维链触发: 为解决大型语言模型(LLM)在处理简单查询时,思维链(CoT)带来的不必要计算开销,AdaCoT框架被提出。它利用强化学习(PPO)使LLM能根据查询的隐式复杂性自适应决定是否调用CoT,旨在平衡模型性能与CoT调用成本。通过选择性损失屏蔽(SLM)技术防止决策边界塌陷,实验表明AdaCoT能大幅减少不必要CoT的触发率(低至3.18%)和响应Token数(减少69.06%),同时保持复杂任务的高性能。 (来源: HuggingFace Daily Papers)

论文GIE-Bench:面向文本引导图像编辑的接地气评估基准: 为更精确评估文本引导的图像编辑模型,GIE-Bench被提出。该基准从功能正确性(通过自动生成的多选题验证编辑是否成功)和图像内容保留(使用对象感知遮罩技术和保留评分确保非目标区域一致性)两个维度进行评估。包含1000多个高质量编辑示例,覆盖20个类别。对GPT-Image-1等模型的评估显示,其在指令遵循上领先,但在保留无关区域方面有待改进。 (来源: HuggingFace Daily Papers)

论文InstanceGen:具有实例级指令的图像生成: 针对预训练文生图模型在处理包含多个对象和实例级属性的复杂提示时难以准确捕捉语义的问题,InstanceGen提出一种新技术。该技术结合了基于图像的细粒度结构化初始化(由当代图像生成模型直接提供)和基于LLM的实例级指令,使得生成的图像能够更好地遵循文本提示中的所有部分,包括对象数量、实例级属性以及实例间的空间关系。 (来源: HuggingFace Daily Papers)

💼 商业

清华系具身智能公司「千诀科技」完成数亿元Pre-A+轮融资: 具身大脑公司「千诀科技」近期完成新一轮Pre-A+轮融资,由钧山投资、祥峰投资和石溪资本投资,累计融资金额达数亿元。该公司由清华大学自动化系及相关AI研究机构的核心成员孵化,专注于研发通用型“具身大脑”系统,强调多模态实时感知、持续任务规划和自主执行能力,已在家庭服务、物流配送等场景实现产品级落地,并与多家头部机器人厂商、消费电子公司合作。 (来源: 36氪)

清华系具身大脑团队累计融资数亿规模,对标美国头部公司,已在行业头部厂商落地|硬氪首发

AI Agent或将重塑SaaS市场格局: 微软CEO纳德拉预言SaaS应用将在AI Agent时代面临颠覆,引发行业对AI Agent与SaaS未来的广泛讨论。AI Agent凭借其自主感知、决策和行动能力,有望解决传统SaaS在定制化、数据互通和用户体验方面的痛点,如通过自然语言交互自动创建工作流、跨应用整合数据、主动提供业务建议等。尽管目前AI Agent在企业级应用中面临LLM能力限制、成本、数据安全等挑战,但Salesforce、微软、用友等厂商已开始将AI Agent集成到SaaS产品中,探索融合或颠覆SaaS的新模式。 (来源: 36氪)

AI Agent,会是SaaS的终结者吗?

AI重塑薪酬管理:从数据分析到智能决策与沟通: 人工智能正深刻变革薪酬管理,光辉国际报告显示,AI在薪酬沟通、外部对标及职位技能架构方面的应用逐渐增多。未来,AI有望通过处理更大规模、更多样化的数据(包括社交平台、第三方调研),实现从数据驱动到智能决策的转型,如预测员工流失风险、评估激励效果、动态调整薪酬区间、实现个性化激励。同时,AI也面临数据隐私、算法“黑箱”、结果可信度等挑战。有效的薪酬沟通在数智时代更为重要,AI工具可辅助管理者进行系统性、个性化沟通,提升员工公平感和满意度。 (来源: 36氪)

🌟 社区

Sundar Pichai发布“深度思考”照片,预热Google I/O: 谷歌CEO Sundar Pichai在社交媒体发布了一张自己“深度思考”的照片,引发社区对即将召开的Google I/O大会的广泛期待。这张照片被多位AI领域的KOL转发和解读,普遍认为预示着谷歌将在AI领域,特别是Gemini模型及其应用方面,有重大发布。社区成员纷纷猜测可能的新功能、新模型或新战略。 (来源: demishassabis | YiTayML | zacharynado | lmthang | scaling01 | brickroad7 | jack_w_rae | TheTuringPost | shaneguML | op7418)

demishassabis

AI Agent编程能力引热议,Sama看好其自动完成未竟项目: OpenAI CEO Sam Altman对AI编程代理(如Codex)能够完成那些已进行80%但未最终完成的项目并进行自动维护表示期待。社区对不同AI编程代理(如Codex、Jules、Claude Code)的能力进行了比较和讨论,关注点包括任务规划能力、虚拟机环境(如是否联网)以及在复杂长期任务中的表现。普遍认为AI Agent在软件开发领域的潜力巨大,但各模型在具体实现和效果上仍有差异。 (来源: sama | mathemagic1an)

高校引入AI生成内容检测引发争议,《滕王阁序》被判AI率100%: 国内多所高校将“AI生成内容检测率”纳入论文评审,导致学生采用各种方法规避检测,教师在AI判决与人工判断间挣扎。AI检测工具因依赖数据库比对和模式化偏见,常将经典著作(如《滕王阁序》AI率100%,朱自清《荷塘月色》62.88%)及规范的学术写作误判为AI生成。此现象催生了“降AI率”的灰色产业链,引发对AI检测技术局限性、学术评价标准及教育本质的深刻反思。 (来源: 36氪)

《滕王阁序》AI生成率竟达100%,高校AI检测逼疯师生

AI时代成长起来的下一代思维方式引探讨: Reddit社区热议,在AI环境下成长起来的新一代儿童,其思维方式将与前几代人有显著不同。他们将习惯于与AI助手互动,学习重点可能从记忆事实转向提问和导航系统,从试错学习转向快速迭代。这种与机器逻辑的早期融合可能深刻重塑他们的好奇心、记忆、直觉乃至对智能本身的定义,引发关于其未来信念形成、系统构建能力以及对自身思想信任度的思考。 (来源: Reddit r/ArtificialInteligence)

AI在软件工程领域的快速发展引发开发者职位危机感: 一位42岁、曾年薪15万美元的软件工程师在被AI相关趋势淘汰后,投出800多份简历却鲜有面试机会,目前靠送外卖维生。其经历引发了关于AI(如GitHub Copilot, Claude, ChatGPT)是否已开始大规模取代程序员的讨论。Anthropic CEO曾预测AI将能生成绝大部分代码。尽管劳工统计局数据仍显示软件工程是增长最快的职业之一,但科技行业裁员潮持续,企业正利用AI降本增效,这促使人们反思社会应如何应对AI带来的结构性失业及“人+AI”协作新范式的构建。 (来源: 36氪)

42岁程序员被AI淘汰,曾年薪15万美元,如今800份简历打水漂、只能靠送外卖糊口……

AI算法中的性别偏见问题:“她数据”的隐形与缺失: 人工智能发展中,算法的性别偏见问题日益凸显。由于历史和社会原因,数据收集中女性数据代表性不足(如临床试验、维基百科条目),导致AI在医疗诊断、内容推荐等方面可能产生针对女性的偏差。例如,图像识别系统可能错误识别厨房中的男性为女性,搜索引擎图片结果强化性别刻板印象。AI行业的性别结构失衡也被认为是原因之一。解决此问题需从提升研发者意识、保障女性公平职业机会、完善法律法规、建立AI系统性别审计机制及优化算法(如数据重采样、因果推理应用)等多方面入手。 (来源: 36氪)

人工智能的“歧视”:“她数据”在算法运行中隐形

AI Agent引发SaaS行业变革讨论: 微软CEO纳德拉预测SaaS将在AI Agent时代面临颠覆,AI Agent凭借自主感知、决策及行动能力,有望解决SaaS在定制化、数据互通和用户体验上的痛点。例如,AI Agent可通过自然语言交互自动创建工作流、跨应用整合数据并主动提供业务建议。目前,Salesforce、微软、用友等SaaS厂商已开始集成AI Agent,探索融合或颠覆SaaS的新模式。尽管AI Agent在企业级应用中仍面临LLM能力、成本和数据安全等挑战,其变革潜力已引发行业广泛关注。 (来源: finbarrtimbers)

💡 其他

AI生成中国戏曲风格塔罗牌: 用户@op7418使用AI工具Lovart创作了一套中国戏曲风格的塔罗牌。其设计理念是将传统戏曲内容与对应塔罗牌所表达的寓意相结合,展示了AI在创意设计和文化融合方面的应用潜力。 (来源: op7418)

op7418

AI时代组织架构重塑:战略执行团队(SET)的崛起: 文章探讨了在AI加速发展的时代,传统组织架构难以适应AI带来的复杂性。提出以“战略执行团队”(SET)为核心的三层组织模型,旨在让AI成为团队一部分,通过合理的人机协作机制实现敏捷执行与智能扩展。SET负责将战略转化为跨部门行动、监控组织熵、灵活调整策略并统筹人、流程与AI代理的协作,以释放AI潜力,驱动战略落地。 (来源: 36氪)

设计在人工智能时代蓬勃发展的组织结构

众包事实核查能否遏制社交媒体虚假信息?: Mohamed bin Zayed人工智能大学教授Preslav Nakov探讨了Meta用Community Notes取代第三方事实核查员的影响。他认为,Community Notes(源于X的Birdwatch)这类众包模式有潜力,但内容审核需多种方法结合,包括自动过滤、众包和专业事实核查。类比垃圾邮件过滤和LLM处理有害内容,他指出每种方法各有优劣,应协同工作。研究表明Community Notes能放大专业事实核查员工作的影响,两者关注点不同但结论相似,可互为补充。 (来源: MIT Technology Review)

Can crowdsourced fact-checking curb misinformation on social media?