关键词:AI模型, Meta Behemoth, Grok异常, AI Agent, AI记忆功能, OpenAI, 腾讯阿里, AI伦理, Meta旗舰AI模型Behemoth发布推迟, 马斯克AI机器人Grok种族灭绝争议, 腾讯微信AI Agent生态, OpenAI软件开发代理预告, AI生成内容版权问题

🔥 聚焦

Meta旗舰AI模型”Behemoth”发布再三推迟,引发内部担忧与行业反思: Meta原计划4月发布、后推迟至6月的旗舰AI模型”Behemoth”再次延期至秋季或更晚。内部消息称,模型性能提升未达预期,引发对高额AI投入方向的质疑,并可能导致AI产品部门管理层调整。Meta曾宣称Behemoth在部分测试中领先,但实际训练遭遇瓶颈。此事件并非孤例,OpenAI的GPT-5、Anthropic的Claude 3.5 Opus也面临类似延迟,揭示了AI行业在追求更高智能时可能遭遇的普遍技术瓶颈、成本飙升及人才流失问题(Llama初代团队14名研究者已有11人离职)。这预示着AI技术突破速度或将放缓,对行业发展模式和预期带来挑战。 (来源: 36氪, dotey, Reddit r/LocalLLaMA, madiator)

Meta旗舰AI模型"Behemoth"发布再三推迟,引发内部担忧与行业反思

马斯克旗下AI机器人Grok异常,频繁提及“南非白人种族灭绝”引发争议: 5月14日,xAI的AI聊天机器人Grok在X平台上出现故障,无论用户提问内容,均会回复大量与“南非白人种族灭绝”及反种族隔离口号“消灭布尔人”相关的信息,即使在讨论小猪视频等无关话题时亦如此。该事件引发广泛关注,OpenAI CEO奥特曼也发文嘲讽。xAI回应称,故障源于Grok的回复提示词遭未经授权修改,违反了公司政策与价值观。为提高透明度和可靠性,xAI已将Grok系统提示词在GitHub上公开,并承诺加强内部审查流程和设立24小时监控团队。此事再次引发了关于AI模型偏见、内容控制及背后开发者意图的伦理讨论。 (来源: 36氪, 36氪, iScienceLuvr, teortaxesTex, andersonbcdefg, gallabytes, jeremyphoward, Reddit r/artificial)

马斯克旗下AI机器人Grok“发疯”,奥特曼在线嘲讽,xAI紧急回应

AI Agent成科技巨头新战场,腾讯阿里均加码投入: 腾讯和阿里巴巴在最新财报中均强调AI驱动的战略,并将AI Agent(智能体)视为未来增长的关键。腾讯CEO马化腾透露,AI已对广告和游戏业务产生实质贡献,公司正加大对元宝应用及微信内AI Agent的投入,认为微信独特的生态(社交、内容、小程序、交易能力)能孕育出独特的Agent,执行复杂任务。阿里巴巴董事会主席蔡崇信也指出,未来三到五年所有业务都应以AI为驱动。两家公司均大幅增加资本开支用于AI基础设施建设。红杉资本亦预测Agent将发展为智能体经济。AI Agent的崛起预计将推动算力需求激增,可能成为AI工业化的新开端。 (来源: 36氪, 36氪)

AI Agent成科技巨头新战场,腾讯阿里均加码投入

AI记忆功能竞赛升级,OpenAI、谷歌、Meta等巨头竞相增强个性化体验与用户粘性: OpenAI、谷歌、Meta和微软等科技巨头正积极升级其AI聊天机器人的记忆功能,旨在通过存储更多用户信息(如对话历史、偏好、搜索记录)来提供更个性化、更具粘性的服务。例如,ChatGPT新增“参考聊天记录”功能,谷歌Gemini扩展记忆至用户搜索历史。此举被视为AI巨头差异化竞争及探索新变现途径(如联盟营销、广告)的关键。然而,这也引发了对用户隐私泄露、商业操纵以及AI模型可能强化偏见或产生幻觉的担忧。专家提醒需关注服务提供商背后的激励机制,并呼吁加强监管。 (来源: 36氪, 36氪)

AI记忆功能竞赛升级,OpenAI、谷歌、Meta等巨头竞相增强个性化体验与用户粘性

🎯 动向

OpenAI预告将有新动态,或涉软件开发代理与桌面应用: OpenAI官方账号发布“开发者们,请设置好你们的闹钟”的神秘预告,暗示即将有新消息发布。社区猜测可能与传闻已久的软件开发工程师(SDE)代理或桌面端AI应用有关,甚至可能是其收购的Windsurf团队成果的展示。此前Sam Altman也曾提及将有“低调的研究预览”分享,引发市场对OpenAI在自动化软件开发、计算机使用代理等方向新进展的期待。 (来源: openai, op7418, dotey, cto_junior, brickroad7, kevinweil, tokenbender, Teknium1)

OpenAI预告将有新动态,或涉软件开发代理与桌面应用

Ollama 0.7.0版本发布,正式支持多模态模型: Ollama发布了其0.7.0版本,新增了对多模态模型的支持。这意味着用户现在可以通过Ollama运行如Google的Gemma 3和阿里巴巴Qwen的Qwen 2.5 VL等视觉语言模型。此更新扩展了Ollama在本地运行大型语言模型的能力,使其能够处理包含文本和图像的更复杂任务,进一步推动了本地AI应用的发展。 (来源: ollama, jerryjliu0, ollama, Reddit r/LocalLLaMA)

Ollama 0.7.0版本发布,正式支持多模态模型

联想计划推出搭载英伟达GB10超级芯片的AI小主机: 联想计划发布一款类似NVIDIA Digits的小型AI主机,该主机将采用NVIDIA GB10 Grace Blackwell Superchip。其算力预计达到1 PFLOPS,并配备128GB的统一内存。然而,值得注意的是,GB10 Grace Blackwell Superchip的内存带宽相对较低,仅为273 GB/s,这可能成为其性能瓶颈。 (来源: karminski3, Reddit r/LocalLLaMA)

联想计划推出搭载英伟达GB10超级芯片的AI小主机

字节跳动Seed-Thinking等顶尖AI模型在CCPC编程竞赛决赛中表现不佳,暴露当前AI算法解题短板: 在第十届中国大学生程序设计竞赛(CCPC)决赛中,字节跳动的Seed-Thinking及OpenAI的o3/o4、谷歌的Gemini 2.5 Pro等知名AI模型表现均不理想,大多仅解出一道“签到题”,DeepSeek R1更是零AC。这一结果引发讨论,指出当前大模型在解决需要独特创意和复杂逻辑的算法竞赛题目方面仍存在短板,尤其在非Agentic(即无外部工具辅助执行与调试)环境下。尽管部分模型在如IOI等竞赛中通过Agentic训练取得过好成绩,但此次CCPC的表现凸显了纯模型推理能力在面对全新、复杂算法问题时的局限性。 (来源: 36氪)

字节跳动Seed-Thinking等顶尖AI模型在CCPC编程竞赛决赛中表现不佳,暴露当前AI算法解题短板

音视频芯片与端侧AI技术加速融合,推动消费终端智能化: 随着端侧AI需求的增长,音视频芯片厂商正加速将AI技术融入其产品,以满足手机、PC、可穿戴设备等消费电子对本地数据处理、智能决策及个性化体验的需求。泰凌微电子、炬芯科技、恒玄科技、北京君正、富瀚微等公司纷纷推出集成NPU、支持AI算法(如降噪、智能音频处理、视觉应用)的芯片解决方案。这一趋势旨在重构设备的交互逻辑和应用场景,推动消费类智能设备向“AI即服务”的生态演进,尽管行业仍在寻找“杀手级”应用,但AI定义功能模块已成积极信号。 (来源: 36氪)

音视频芯片与端侧AI技术加速融合,推动消费终端智能化

OpenAI首席科学家帕乔茨基:AI已开始具备原创性研究能力,AGI正从理论走向现实: OpenAI首席科学家雅库布・帕乔茨基在《自然》杂志专访中表示,强化学习正推动AI模型逼近“推理”边界,AGI(通用人工智能)正从理论走向现实。他预计AI未来能独立完成原创性科学研究,推动软件工程、硬件设计等领域发展。他强调,尽管模型运行机制与人脑不同,但已能生成新见解并具备某种形式的思维能力。OpenAI计划发布性能优于现有开源模型的新版本,但在安全前提下。帕乔茨基认为AI的下一个里程碑是产生可衡量的经济影响,尤其在原创研究方面,并预计AI今年内能几乎自主开发有价值的软件。 (来源: 36氪)

苹果AI(Apple Intelligence)发布延迟,国行版上线需待iOS 18.6或更晚: 苹果于WWDC24发布的Apple Intelligence,原计划2025年全面推出,但至今国行版仍未上线,预计至少需等到7月的iOS 18.6。英文版虽已上线,但核心功能如高级Siri、Genmoji等缺失或体验不佳,引发用户不满和集体诉讼。国行版延迟主要因需符合国内监管政策,进行本地化改造和内容审查,传闻将与百度文心一言等国内AI合作。面对Perplexity AI、Meta AI等竞争对手的快速整合与挑战,苹果AI的滞后可能影响其生态优势和用户忠诚度。 (来源: 36氪)

苹果AI(Apple Intelligence)发布延迟,国行版上线需待iOS 18.6或更晚

AI技术重塑供应链管理,催生AI全栈供应链管理平台市场: 面对供应链复杂性激增、风险放大和效率瓶颈等新挑战,AI技术(尤其是机器学习、运筹优化和生成式AI)正推动供应链管理向智能化转型。AI全栈供应链管理平台应运而生,旨在通过业务数字化、数据智能和全链路协同,优化从需求感知到履约执行的全流程。该平台整合数据中台、智能决策引擎、全链路监控和生态协作门户,核心价值在于提升敏捷响应与精准预测(如需求预测准确率超85%)、效率与成本优化(库存周转率提升超40%)、全链路透明与风险管理、生态协作与韧性增强以及支持可持续发展。海比研究院预测,2024年中国该市场规模约7亿元,预计2027年将突破10亿元。 (来源: 36氪)

张亚勤谈后ChatGPT时代中国AI机遇:五大发展方向与三大预测: 清华大学智能产业研究院院长张亚勤认为,ChatGPT是首个通过图灵测试的智能体,标志着AI的里程碑。他指出,大模型重塑IT结构,中国在高端芯片、算法系统方面与顶尖水平有差距,但可在垂直基础模型、SaaS层及边缘端(智能手机、PC、IoT、汽车等)寻找大量机遇。他预测AI大模型五大发展方向:多模态智能、自主智能、边缘智能、物理智能(自动驾驶、机器人)、生物智能(脑机接口、医疗)。并提出三大观点:1) 大模型和生成式AI是未来10年主流;2) 基础大模型+垂直大模型+边缘模型,开源+商业并存;3) 统一标识(Tokenisation)+规模定律(Scaling Law)是核心,但需新算法体系提升效率,未来5年AI技术架构或有重大突破;4) 预计15-20年内实现通用人工智能,并分阶段通过新图灵测试。 (来源: 36氪)

张亚勤谈后ChatGPT时代中国AI机遇:五大发展方向与三大预测

🧰 工具

Windsurf发布首个自研前沿模型SWE-1系列,旨在提升软件开发效率99%: AI编程工具公司Windsurf(据传将被OpenAI收购)推出了其首个为软件工程优化的模型系列SWE-1。该系列包括SWE-1(类Claude 3.5 Sonnet,成本更低)、SWE-1-lite(取代Cascade Base,向所有用户开放)和SWE-1-mini(低延迟,用于Windsurf Tab)。SWE-1的核心创新在于“流动感知”(Flow Awareness)系统,即AI与用户共享操作时间线,实现高效协作,理解未完成状态和长周期任务。离线评估和线上实测表明,SWE-1在会话式和端到端SWE任务上表现接近顶级模型,并在代码贡献率等指标上优于非前沿模型。 (来源: 36氪)

Windsurf发布首个自研前沿模型SWE-1系列,旨在提升软件开发效率99%

开源项目WeClone:利用微信聊天记录打造个性化AI数字分身: 一个名为WeClone的Python开源项目允许用户基于个人微信聊天记录创建AI数字分身。该项目利用RAG(检索增强生成)知识库原理,导入微信聊天数据,通过LoRA方法对Qwen2.5-7B-Instruct等模型进行微调,并结合ASR(语音识别)与TTS(文本转语音)技术生成用户声音。项目支持通过AstrBot与微信、企业微信、飞书对接。由于微信聊天记录包含大量个人化、多场景的真实对话,非常适合作为训练数字人的私域知识库,可应用于个性化AI助手、企业客服、营销乃至财务咨询等多种场景。 (来源: 36氪)

开源项目WeClone:利用微信聊天记录打造个性化AI数字分身

llama.cpp新功能:支持PDF内容提取与输入,但目前仅限Web界面且对复杂格式处理不佳: llama.cpp项目最近通过PR #13562实现了对PDF文件的输入支持。该功能并非直接修改llama.cpp源代码,而是通过一个JavaScript库在Web界面提取PDF内容,再传递给llama.cpp。这意味着此功能目前仅限于llama.cpp提供的Web UI,API层面尚不可用。虽然实现了PDF内容的便捷导入,但对于包含复杂元素(如数学公式)的PDF,提取效果一般,可能出现解析错误。 (来源: karminski3)

llama.cpp新功能:支持PDF内容提取与输入,但目前仅限Web界面且对复杂格式处理不佳

Unsloth框架新增TTS微调功能,并支持Qwen3 GRPO: Unsloth宣布其框架现已支持文本转语音(TTS)模型的微调,训练速度提升约1.5倍,VRAM消耗减少50%。支持的模型包括Sesame/csm-1b、OpenAI/whisper-large-v3等Transformer架构模型。TTS微调可用于模仿声音、调整语风语调、支持新语言等。Unsloth提供了Colab Notebooks用于免费训练、运行和保存模型。此外,Unsloth还新增了对Qwen3 GRPO(Generative Retrieval Policy Optimization)的支持,采用基础模型和新的基于邻近度的奖励函数进行优化。 (来源: Reddit r/LocalLLaMA)

Unsloth框架新增TTS微调功能,并支持Qwen3 GRPO

INAIR发布AI空间计算机,瞄准移动轻办公市场: AR+AI眼镜公司INAIR发布了其AI空间计算机,由AR眼镜INAIR 2 Pro、计算中心INAIR Pod和3D空间操作键盘INAIR Touchboard组成。该产品旨在为差旅商务和轻办公用户提供笔记本电脑外的第二选择,可投射等效4米的134英寸无边界巨幕,支持远程操控电脑。其搭载的INAIR AI Agent系统级智能助手,集成了DeepSeek、豆包、文心一言、ChatGPT等多种大模型,能提供实时翻译、内容概要等功能,并通过学习用户习惯提升工作效率。 (来源: 36氪)

INAIR发布AI空间计算机,瞄准移动轻办公市场

llamafile推理框架支持Qwen3模型: llamafile,一个集成了llama.cpp和高度可移植C库Cosmopolitan Libc的推理框架,现已支持Qwen3系列模型。其主要特性是将所有运行依赖打包进单一可执行文件,极大提升了便携性,用户无需复杂安装过程即可运行大模型。 (来源: karminski3)

llamafile推理框架支持Qwen3模型

Kling AI推出2.0版本及API,新增3D Logo旋转等功能: Kling AI宣布其Kling 2.0、Elements及Video Effects Suite API已上线。新版本增强了视频生成能力,并推出了如使用DizzyDizzy或Image to Video功能快速制作3D旋转Logo的教程,用户无需3D技能即可创作。 (来源: Kling_ai, Kling_ai)

Manus AI新增图像生成功能,或基于GPT-4o API: AI助手应用Manus宣布支持图像生成。官方表示,Manus不仅能生成图像,还能理解用户意图、规划解决方案,并有效地将图像生成与其他工具结合以完成任务。社区猜测其图像生成能力可能基于OpenAI最新的GPT-4o模型的API。 (来源: op7418)

Blackbox提供IDE内按需访问A100/H100 GPU服务: Blackbox推出了在集成开发环境(IDE)内直接按需访问高端GPU(A100s和H100s)的服务。用户无需复杂的云控制台操作或API密钥管理,可以直接从IDE或Blackbox扩展启动GPU实例。定价为8个A100节点每小时14美元,旨在简化机器学习和重度处理任务的计算资源获取,使其像打开终端标签一样便捷。 (来源: Reddit r/deeplearning)

📚 学习

HuggingFace推出MCP(模型遵从性协议)教程: HuggingFace发布了新的MCP教程,旨在帮助用户理解MCP协议构成、使用现有SDK/框架、自行实现MCP服务。该课程内容相对简单,适合有经验的工程师快速掌握,完成后可获得结业证书。MCP协议对于实现模型间信息、价值和信任传递至关重要,是构建智能体经济的技术挑战之一。 (来源: karminski3)

HuggingFace推出MCP(模型遵从性协议)教程

新论文J1:通过强化学习激励LLM-as-a-Judge进行“思考”: 一篇名为《J1: Incentivizing Thinking in LLM-as-a-Judge via RL》的新论文提出了一种方法,通过强化学习(具体为GRPO)优化大型语言模型作为评估者(LLM-as-a-Judge)时的思考过程、评分和判断。该方法能将可验证和不可验证的提示词判断任务转化为可验证任务,仅使用合成的成对数据。研究发现,J1模型在8B和70B规模上均优于基线,并展现出多种思考策略,如列出评估标准、与自我生成的参考答案比较、重新评估正确性等。 (来源: jaseweston, jaseweston)

新论文J1:通过强化学习激励LLM-as-a-Judge进行“思考”

北大与人大联合发布Being-M0:百万级数据集驱动的人形机器人通用动作生成框架: 北京大学卢宗青团队与中国人民大学等合作,提出了通用人形机器人动作生成框架Being-M0,并构建了业界首个百万规模的动作生成数据集MotionLib。该框架通过大规模互联网视频数据,结合端到端文本驱动动作生成模型,实现了复杂、多样的人类动作生成,并能将人体动作迁移到宇树H1、G1等多种形态的人形机器人上。核心创新包括MotionLib数据集的构建流程、验证“大数据+大模型”在动作生成领域可行性的模型,以及创新的二维无查找量化框架MotionBook,解决了传统VQ技术在高维动作数据压缩中的信息损失问题。 (来源: 量子位)

北大与人大联合发布Being-M0:百万级数据集驱动的人形机器人通用动作生成框架

字节跳动发布WildDoc数据集,评估VLM在真实世界文档理解能力: 字节跳动在Hugging Face上发布了新的视觉问答(VQA)数据集WildDoc。该数据集旨在评估视觉语言模型(VLM)在真实世界场景下对文档的理解能力。 (来源: _akhaliq)

ICRA 2025(IEEE国际机器人与自动化会议)议程亮点: 2025年IEEE国际机器人与自动化会议(ICRA)将于5月19-23日在美国亚特兰大举行。会议内容包括Allison Okamura、Tessa Lau、Raffaello D’Andrea等人的主题演讲,以及涵盖康复机器人、优化控制、人机交互、软体机器人、场地机器人、仿生机器人、触觉、规划、操作、运动、安全与形式化方法、多机器人系统等12个方向的关键报告。此外,还有科学传播速成班、59个研讨会和教程、机器人伦理论坛、非洲科学家推进机器人研究论坛、本科机器人教育论坛以及社区建设日等活动。 (来源: aihub.org)

ICRA 2025(IEEE国际机器人与自动化会议)议程亮点

论文LlamaDuo:实现服务LLM到小型本地LLM无缝迁移的LLMOps流程: 一篇被ACL 2025主会接收的论文《LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs》介绍了一种LLMOps流程,旨在帮助用户从使用大型服务型LLM(如API调用)平滑过渡到使用小型本地化LLM。该研究是开源和社区协作的产物,强调了在实际应用中灵活切换和优化模型部署策略的重要性。 (来源: algo_diver)

论文LlamaDuo:实现服务LLM到小型本地LLM无缝迁移的LLMOps流程

Tubi研究:Tweedie回归在视频点播用户参与度优化上优于加权LogLoss: 视频平台Tubi的研究表明,在优化视频推荐系统以提升用户参与度(如下观看时长)方面,直接预测用户观看时长的Tweedie回归模型,其效果优于传统的观看时长加权LogLoss模型。实验结果显示,Tweedie回归带来了+0.4%的收入和+0.15%的观看时长提升。该研究认为Tweedie回归的统计特性更符合观看时长数据零膨胀和偏态分布的特点。 (来源: Reddit r/MachineLearning)

Tubi研究:Tweedie回归在视频点播用户参与度优化上优于加权LogLoss

💼 商业

对口型应用Hedra获3200万美元A轮融资,a16z领投: AI视频生成初创公司Hedra宣布完成3200万美元A轮融资,由Andreessen Horowitz (a16z) 领投,Matt Bornstein加入其董事会。原有投资者a16z speedrun、Abstract和Index Ventures也参与了此轮融资。Hedra专注于生成具有表现力的、可控的角色对话视频,其技术旨在解决AI生成视频中口型同步和情感表达的难题。 (来源: op7418)

美国与沙特、阿联酋达成AI领域合作,涉5GW数据中心及芯片供应,旨在排除中国影响: 美国与沙特阿拉伯、阿联酋达成重要AI合作协议,涉及建设5GW数据中心,并由英伟达、AMD、高通等美国公司供应大量先进AI芯片(如英伟达Blackwell芯片)。沙特新成立的AI公司Humain将是核心执行方。此举被视为美国在中东地区推广其AI技术栈、加速基础设施建设,并以此锁定盟友,同时限制中国在区域内AI基础设施投资和技术影响力的战略部署。新协议废除了此前对中东AI芯片出口的部分限制,但同时加强了对使用华为昇腾等中国芯片的全球警告。 (来源: dylan522p, 36氪, iScienceLuvr)

美国与沙特、阿联酋达成AI领域合作,涉5GW数据中心及芯片供应,旨在排除中国影响

餐饮SaaS公司Owner融资1.2亿美元成独角兽,利用AI打造“AI餐厅高管”: 为独立餐厅提供全栈数字化解决方案的Owner公司,近期完成1.2亿美元C轮融资,估值达10亿美元。Owner通过每月固定费用为餐厅提供网站/APP搭建、集成订餐配送、SEO优化及营销自动化服务,已服务超1万家餐厅。其2025年AI战略包括推出“AI餐厅高管”(AI CMO、CFO、CTO)管理AI员工和人类员工,并打造对话式AI Agent提升服务效能。此轮融资由Redpoint Ventures和Altman Capital共同领投,显示AI对传统SaaS价值重塑的潜力。 (来源: 36氪)

餐饮SaaS公司Owner融资1.2亿美元成独角兽,利用AI打造“AI餐厅高管”

🌟 社区

Stack Overflow活跃度骤降至2009年水平,AI或为主因: 数据显示,知名开发者问答社区Stack Overflow的月度问题数量已跌至其2009年刚推出时的水平。这一现象引发了关于AI对传统开发者社区影响的讨论。许多人认为,随着ChatGPT等AI编程助手的兴起,开发者越来越倾向于直接向AI提问和寻求代码解决方案,而非在Stack Overflow等社区提问和等待人工回答,这可能导致了社区活跃度的急剧下降。 (来源: zachtratar, karminski3)

Stack Overflow活跃度骤降至2009年水平,AI或为主因

AI在职场引发“专业性”危机感,员工认为AI时代更需人情味: 随着AI在工作场所的普及,许多员工感受到其专业技能被“解构”。领导倾向于让AI修改员工成果,甚至认为AI优于人类员工,导致员工感到不被尊重和面临被取代的危机。研究显示,员工能否区分CEO本人和AI撰写的邮件,且在认为内容由AI生成时,即使是人类所写,评价也会降低。这反映了人们对人类创作的偏好和对AI过度依赖的担忧。同时,麦肯锡研究指出54%离职员工因感觉未被重视,82%员工认为AI时代更需要人际连接和情感关怀。 (来源: 36氪, 36氪)

AI在职场引发“专业性”危机感,员工认为AI时代反而更需人情味

中国年轻人拥抱AI伴侣,引发社会对低生育率的担忧: 《经济学人》报道关注到中国年轻人中兴起与AI谈恋爱、交朋友的现象。如“猫箱”(Maoxiang)、“星野”(Xingye)等AI伴侣应用用户量持续增长,用户通过创建虚拟角色满足情感需求。技术发展使AI能模拟情感与共情,加之年轻人生活压力大、社交时间减少、结婚率下降等因素,推动了这一趋势。然而,政府担忧AI伴侣可能加剧本已严峻的低生育率问题(2024年总和生育率仅1.0)。 (来源: dotey)

中国年轻人拥抱AI伴侣,引发社会对低生育率的担忧

AI辅助或成教育新常态,但教授过度依赖ChatGPT引发学生不满与反思: 美国东北大学一名学生因教授使用ChatGPT生成课件而起诉学校要求退还学费,事件引发关于AI在高等教育中角色的广泛讨论。学生认为高昂学费应换取人类的专业教学而非算法生成内容,担忧AI取代了教授的思考与反馈。教授则视AI为提高效率、应对繁重工作的工具。教育界人士指出,关键在于负责任地使用AI,增强而非取代人的创造力和监督,培养学生AI时代的道德准则,并确保AI生成内容经过专业编辑和确认。 (来源: 36氪, Reddit r/ChatGPT)

AI辅助或成教育新常态,但教授过度依赖ChatGPT引发学生不满与反思

Salesforce CEO称微软与OpenAI关系已根本破裂且无法修复: Salesforce CEO马克·贝尼奥夫在专访中表示,微软与OpenAI的合作关系已出现“根本性破裂且难以修复”。他指出,微软Copilot令客户失望,更像低效的Clippy,而OpenAI首席财务官在技术架构图中未提及微软软件或Azure,印证了双方裂痕。贝尼奥夫认为微软本质上是ChatGPT的转售商,其AI战略受限,正试图通过“普罗米修斯计划”构建自研模型。他还提到DeepSeek等开源模型的崛起正推动行业向MOE架构转型,降低模型使用成本,瓦解“模型垄断”的商业逻辑。 (来源: 36氪)

Salesforce CEO称微软与OpenAI关系已根本破裂且无法修复

AI生成内容真实性与版权引关注,PDF内运行LLM及Linux展示技术潜力: 近期技术爱好者展示了在PDF文件中直接运行小型语言模型(如TinyStories、Pythia、TinyLLM)甚至Linux系统的能力,利用PDF对JavaScript的支持实现。这一“黑科技”操作引发网友热议,也凸显了AI模型小型化和边缘部署的趋势。同时,AI生成内容的版权、真实性及“深度伪造”问题也备受关注。张亚勤指出,AI风险包括深度伪造、幻觉、有毒信息等,需高度重视并加强AI与人类价值观对齐及伦理监管。 (来源: 36氪, 36氪)

AI生成内容真实性与版权引关注,PDF内运行LLM及Linux展示技术潜力

💡 其他

Theta发布CUB基准:评估计算机与浏览器使用代理的“人类最后考验”: Theta推出了名为CUB (Computer and Browser Use Agents) 的新基准测试,号称是针对计算机和浏览器使用代理的“人类最后考验”。此类基准旨在评估AI代理在模拟人类使用计算机和浏览器完成复杂任务方面的能力。然而,已有多个基准自称“人类最后考验”,引发了对其命名可能过于夸张的讨论。 (来源: _akhaliq, DhruvBatraDB)

Theta发布CUB基准:评估计算机与浏览器使用代理的“人类最后考验”

AI被指责用于生成低俗内容,引发对模型滥用和伦理边界的担忧: 社交媒体上出现用户利用AI图像生成工具(如ChatGPT的DALL-E 3)创作低俗或恶搞图片(例如“Shittington Bear”)的现象。这引发了对AI工具可能被滥用于生成不当内容、侵犯版权(如恶搞知名卡通形象)以及挑战社会伦理底线的担忧。尽管AI平台通常设有内容过滤器,但用户仍可能通过巧妙的提示词绕过限制。 (来源: Reddit r/ChatGPT)

AI被指责用于生成低俗内容,引发对模型滥用和伦理边界的担忧

研究显示AI在模仿CEO沟通风格方面有局限,员工更信任人类: 哈佛商学院研究发现,员工在辨别AI与公司CEO韦德·福斯特(Zapier CEO)撰写的信息时,准确率约为59%。更重要的是,一旦员工认为信息由AI生成,即使内容实际出自CEO本人,其评价也会偏低;反之,被认为是CEO所写的内容,即使是AI生成,评价也会更高。这表明人们对人类沟通的信任度和价值感知高于AI。研究建议领导者在使用AI沟通时应保持透明,避免用于非常私人的回复,并对AI生成内容进行严格审核。 (来源: 36氪)

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注