키워드:NVIDIA, AI 공장, AI 인프라, OpenAI, GPT 게이트, Siri, AI 클라우드 시장, NVIDIA AI 생산성 전환, OpenAI 모델 전환 논란, 애플 Siri AI 업그레이드, 중국 AI 클라우드 시장 경쟁, AI 인재 확보 전쟁

🔥 포커스

NVIDIA, AI 산업 재편: 칩 판매에서 ‘AI 생산 능력 판매’로 : NVIDIA CEO 젠슨 황은 최근 인터뷰에서 범용 컴퓨팅 시대는 끝났으며, AI 수요는 이중 지수적 성장을 겪고 있고, 추론(inference) 수요는 10억 배 증가할 것으로 예상된다고 언급했습니다. NVIDIA는 칩 공급업체에서 ‘AI 인프라 파트너’로 전환하고 있으며, OpenAI 등과 협력하여 10GW급 ‘AI 공장’을 건설하고, 칩부터 소프트웨어, 시스템, 네트워크에 이르는 ‘최고의 협업 설계’를 제공하여 단위 에너지 소비당 최고 성능을 달성하고 있습니다. 그는 이러한 풀스택(full-stack) 최적화 능력이 핵심 경쟁 장벽이며, NVIDIA가 AI 산업 혁명에서 주도적인 위치를 차지하고 AI 인프라 시장을 4천억 달러에서 1조 달러 규모로 확장할 것으로 전망했습니다. (출처: 36氪, 36氪, Reddit r/artificial)

黄仁勋:1000 亿美元、10GW,从卖卡到“卖 AI 产能”

OpenAI ‘GPT 게이트’ 사건 촉발: 유료 사용자 비밀리에 성능 하향 및 모델 전환 : OpenAI는 사용자 대화를 비공개 ‘안전’ 모델(gpt-5-chat-safety 및 5-a-t-mini)로 비밀리에 라우팅했다는 비난을 받고 있으며, 특히 감정적이거나 민감한 콘텐츠를 감지했을 때 이러한 행위가 발생했습니다. AIPRM 수석 엔지니어에 의해 확인되고 광범위한 사용자 피드백을 촉발한 이 행위는 모델 성능 저하를 야기했으며, 사용자는 인지하거나 동의하지 않은 상태에서 모델이 전환되었습니다. OpenAI 부사장은 이를 임시 보안 테스트라고 주장했지만, 이 조치는 투명성, 사용자 자율성, 잠재적 사기 행위에 대한 강력한 의문을 불러일으켰고, 많은 사용자가 구독을 취소하고 ‘AI 사용자 권리’ 제정을 요구하게 만들었습니다. (출처: 36氪, 36氪, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT)

OpenAI「GPT门」事件引爆,Plus、Pro账户统统降配,偷换模型全网实锤

Apple, 2026년 Siri 재탄생에 베팅: 시스템 레벨 AI와 서드파티 모델 융합 : Apple은 내부 ChatGPT 유사 애플리케이션 ‘Veritas’와 ‘Linwood’ 시스템을 통해 Siri를 전면적으로 재편하고 있으며, 목표는 상황 인지 대화와 심층적인 애플리케이션 상호작용을 구현하는 것입니다. iOS 26.1 베타 버전 코드는 Apple이 App Intents에 MCP(Model Context Protocol) 지원을 도입하고 있음을 보여주며, 이는 ChatGPT, Claude 등 호환 가능한 AI 모델이 Mac, iPhone 및 iPad 앱과 직접 상호작용할 수 있도록 할 것입니다. 이러한 움직임은 Apple이 ‘풀스택 자체 개발’에서 ‘플랫폼화’ 노선으로 전환하고 있음을 의미하며, 서드파티 모델 통합을 통해 개인 정보 보호 및 사용자 경험 일관성을 보장하면서 AI 생태계 발전을 가속화하고 있습니다. 새로운 Siri는 2026년 초에 공개될 예정입니다. (출처: 36氪, 36氪)

iOS 26.1 隐藏彩蛋曝光,苹果给 ChatGPT 们造了个新「C 口」

힌튼의 예측 빗나감: AI가 방사선 전문의를 대체하지 못하고 오히려 더 바쁘게 만들어 : 2016년, AI의 아버지 Geoffrey Hinton은 AI가 5년 내에 방사선 전문의를 대체할 것이며, 교육을 중단해야 한다고 예측했습니다. 그러나 거의 10년이 지난 지금, 미국 방사선 전문의 수는 물론 평균 연봉(최고 52만 달러)도 사상 최고치를 기록했습니다. 실제 임상 환경에서 AI의 성능 저하, 법적 규제 저항, 그리고 의사 업무의 극히 일부만 커버한다는 점이 주요 원인입니다. 이는 ‘제본스의 역설(Jevons paradox)’을 보여줍니다. AI가 영상 판독 효율성을 높였지만, 오히려 의사의 감독, 소통 및 비진단적 업무에 대한 수요를 증가시켜 의사들의 업무량을 늘렸고, 그들을 대체하지는 못했습니다. (출처: 36氪)

Hinton预言错了,年薪狂飙52万美元,AI没有「干掉」放射科医生

🎯 동향

DeepMind Veo 3, ‘프레임 체인’ 개념 발표, 비디오 모델의 범용 시각 이해 촉진 : DeepMind의 Veo 3 비디오 모델은 대규모 언어 모델의 사고의 사슬(CoT)에 비유되는 ‘프레임 체인(CoF)’ 개념을 도입하여, 제로샷(zero-shot) 시각 추론을 가능하게 합니다. Veo 3는 시각 세계를 인지, 모델링 및 조작하는 강력한 능력을 보여주며, 머신 비전 분야의 ‘범용 기반 모델’이 될 것으로 기대됩니다. 연구는 모델 능력의 빠른 향상과 비용 하락에 따라 비디오 모델 분야에서 ‘제너럴리스트가 스페셜리스트를 대체할 것’이라고 예측하며, 비디오 생성 및 이해가 급속한 발전의 새로운 단계로 진입하고 있음을 시사합니다. (출처: 36氪, shlomifruchter, scaling01, Reddit r/artificial)

DeepMind率先提出CoF:视频模型有自己的思维链

ChatGPT Pulse 출시: AI, 수동적 질의응답에서 능동적 서비스로 전환 : OpenAI는 ChatGPT Pro 사용자에게 ‘Pulse’ 기능을 출시했으며, 이는 ChatGPT가 수동적인 질의응답 도구에서 사용자 요구를 능동적으로 예측하는 개인 비서로 진화하고 있음을 나타냅니다. Pulse는 매일 밤 ‘비동기 연구’를 통해 사용자 채팅 기록, 기억 및 외부 애플리케이션(예: Gmail, Google Calendar)을 결합하여 이른 아침에 개인화된 ‘일일 브리핑’을 푸시합니다. 이는 OpenAI가 ‘지능형 에이전트 AI’ 분야에서 중요한 발걸음을 내딛었음을 의미하며, AI 어시스턴트가 사용자 목표를 이해하고 프롬프트 없이 능동적으로 서비스를 제공하여 새로운 인간-컴퓨터 상호작용 패러다임을 열고자 합니다. (출처: 36kr)

ChatGPT“开窍”了,新Pulse功能上线,你的AI不再坐等指令

강화 학습의 아버지 Sutton: 대규모 언어 모델은 잘못된 시작점이다 : 강화 학습의 아버지 Richard Sutton은 인터뷰에서 대규모 언어 모델(LLM)이 진정한 지능으로 가는 잘못된 시작점이라고 주장했습니다. 그는 진정한 지능은 ‘경험 학습’에서 비롯된다고 보았습니다. 즉, 행동, 관찰 및 피드백을 통해 목표 달성을 위해 행동을 지속적으로 수정하는 것이며, LLM의 예측 능력은 인간 행동의 모방일 뿐 독립적인 목표와 외부 세계 변화에 대한 ‘놀라움’ 능력이 부족하다고 말했습니다. 이러한 관점은 AGI(범용 인공지능) 개발 경로에 대한 심도 깊은 논쟁을 촉발했으며, 현재 LLM이 주도하는 AI 패러다임에 의문을 제기했습니다. (출처: 36kr, paul_cal, algo_diver, scaling01, rao2z, bookwormengr, BlackHC, rao2z)

强化学习之父:大语言模型是一个错误的起点

중국 AI 클라우드 시장 경쟁 심화: Alibaba Cloud 선두, Volcengine 고속 추격 : 2025년 중국 ‘AI 클라우드’ 시장 경쟁이 치열하며, Alibaba Cloud는 AI IaaS, PaaS, MaaS를 포함한 전체 매출 규모에서 선두를 유지하고 있습니다. 그러나 ByteDance 산하의 Volcengine은 MaaS(Model as a Service) Token 호출 시장에서 지배적인 위치를 차지하며 시장 점유율이 거의 절반에 달하고, 놀라운 성장세로 Alibaba Cloud의 가장 큰 경쟁자가 되었습니다. Baidu AI Cloud는 AI 퍼블릭 클라우드 서비스(소프트웨어 제품 및 솔루션) 시장에서 Alibaba Cloud와 공동 1위를 차지했습니다. 시장은 다차원적인 경쟁 양상을 보이며, Token 호출량이 기하급수적으로 증가하여 미래 AI 클라우드 시장의 거대한 성장 잠재력과 판도 재편을 예고합니다. (출처: 36氪)

中国AI云市场,究竟谁是“第一”?

AI 인재 쟁탈전 심화: 고액 연봉과 H-1B 비자 도전 과제 공존 : AI 인재 시장은 계속해서 뜨겁게 달아오르고 있으며, Xpeng Motors는 2026년에 3,000명 이상의 신입사원을 채용할 것이라고 발표했습니다. 최고 연봉은 160만 위안에 달하며, 우수 인재에게는 상한선이 없습니다. Meta는 최고의 AI 인재를 유치하기 위해 2억 달러가 넘는 천문학적인 총 보상 패키지를 제시했으며, NVIDIA와 OpenAI도 인수 및 스톡옵션 인센티브를 통해 인재를 확보하고 있습니다. 그러나 미국 H-1B 비자 정책 강화(예: 10만 달러의 추가 비용)는 외국인 고숙련 인재가 실리콘밸리에 머무는 데 어려움을 초래하며, 기술 대기업들의 인재 유출 우려를 불러일으켜 글로벌 AI 인재 경쟁의 치열함과 복잡성을 부각시킵니다. (출처: 36kr, 36kr)

H-1B 设置10万美元门槛,华人留在硅谷更难了

🧰 도구

Zhipu AI GLM-4.5-Air: 고성능-고효율 도구 호출 모델 : Zhipu AI의 GLM-4.5-Air 모델(106B 파라미터, 12B 활성 파라미터)은 도구 호출(tool calling)에서 Claude 4 수준에 근접하는 뛰어난 성능을 보였지만, 비용은 90% 절감되었습니다. 이 모델은 추론(inference) 단계에서 환각(hallucination)을 현저히 줄여 도구 호출의 신뢰성을 높였으며, 심층 연구 워크플로우를 더욱 안정적이고 효율적으로 만들어 개발자에게 고성능-고효율 LLM 솔루션을 제공합니다. (출처: bookwormengr)

bookwormengr

KAT-Dev-32B: 소프트웨어 엔지니어링 작업을 위해 설계된 32B 파라미터 모델 : KAT-Dev-32B는 소프트웨어 엔지니어링 작업에 특화된 32B 파라미터 모델입니다. 이 모델은 SWE-Bench Verified 벤치마크 테스트에서 62.4%의 해결률을 달성했으며, 다양한 규모의 오픈소스 모델과 비교했을 때 성능 면에서 5위를 차지하여 오픈소스 LLM이 코드 생성, 디버깅 및 개발 워크플로우에서 상당한 발전을 이루었음을 보여줍니다. (출처: _akhaliq)

_akhaliq

GPT-5: 다중 에이전트 시스템의 탁월한 코디네이터 : GPT-5는 다중 에이전트 시스템의 뛰어난 코디네이터로 평가받으며, 특히 코딩 외의 고객 지원과 같은 분야에 적합합니다. 이 모델은 의도를 깊이 이해하고, 방대한 데이터를 효율적으로 처리하며, 정보 공백을 메울 수 있어 복잡한 다중 검색 시스템 관리에서 탁월한 성능을 발휘합니다. Claude 4(비용 문제) 및 Gemini 2.5 Pro와 비교했을 때, GPT-5(GPT-5-mini 포함)는 일관성과 도구 호출(tool calling) 정확성 면에서 우위를 보여 고급 에이전트 시스템 개발에 강력한 지원을 제공합니다. (출처: omarsar0)

omarsar0

Tencent Hunyuan HunyuanImage 3.0: 오픈소스 텍스트-이미지 대규모 모델의 새로운 기준 : Tencent Hunyuan 팀은 800억 개 이상의 파라미터를 가진 오픈소스 텍스트-이미지 모델 HunyuanImage 3.0을 발표했으며, 추론(inference) 시 130억 개의 파라미터가 활성화됩니다. 이 모델은 Transfusion-based MoE 아키텍처를 채택하고 Diffusion 및 LLM 훈련과 깊이 결합되어 강력한 세계 지식 추론, 복잡한 천 자 수준의 프롬프트 이해 및 이미지 내 정확한 텍스트 생성 능력을 갖추고 있습니다. HunyuanImage 3.0은 그래픽 디자인 및 콘텐츠 제작 프로세스를 혁신하는 것을 목표로 하며, 향후 이미지-이미지 생성, 이미지 편집 등 다양한 멀티모달(multimodal) 상호작용을 지원할 계획입니다. (출처: nrehiew_, jpt401)

HunyuanImage 3.0: Largest & Most Powerful Open-Source Text-to-Image Model

DRAG 프레임워크: RAG 모델의 어휘 다양성 이해도 향상 : ACL 2025는 ‘어휘 다양성’을 RAG의 검색 및 생성 프로세스에 처음으로 도입한 Lexical Diversity-aware RAG(DRAG) 프레임워크를 제안했습니다. DRAG는 쿼리(query) 의미를 불변, 가변 및 보충 구성 요소로 분할하고, 차별화된 전략을 사용하여 관련성 평가 및 위험 희소성 보정을 수행합니다. 이 방법은 RAG 정확도를 크게 향상시켰으며(예: HotpotQA에서 10.6% 향상), 여러 벤치마크에서 SOTA를 경신하여 정보 검색 및 질의응답 시스템에 중요한 가치를 제공하고 복잡한 인간 언어를 더욱 정확하게 이해할 수 있도록 합니다. (출처: 量子位)

让RAG真正读懂“言外之意”!新框架引入词汇多样性,刷新多项基准SOTA

Tencent Hunyuan Hunyuan3D-Part: 업계 최초 고품질 네이티브 3D 컴포넌트 생성 모델 : Tencent Hunyuan 3D 팀은 고품질의 의미론적으로 분해 가능한 3D 컴포넌트를 생성할 수 있는 업계 최초의 모델인 Hunyuan3D-Part를 출시했습니다. 이 모델은 네이티브 3D 분할 모델 P3-SAM과 산업용 컴포넌트 생성 모델 X-Part를 통해 고충실도(high-fidelity) 및 구조적으로 일관된 3D 부품 생성을 달성했습니다. 이러한 돌파구는 비디오 게임 제작 파이프라인 및 3D 프린팅 산업에 중요한 의미를 가지며, 복잡한 기하학적 형태를 단순한 컴포넌트로 분해하여 후속 처리의 어려움을 크게 줄이고 모듈식 조립을 지원합니다. (출처: 量子位)

业界首个高质量原生3D组件生成模型来了!来自腾讯混元团队

TinyWorlds: 300만 파라미터로 DeepMind 세계 모델 복제, 실시간 상호작용 픽셀 게임 구현 : X 블로거 anandmaj는 한 달 만에 DeepMind Genie 3의 핵심 아이디어를 복제하여 TinyWorlds를 개발했습니다. 이 300만 파라미터의 세계 모델은 Pong, Sonic, Zelda, Doom과 같은 플레이 가능한 픽셀 스타일 게임 환경을 실시간으로 생성할 수 있습니다. 이 모델은 시공간 트랜스포머(transformer)와 비디오 토크나이저(tokenizer)를 통해 비디오 정보를 캡처하여 상호작용 가능한 픽셀 세계 생성을 구현했으며, 실시간 세계 생성 분야에서 소규모 모델의 엄청난 잠재력을 보여주고 코드 오픈소스를 지원합니다. (출처: 36氪)

大神爆肝一个月,复刻DeepMind世界模型,300万参数就能玩实时交互像素游戏

OpenWebUI, MCP 네이티브 지원: LLM 도구 통합의 새로운 패러다임 : OpenWebUI의 최신 업데이트는 Model Context Protocol (MCP) 서버를 네이티브로 지원하며, 사용자는 이제 HuggingFace MCP와 같은 외부 도구를 통합할 수 있습니다. 이 기능은 LLM과 외부 데이터 소스 및 도구의 연결 방식을 표준화하여 AI 애플리케이션 생태계를 확장하고, 사용자가 OpenWebUI 인터페이스에서 다양한 AI 도구를 더욱 유연하고 효율적으로 활용할 수 있도록 합니다. (출처: Reddit r/LocalLLaMA, Reddit r/OpenWebUI)

Native MCP now in Open WebUI!

LangChain과 Oxylabs 협력: AI 기반 웹 스크래핑 솔루션 구축 : LangChain과 Oxylabs는 LangChain의 지능과 Oxylabs의 스크래핑 인프라를 결합하여 AI 기반 웹 스크래핑 솔루션을 구축하는 방법을 보여주는 가이드를 발표했습니다. 이 솔루션은 다국어 및 다양한 통합 방법을 지원하여 AI 에이전트가 IP 차단 및 CAPTCHA와 같은 일반적인 웹 액세스 문제를 극복하고, 더 효율적인 실시간 데이터 검색을 가능하게 하여 에이전트 워크플로우를 강화합니다. (출처: LangChainAI)

LangChain + Oxylabs Guide

오픈소스 LLM 평가 도구 Opik: AI 애플리케이션의 포괄적인 모니터링 및 디버깅 : Opik은 LLM 애플리케이션, RAG 시스템 및 에이전트 워크플로우를 디버깅, 평가 및 모니터링하도록 돕기 위해 새로 출시된 오픈소스 LLM 평가 도구입니다. 이 도구는 포괄적인 추적, 자동화된 평가 및 프로덕션 수준 대시보드를 제공하여 AI 시스템 성능 및 신뢰성 개선을 위한 핵심 통찰력을 제공합니다. (출처: dl_weekly)

📚 학습

Cursor Learn: 무료 AI 기초 비디오 강좌 : Cursor Learn은 초보자를 위해 설계된 6부작 무료 AI 기초 비디오 강좌를 출시했으며, Token, 컨텍스트(context) 및 에이전트(agent)와 같은 핵심 개념을 다룹니다. 강좌에는 퀴즈와 대화형 AI 모델이 포함되어 있으며, 에이전트 협업 및 컨텍스트 관리와 같은 고급 주제를 포함하여 한 시간 내에 AI 기초 지식을 제공하는 것을 목표로 합니다. 이는 AI 입문을 위한 귀중한 자료입니다. (출처: cursor_ai, op7418)

Cursor Learn

엄선된 AI/ML GitHub 코드 저장소: PyTorch, TensorFlow 등 프레임워크 포함 : GitHub에는 PyTorch, TensorFlow, FastAI 등 여러 딥러닝 프레임워크의 실습 노트북을 포함하는 엄선된 AI/ML 코드 저장소 시리즈가 공유되었습니다. 이 자료들은 컴퓨터 비전, 자연어 처리, GANs, Transformer, AutoML 및 객체 탐지(object detection)와 같은 분야를 다루며, 학습자와 실무자에게 풍부한 학습 자료를 제공하여 기술 탐색 및 프로젝트 개발에 기여합니다. (출처: Reddit r/deeplearning)

A curated set of AI/ML GitHub repos — PyTorch, TensorFlow, FastAI, Object Detection and more

무료 전자책: 《Python 데이터 구조 입문》 : 《A First Course on Data Structures in Python》이라는 무료 전자책이 현재 출시되었습니다. 이 책은 데이터 구조, 알고리즘적 사고, 복잡도 분석, 재귀/동적 프로그래밍 및 검색 방법 등 AI 및 머신러닝에 필요한 기본 구성 요소를 제공하며, AI 기초 지식 학습을 위한 귀중한 자료입니다. (출처: TheTuringPost)

TheTuringPost

LLM 과학자 및 데이터 과학자 로드맵 발표 : LLM 과학자 및 데이터 과학자 직업 개발을 위한 상세 로드맵이 발표되었습니다. 이 자료들은 인공지능, 머신러닝 및 데이터 과학 분야에 진입하거나 발전하는 데 필요한 기술, 도구 및 학습 경로를 개괄하여, 지망생들에게 명확한 직업 계획 지침을 제공합니다. (출처: Ronald_vanLoon, Ronald_vanLoon)

Ronald_vanLoon

A16Z Speedrun 2026: AI 및 엔터테인먼트 분야 스타트업 액셀러레이터 : A16Z Speedrun 2026은 AI 및 엔터테인먼트 분야 스타트업 창업자들의 신청을 받고 있습니다. 이 프로그램은 자체 기업 설립에 집중하는 창업자들을 지원하며, 빠르게 발전하는 AI 기반 제품 분야에서 성장하고자 하는 창업자들에게 기회가 될 것입니다. (출처: yoheinakajima)

💼 비즈니스

MiniMax 저작권 소송: AI 유니콘의 IPO 여정에 드리운 그림자 : 40억 달러 이상의 가치를 지닌 중국 AI 유니콘 MiniMax는 Disney, Universal Pictures 및 Warner Bros.의 공동 저작권 소송에 직면해 있습니다. 소송은 MiniMax의 비디오 생성 도구인 ‘Haila AI’가 사용자 프롬프트(prompt)를 통해 저작권 보호를 받는 캐릭터를 포함한 콘텐츠를 생성하여 체계적인 침해를 구성한다고 주장합니다. 이 사건은 MiniMax의 IPO 계획에 치명적인 타격을 주며, 생성형 AI 시장에서 지적 재산권 준수의 심각한 도전과 기술 혁신 및 법적 한계 사이의 균형의 중요성을 부각시킵니다. (출처: 36氪)

版权诉讼下的MiniMax:AI独角兽的上市迷途

AI 물류 회사 Augment, 8,500만 달러 투자 유치, 출시 5개월 만에 총 8억 위안 조달 : AI 물류 회사 Augment는 출시 5개월 만에 8,500만 달러 규모의 시리즈 A 투자를 성공적으로 완료하여 총 1억 1천만 달러(약 8억 위안)의 자금을 조달했습니다. 이 회사의 AI 에이전트 제품 Augie는 주문 접수부터 대금 회수까지 전체 물류 라이프사이클에서 복잡하고 파편화된 작업을 자동화할 수 있으며, 이미 수십 개의 최고 서드파티 물류 회사 및 화주를 위해 350억 달러 이상의 화물 가치를 관리하고 수백만 달러를 절약해 주어, 노동 집약적인 물류 분야에서 AI의 강력한 상업적 가치를 보여주었습니다. (출처: 36氪)

AI物流火了,上线5个月,拿下8亿融资

Microsoft, Anthropic의 Claude 모델을 Copilot에 통합 : Microsoft는 기업 사용자를 위해 Copilot 어시스턴트에 Anthropic의 Claude Sonnet 4 및 Opus 4.1 모델을 통합했습니다. 이러한 움직임은 OpenAI에 대한 단일 의존도를 낮추고, Microsoft가 중립적인 플랫폼 제공업체로서의 입지를 강화하는 것을 목표로 합니다. 기업 사용자는 이제 OpenAI와 Anthropic 모델 중에서 선택할 수 있어 유연성이 향상되었으며, 기업 AI 시장의 경쟁을 촉진할 것으로 기대됩니다. (출처: Reddit r/deeplearning)

🌟 커뮤니티

AI가 인간의 이해와 사회에 미치는 영향: 효율성과 ‘정보 거품’의 역설 : 커뮤니티는 AI가 소셜 미디어처럼 인간의 이해력, 비판적 사고 및 삶의 목표에 부정적인 영향을 미칠 수 있다고 널리 우려하고 있습니다. 콘텐츠 생성을 ‘진실’이나 ‘깊이’보다는 ‘확산’에 최적화함으로써, AI는 ‘학습 정체기’와 ‘무한 쓰레기 기계’로 이어질 수 있습니다. 이는 AI 발전을 중독성 도구가 아닌 성장형 도구로 이끌 방법에 대한 논의를 촉발했으며, 규제, 산업 관행 및 문화적 규범의 변화를 요구하고 있습니다. (출처: Reddit r/ArtificialInteligence, Reddit r/artificial, Reddit r/ArtificialInteligence, Yuchenj_UW, colin_fraser, Teknium1, cloneofsimo)

직장에서의 AI: 효율성 향상과 ‘숨겨진 착취’의 모순 : AI가 직장에 통합되면서, 특히 실무 직원들에게는 역설이 발생하고 있습니다. 효율성 향상은 종종 더 높은 생산량 기대로 이어지지만, 직원들은 그에 상응하는 보상을 받지 못합니다. 이러한 ‘숨겨진 착취’는 직원을 AI 생성 콘텐츠의 ‘수동 품질 검사원’으로 만들고 인지 부하와 불안감을 증가시킵니다. AI는 기업 생산성을 향상시켰지만, 수익은 주로 자본으로 흘러가 전략 관리자와 도구 의존형 실무자 간의 ‘인지 격차’를 심화시킵니다. 조직 구조를 재편하지 않으면 보편적인 번아웃(burnout)으로 이어질 수 있습니다. (출처: 36氪, glennko, mbusigin)

AI 시대, ‘질문하는 능력’의 가치가 ‘실행력’을 넘어선다 : AI가 주도하는 세상에서 진정한 경쟁 우위는 실행 속도에서 ‘질문하는 능력’, 즉 어떤 문제가 해결할 가치가 있는지를 식별하는 능력으로 전환되고 있습니다. AI에 과도하게 의존하여 실행하고 비판적인 문제 정의가 부족하면, 잘못된 문제를 효율적으로 해결하여 거짓된 진보감을 유발할 수 있습니다. 디자인 사고, 공감 지도(empathy mapping) 및 지속적인 질문은 AI가 대체할 수 없는 핵심 인간 기술로 간주되며, 개인과 조직이 AI를 효과적으로 활용하여 의미 있는 도전에 집중하도록 도울 수 있습니다. (출처: 36氪)

AI 지정학: 미중 AI 경쟁과 국제 규제 논쟁 : 미중 AI 경쟁은 단거리 경주가 아닌 마라톤으로 간주되며, 중국은 로봇 애플리케이션 분야에서 앞설 수 있습니다. 미국은 초지능 추구보다는 실용적인 AI 투자에 집중할 것을 촉구받았지만, 유엔 차원의 국제 AI 규제를 거부하고 국가 주권을 강조했습니다. 이는 AI 발전이 국가 안보, 무역 정책(예: H-1B 비자) 및 AI 인프라와 인재 경쟁과 얽혀 있는 복잡한 지정학적 구도를 부각시킵니다. (출처: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence, adcock_brett, Dorialexander, teortaxesTex, teortaxesTex, teortaxesTex, brickroad7, jonst0kes)

Emad Mostaque, ‘마지막 경제’ 예측: AI가 인간 가치를 재편할 것 : Stability AI의 전 CEO Emad Mostaque는 향후 1,000일 이내에 AI가 경제 구조를 완전히 재편할 것이며, 인간 노동력의 가치가 0 또는 심지어 마이너스가 될 수 있다고 예측했습니다. 그는 경제 건전성을 측정하기 위해 ‘MIND 프레임워크’(물질, 지능, 네트워크, 다양성)를 제시하며, AI가 가져올 ‘지능 자본’의 과잉이 다른 자본의 중요성을 재평가할 것을 요구한다고 보았습니다. 이 ‘네 번째 반전’은 AI가 인지 노동을 대체하게 할 것이며, 사회 변화에 대응하기 위해 ‘인간 중심’의 새로운 화폐와 범용 기반 AI를 구축해야 할 것입니다. (출처: 36氪)

Stability AI前CEO惊人预测:人类智力价值归零,只剩1000天

AI 하드웨어 경쟁: OpenAI, ByteDance 및 Meta, 소비자 기기 시장 쟁탈전 : OpenAI, ByteDance 및 Meta와 같은 기술 대기업들은 소비자용 AI 하드웨어 연구 개발에 적극적으로 투자하고 있습니다. Meta의 Ray-Ban AI 안경은 상당한 판매량을 기록했으며, OpenAI는 Apple 공급업체와 협력하여 ‘스크린 없는 스마트 스피커’를 개발 중인 것으로 알려졌고, ByteDance는 AI 스마트 안경을 연구 개발하고 있습니다. 이 경쟁은 AI가 일상생활에 더욱 깊이 통합될 것을 예고하며, 각 기업은 환경 인지 AI 분야에서 선두를 차지하기 위해 다양한 제품 형태와 상호작용 모델을 탐색하고 있습니다. (출처: 36氪)

张一鸣和奥特曼都得学小扎

AI Agent: 인간-기계 협업에서 ‘인간-기계 위임’으로의 패러다임 전환 : AI 산업은 인간-기계 협업에서 ‘인간-기계 위임’으로의 ‘온화한 전환점’을 맞이하고 있으며, 자율 AI Agent가 복잡한 작업을 대규모로 수행할 것입니다. AI가 ‘프로그래밍을 꿰뚫는’ 돌파구는 모든 반개방형 시스템을 정복할 수 있음을 예고합니다. 이러한 변화는 ‘무인 회사’ 조직 형태를 탄생시킬 것이며, 인간의 역할은 미시적 실행에서 거시적 거버넌스로 전환되어 가치 주입, 시스템 아키텍처 설계 및 거시적 내비게이션에 중점을 두고, 고속으로 작동하는 AI 시스템에 직접 개입하기보다는 AI Copilot의 도움을 받아 의사결정을 할 것입니다. (출처: 36氪)

接近温和拐点,AI将迎来比撒手速度的周期

AI가 외국어 전공에 미치는 영향: 학생들은 ‘외국어+’ 복합 기술을 길러야 : AI 번역 기술의 부상은 외국어 전공에 깊은 영향을 미치고 있으며, 전통적인 언어 관련 직업 수요 감소로 인해 여러 대학이 관련 전공을 폐지하고 있습니다. 외국어 전공 학생들은 전환 압력에 직면해 있으며, 단일 언어 기술에서 ‘외국어+’ 복합 모델로 전환해야 합니다. 예를 들어, ‘외국어+AI’로 자연어 처리 분야에 종사하거나 ‘외국어+국제 커뮤니케이션’ 등으로 나아갈 수 있습니다. 이는 외국어 교육 개혁을 촉진하며, 단순한 번역 훈련보다는 다문화 이해와 종합적인 능력을 강조하여 AI 시대의 새로운 언어 인재 수요에 적응하도록 합니다. (출처: 36氪, Reddit r/ClaudeAI)

GPU 가격 고공행진: AI 수요 증가와 로컬 LLM 최적화 : 커뮤니티는 GPU 가격이 계속해서 높은 수준을 유지하는 것에 대해 널리 우려하고 있으며, 주요 원인이 AI 데이터 센터 수요 급증과 인플레이션 때문이라고 보고 있습니다. 많은 사람들은 AI 거품이 터지거나 맞춤형 칩이 대규모로 보급되지 않는 한 가격이 크게 하락하기 어려울 것이라고 생각합니다. 그러나 이러한 도전에 대응하기 위해 커뮤니티는 로컬 LLM 성능 최적화에 노력하고 있습니다. 예를 들어, AMD MI50은 llama.cpp/ggml에서 NVIDIA P40보다 우수한 성능을 보였고, iGPU를 활용하여 기본 LLM 작업을 수행함으로써 로컬 AI 컴퓨팅 비용을 절감하고 있습니다. (출처: Reddit r/LocalLLaMA, Reddit r/LocalLLaMA, Reddit r/LocalLLaMA)

46 GB GPU compute for $20.

💡 기타

LLM 확장의 ‘수확 체감의 환상’과 장기 주기 작업 : 연구에 따르면, 단일 라운드 벤치마크 테스트에서는 LLM 발전이 둔화되는 것처럼 보일 수 있지만, 모델 규모 확장은 장기 주기 작업 실행에서 여전히 비감소적인 개선을 가져옵니다. ‘수확 체감의 환상’은 단일 단계 정확도의 미미한 향상에서 비롯되지만, 이는 장기 주기 작업 완료도에서 초지수적인 향상을 가져올 수 있습니다. 장기 주기 작업에서의 순차적 계산 이점은 병렬 테스트로는 비교할 수 없으며, 이는 고급 에이전트 행동을 달성하기 위해 지속적인 모델 확장과 강화 학습 훈련이 필수적임을 시사합니다. (출처: scaling01)

scaling01

에너지 기반 Transformer (EBT), 다음 토큰 예측 성능 향상 : 연구원들은 ‘에너지’를 통해 다음 토큰 후보를 평가하고, 기울기 단계(gradient step)를 통해 에너지를 반복적으로 낮추면서 검증 및 선택하는 에너지 기반 Transformer (EBT)를 출시했습니다. 4,400만 파라미터 실험에서 EBT는 네 가지 벤치마크 중 세 가지에서 동일 규모의 전통적인 Transformer보다 우수한 성능을 보였으며, 이러한 새로운 토큰 선택 방법이 LLM 성능을 향상시킬 수 있음을 시사합니다. (출처: DeepLearningAI)

DeepLearningAI

AI 로봇 발전: 휴머노이드 세일즈맨과 훈련 없이 자율 보행하는 로봇 개 : Xpeng Motors는 전시장에 휴머노이드 자동차 세일즈맨 ‘티에단(Tiedan)’을 배치하여 고객 대면 로봇 분야에서 AI의 적용을 시연했습니다. 또한, ‘동물적 반사 능력’을 가진 로봇 개가 훈련 없이 숲 속을 걸을 수 있음을 보여주며, 생체 운동 및 인지 모방 분야에서 자율 로봇 기술의 발전을 부각시켰습니다. 이러한 발전은 물리적 로봇 분야에서 AI의 복잡성과 실제 적용이 점차 증가하고 있음을 예고합니다. (출처: Ronald_vanLoon, Ronald_vanLoon)

Ronald_vanLoon