키워드:OpenAI 소라, AI 비디오 생성, 소형 재귀 모델 (Tiny Recursive Model), AI 장난감, AI 칩, 소라 2 비디오 재현, TRM 추론 효율성, AI 장난감 시장 성장, AMD와 OpenAI 칩 협력, AI 콘텐츠 저작권 논란

🔥 포커스

OpenAI Sora App의 부상과 도전: OpenAI가 출시한 AI 생성 비디오 앱 Sora가 빠르게 인기를 얻으며 App Store 정상에 올랐습니다. 무료 및 무제한 비디오 생성 기능은 운영 비용, 저작권 침해(특히 기존 IP 및 고인 유명인의 초상권 사용), 딥페이크 기술 남용에 대한 광범위한 우려를 불러일으켰습니다. Sam Altman은 수익 모델을 고려해야 하며, 더 정교한 저작권 통제를 제공할 계획이라고 인정했습니다. 이 앱이 콘텐츠 창작 생태계와 현실 인식에 미치는 영향은 AI 비디오가 ‘실제’ 비디오를 능가할지에 대한 논의를 촉발했습니다. (출처: MIT Technology Review, rowancheung, fabianstelzer, nptacek, paul_cal, BlackHC)

OpenAI Sora App의 부상과 도전

삼성, Tiny Recursive Model (TRM) 출시로 LLM 추론 효율성 도전: 삼성은 700만 개의 매개변수만을 가진 소형 신경망인 Tiny Recursive Model (TRM)을 발표했습니다. 이 모델은 ARC-AGI 벤치마크에서 DeepSeek-R1, Gemini 2.5 Pro와 같은 대규모 LLM을 능가하는 뛰어난 성능을 보였습니다. TRM은 재귀적 추론 방식을 채택하여 여러 번의 내부 ‘사고’와 자기 비판을 통해 답변을 최적화합니다. 이러한 돌파구는 ‘작은 모델이 더 똑똑해질 수 있는가’에 대한 논의를 촉발했으며, 추론 작업에서 단순한 모델 규모보다 아키텍처 혁신이 더 중요할 수 있음을 시사하며, SOTA 추론의 계산 비용을 크게 절감할 수 있을 것으로 기대됩니다. (출처: HuggingFace Daily Papers, fchollet, cloneofsimo, ecsquendor, clefourrier, AymericRoucher, ClementDelangue, Dorialexander)

삼성, Tiny Recursive Model (TRM) 출시로 LLM 추론 효율성 도전

칭화대 야오 순위, Anthropic에서 Google DeepMind로 이직, 가치관 차이가 주원인: 칭화대학교 물리학과 특등 장학금 수상자인 야오 순위(姚顺宇)가 Anthropic을 떠나 Google DeepMind에 선임 연구 과학자로 합류한다고 발표했습니다. 그는 퇴사 이유의 40%가 Anthropic과의 ‘근본적인 가치관 차이’ 때문이라고 지적하며, 회사가 중국 연구원과 중립적 입장의 직원들에게 비우호적이라고 생각했습니다. 야오 순위는 Anthropic에서 1년간 근무하며 Claude 3.7 Sonnet 및 Claude 4 시리즈의 강화 학습 이론 구축에 참여했으며, AI 분야의 발전 속도가 놀랍지만 이제는 앞으로 나아갈 때라고 말했습니다. (출처: ZhihuFrontier, 量子位)

칭화대 야오 순위, Anthropic에서 Google DeepMind로 이직, 가치관 차이가 주원인

Arduino, Qualcomm에 인수, 임베디드 AI의 새로운 방향 제시: Arduino가 Qualcomm에 인수되었으며, Qualcomm Dragonwing QRB2210 프로세서를 탑재하고 AI 솔루션을 통합한 첫 번째 협력 개발 보드 UNO Q를 출시했습니다. 이는 Arduino가 전통적인 저전력 마이크로컨트롤러 분야에서 중간 전력, AI 통합 기능을 갖춘 엣지 컴퓨팅 방향으로 발전하고 있음을 의미합니다. 이러한 움직임은 IoT 및 임베디드 장치에서 AI의 광범위한 적용을 촉진하고, 개발자에게 더 강력한 AI 컴퓨팅 파워를 제공하며, 임베디드 AI 하드웨어 생태계의 새로운 변화를 예고합니다. (출처: karminski3)

Arduino, Qualcomm에 인수, 임베디드 AI의 새로운 방향 제시

Meta Superintelligence, REFRAG 발표: RAG 효율성의 새로운 돌파구: Meta Superintelligence는 첫 논문 REFRAG를 발표하며, 효율성을 크게 향상시키는 것을 목표로 하는 새로운 RAG(검색 증강 생성) 방법을 제안했습니다. 이 방법은 검색된 대부분의 문서 블록을 LLM이 직접 소비할 수 있는 압축되고 LLM 친화적인 ‘블록 임베딩’으로 변환하고, 경량 전략을 사용하여 예산 내에서 필요에 따라 일부 블록 임베딩을 전체 토큰으로 확장합니다. 이는 KV 캐시 및 어텐션 비용을 크게 줄이고, 첫 바이트 지연 시간과 처리량을 가속화하면서 정확성을 유지하여 실시간 RAG 애플리케이션을 위한 새로운 길을 열었습니다. (출처: Reddit r/deeplearning, Reddit r/LocalLLaMA)

Meta Superintelligence, REFRAG 발표: RAG 효율성의 새로운 돌파구

🎯 동향

xAI, 200억 달러 자금 조달 완료, Nvidia 20억 달러 투자: Elon Musk가 이끄는 xAI는 Nvidia의 직접 투자 20억 달러를 포함하여 200억 달러 규모의 자금 조달을 성공적으로 완료했습니다. 이 자금은 특수 목적 법인(SPV)을 통해 Nvidia GPU 구매에 사용되어 Memphis Colossus 2 데이터센터 건설을 지원할 예정입니다. 이 독특한 자금 조달 구조는 AI 컴퓨팅 분야에서 xAI의 대규모 확장을 위한 하드웨어 보장을 제공하고, AI 칩 시장의 경쟁을 더욱 심화시킬 것입니다. (출처: scaling01)

xAI, 200억 달러 자금 조달 완료, Nvidia 20억 달러 투자

AI 장난감, 중국 및 미국 시장에서 부상: 챗봇과 음성 비서를 탑재한 AI 장난감이 새로운 트렌드로 부상하며, 특히 중국 시장에서 빠르게 성장하여 미국 등 국제 시장으로 확대되었습니다. BubblePal과 FoloToy 같은 회사 제품들은 어린이들의 스크린 의존도를 줄이는 것을 목표로 합니다. 그러나 학부모들은 AI 기능이 때때로 불안정하고, 응답이 길거나 음성 인식이 지연되어 어린이들의 흥미가 감소한다고 보고했습니다. Mattel과 같은 미국 회사들도 OpenAI와 협력하여 AI 장난감을 개발하고 있습니다. (출처: MIT Technology Review)

AI 장난감, 중국 및 미국 시장에서 부상

Microsoft, Autogen과 Semantic Kernel을 통합한 통합 오픈소스 Agent 프레임워크 출시: Microsoft는 Autogen과 Semantic Kernel을 통합하여 엔터프라이즈급 다중 에이전트 AI 시스템을 구축하기 위한 통합 오픈소스 SDK인 Agent Framework를 발표했습니다. 이 프레임워크는 Azure AI Foundry의 지원을 받으며, 오케스트레이션 및 관찰 가능성을 단순화하고 다양한 API와 호환됩니다. 이 프레임워크는 다중 에이전트 워크플로우의 비공개 미리 보기, OpenTelemetry의 크로스 프레임워크 추적, Voice Live API의 실시간 음성 에이전트 기능, 그리고 에이전트 시스템의 안전성과 효율성을 높이기 위한 책임감 있는 AI 도구를 도입했습니다. (출처: TheTuringPost)

Microsoft, Autogen과 Semantic Kernel을 통합한 통합 오픈소스 Agent 프레임워크 출시

AI21 Labs, Jamba 3B 출시, 경쟁 제품 능가하는 소형 모델 성능: AI21 Labs는 30억 개의 매개변수만을 가진 MoE 모델인 Jamba 3B를 출시했으며, 특히 긴 컨텍스트 처리에서 품질과 속도 모두 뛰어난 성능을 보였습니다. 이 모델은 Mac에서 32K 컨텍스트를 초과하더라도 약 40 t/s의 생성 속도를 유지하며, Qwen 3 4B 및 Llama 3.2 3B를 훨씬 능가합니다. Jamba 3B는 지능 지수에서 Gemma 3 4B 및 Phi-4 Mini보다 높으며, 256K 컨텍스트에서도 추론 능력을 온전히 유지하여 엣지 AI 및 장치 배포에서 소형 모델의 엄청난 잠재력을 보여줍니다. (출처: Reddit r/LocalLLaMA)

AI21 Labs, Jamba 3B 출시, 경쟁 제품 능가하는 소형 모델 성능

HuggingFace 커뮤니티, 90일 만에 100만 개 리포지토리 추가하며 급성장: HuggingFace 커뮤니티는 지난 90일 동안 100만 개의 모델, 데이터셋, Space 리포지토리를 추가했으며, 첫 100만 개 리포지토리에 도달하는 데 6년이 걸렸다는 점을 고려하면 8초마다 새로운 리포지토리가 생성된 셈입니다. 이러한 성장은 Xet 기술을 통한 더 효율적인 데이터 전송과 40%에 달하는 비공개 리포지토리가 기업 내부에서 HuggingFace를 사용하여 모델 및 데이터를 공유하는 추세를 보여줍니다. 커뮤니티의 목표는 1,000만 개 리포지토리에 도달하는 것이며, 이는 오픈소스 AI 생태계의 활발한 발전을 예고합니다. (출처: Teknium1, reach_vb)

HuggingFace 커뮤니티, 90일 만에 100만 개 리포지토리 추가하며 급성장

OpenAI GPT-5, 과학 연구에서 획기적인 능력 발휘: OpenAI의 GPT-5 모델이 중요한 문턱을 넘었으며, 과학자들은 이를 활용하여 수학, 물리학, 생물학, 컴퓨터 과학 등 다양한 분야에서 독창적인 연구를 성공적으로 수행했습니다. 이러한 발전은 GPT-5가 질문에 답할 뿐만 아니라 복잡한 과학 탐구를 지시하고 실행할 수 있음을 보여주며, 연구 과정을 크게 가속화했습니다. 일부 연구자들은 GPT-5 Thinking과 GPT-5 Pro가 출시된 후, 이들을 참고하지 않고 과학 연구를 진행하는 것은 더 이상 합리적이지 않다고 말했습니다. (출처: tokenbender)

Ling-1T: 조 단위 매개변수 오픈소스 추론 모델 출시: Ling 2.0 시리즈의 플래그십 모델인 Ling-1T는 총 1조 개의 매개변수를 가지며, 각 토큰당 약 500억 개의 활성 매개변수를 사용하고 20조 개 이상의 추론 집약적 토큰으로 훈련되었습니다. 이 모델은 Evo-CoT 커리큘럼과 Linguistics-Unit RL을 통해 확장 가능한 추론을 달성하며, 복잡한 추론 작업에서 강력한 효율성-정확성 균형을 보여줍니다. 또한 고급 시각 이해 및 프론트엔드 코드 생성 능력을 갖추고 있으며, 약 70%의 성공률로 도구 사용을 달성하여 오픈소스 조 단위 지능의 새로운 이정표를 세웠습니다. (출처: scaling01, TheZachMueller)

Ling-1T: 조 단위 매개변수 오픈소스 추론 모델 출시

Meta Ray-Ban Display, 인간-컴퓨터 상호작용 및 학습 재정의: Meta Ray-Ban Display 스마트 안경은 학습 및 번역 기능을 일상 착용에 통합하여 ‘보이지 않는 번역’과 ‘즉각적인 시각 학습’ 경험을 제공합니다. 대화 자막이 렌즈에 직접 표시되며, 사용자는 랜드마크나 그림을 보기만 해도 관련 정보를 얻을 수 있습니다. 또한 Neural Band를 통해 제스처 제어가 가능하여 휴대폰 없이도 조작할 수 있습니다. 이 기술은 우리가 세상과 상호작용하고, 학습하며, 연결하는 방식을 재편할 것으로 기대되며, 인간 중심 컴퓨팅의 새로운 시작을 알립니다. (출처: Ronald_vanLoon)

🧰 도구

Synthesia, 전문 AI 비디오 편집을 위한 Copilot 출시: Synthesia는 전문 AI 비디오 편집기인 Copilot을 출시했습니다. 이 도구는 비즈니스와 Synthesia 플랫폼에 정통한 동료를 둔 것처럼 스크립트를 빠르게 작성하고, 지식 기반을 연결하며, 시각 자료를 지능적으로 추천할 수 있습니다. Copilot은 비디오 제작 과정을 단순화하고 전문 비디오 제작의 진입 장벽을 낮추며, 기업과 콘텐츠 제작자에게 효율적이고 개인화된 AI 비디오 솔루션을 제공하는 것을 목표로 합니다. (출처: synthesiaIO, synthesiaIO)

GLIF Agent, Sora 2를 활용하여 바이럴 비디오 재현 및 맞춤화: GLIF는 Sora 2 모델을 활용하여 모든 바이럴 비디오를 재현할 수 있는 Agent를 개발했습니다. 이 Agent는 먼저 원본 비디오를 분석한 다음, 분석 결과에 따라 상세한 프롬프트 단어를 생성하며, 사용자는 Agent와 협력하여 프롬프트 단어를 맞춤 설정함으로써 고도로 개인화된 AI 생성 비디오를 만들 수 있습니다. 이 기술은 콘텐츠 제작 및 마케팅 분야에서 강력한 비디오 제작 및 2차 창작 능력을 제공할 것으로 기대됩니다. (출처: fabianstelzer)

Cloudflare AI Search, GroqInc와 협력하여 “문서 채팅” 템플릿 출시: Cloudflare AI Search(이전 AutoRAG)는 GroqInc와 협력하여 새로운 오픈소스 ‘문서 채팅’ 템플릿을 출시했습니다. 이 템플릿은 Groq의 추론 엔진과 AI Search를 결합하여 사용자가 문서에 대화형 AI 기능을 더 쉽게 추가하고, 문서 내용에 대한 실시간 질의응답 및 상호작용을 구현할 수 있도록 합니다. 이러한 통합은 문서 검색 및 정보 획득의 효율성을 높일 것입니다. (출처: JonathanRoss321)

HuggingFace, 브라우저 내 GGUF 편집 기능 출시: HuggingFace는 이제 전체 모델을 다운로드할 필요 없이 브라우저 내에서 GGUF 모델의 메타데이터를 직접 편집하는 기능을 지원합니다. 이 기능은 Xet 기술을 통해 구현되며, 부분 파일 업데이트를 지원하여 모델 관리 및 반복 프로세스를 크게 단순화하고 HuggingFace 플랫폼에서 개발자의 작업 효율성을 향상시킵니다. (출처: reach_vb)

LangChain 및 LangGraph, v1.0 Alpha 버전 출시 및 개발자 피드백 요청: LangChain과 LangGraph는 v1.0 Alpha 버전을 출시하며, 새로운 Agent 미들웨어 API, 표준 출력/콘텐츠 블록 및 중요한 API 업데이트를 도입했습니다. 팀은 새로운 버전을 테스트하고 피드백을 제공하도록 개발자들을 적극적으로 초대하여 AI 에이전트 개발 프레임워크를 더욱 개선하고 더 강력한 AI 애플리케이션 구축을 추진하고 있습니다. (출처: LangChainAI)

NeuML, 매개변수 100만 개 미만의 ColBERT Nano 시리즈 초소형 모델 출시: NeuML은 ColBERT Nano 시리즈 모델을 발표했으며, 이 모델들은 모두 100만 개 미만의 매개변수(250K, 450K, 950K)를 가집니다. 이러한 초소형 모델들은 ‘Late interaction’ 모드에서 놀라운 성능을 보여주며, 극히 작은 규모의 모델도 특정 작업에서 좋은 결과를 얻을 수 있음을 입증하여 자원 제약이 있는 환경에서 AI 배포를 위한 효율적인 솔루션을 제공합니다. (출처: lateinteraction, lateinteraction)

NeuML, 매개변수 100만 개 미만의 ColBERT Nano 시리즈 초소형 모델 출시

Google 선임 엔지니어링 책임자, ‘Agent 디자인 패턴’ 공유: Google의 선임 엔지니어링 책임자가 ‘Agent 디자인 패턴’이라는 책을 무료로 공유하며, 뜨거운 AI Agent 분야에 최초의 체계적인 디자인 원칙과 모범 사례를 제시했습니다. 이 자료는 개발자들이 AI Agent를 더 잘 이해하고 구축하도록 돕고, 이 분야의 체계적인 지침 공백을 메우며, AI Agent 개발자들에게 중요한 참고 자료가 될 것으로 기대됩니다. (출처: dotey)

Google 선임 엔지니어링 책임자, 'Agent 디자인 패턴' 공유

📚 학습

LLM 환각 및 안전 정렬 메커니즘 연구: 내부 기원부터 완화 전략까지: 연구에 따르면 LLM 추론 모델은 최종 출력을 생성하기 전에 ‘거부 절벽’ 현상, 즉 거부 의도가 급격히 감소하는 현상을 보일 수 있습니다. DST 프레임워크를 통해 연구자들은 환각이 모델 특정 ‘약속 계층’에서 피할 수 없게 된다는 것을 밝혀냈으며, 임상 신호와 데이터 최적화를 통합하여 RAG의 환각을 완화하는 HalluGuard 소형 추론 모델을 제안하여 LLM 안전 정렬 및 환각 완화를 위한 기계적 설명과 실용적인 전략을 제공했습니다. (출처: HuggingFace Daily Papers, HuggingFace Daily Papers, HuggingFace Daily Papers)

ASPO, LLM 강화 학습 최적화로 IS 비율 불일치 문제 해결: ASPO(Asymmetric Importance Sampling Policy Optimization)는 새로운 LLM 후처리 방법으로, 전통적인 강화 학습에서 긍정적 우위 토큰의 중요도 샘플링(IS) 비율 불일치라는 근본적인 결함을 해결했습니다. 긍정적 우위 토큰의 IS 비율을 뒤집고 소프트 이중 클리핑 메커니즘을 도입함으로써, ASPO는 낮은 확률의 토큰을 더 안정적으로 업데이트하고 조기 수렴을 완화하며, 코딩 및 수학 추론 벤치마크 테스트의 성능을 크게 향상시킵니다. (출처: HuggingFace Daily Papers)

Fathom-DeepResearch: 장기 정보 검색 및 합성을 위한 Agent 시스템: Fathom-DeepResearch는 Fathom-Search-4B와 Fathom-Synthesizer-4B로 구성된 Agent 시스템으로, 복잡하고 개방형 정보 검색 작업을 위해 설계되었습니다. Fathom-Search-4B는 다중 Agent 자기 대결 데이터셋과 강화 학습 최적화를 통해 실시간 웹 검색 및 웹 페이지 쿼리를 구현합니다. Fathom-Synthesizer-4B는 다단계 검색 결과를 구조화된 보고서로 변환합니다. 이 시스템은 여러 벤치마크 테스트에서 뛰어난 성능을 보였으며, HLE, AIME-25와 같은 추론 작업에 대한 강력한 일반화 능력을 보여주었습니다. (출처: HuggingFace Daily Papers)

AgentFlow: 효율적인 계획 및 도구 사용을 위한 인스트림 Agent 시스템 최적화: AgentFlow는 훈련 가능한 인스트림 Agent 프레임워크로, 플래너, 실행기, 검증기, 생성기 네 가지 모듈을 조정하여 다단계 상호작용 루프에서 플래너를 직접 최적화합니다. 이 프레임워크는 Flow-based Group Refined Policy Optimization을 사용하여 장기적이고 희소한 보상의 신용 할당 문제를 해결합니다. AgentFlow는 10개의 벤치마크 테스트에서 7B 규모의 백본 모델로 SOTA 기준선을 능가했으며, 검색, Agent, 수학 및 과학 작업에서 평균 정확도가 크게 향상되었고, 심지어 GPT-4o를 능가했습니다. (출처: HuggingFace Daily Papers)

코드 데이터가 LLM 추론 능력에 미치는 영향에 대한 체계적인 연구: 연구는 체계적인 데이터 중심 프레임워크를 통해 코드 데이터가 LLM 추론 능력을 어떻게 향상시키는지 탐구했습니다. 10가지 프로그래밍 언어의 병렬 명령어 데이터셋을 구축하고 구조적 또는 의미적 교란을 가함으로써, LLM이 의미적 교란보다 구조적 교란에 더 민감하며, 특히 수학 및 코드 작업에서 그렇다는 것을 발견했습니다. 의사 코드와 순서도는 코드만큼 효과적이며, 구문 스타일 또한 작업별 이득에 영향을 미칩니다(Python은 자연어 추론에 유리하고, Java/Rust는 수학에 유리합니다). (출처: HuggingFace Daily Papers)

DeepEvolve: 심층 연구와 알고리즘 진화를 융합한 과학 알고리즘 발견 Agent: DeepEvolve는 심층 연구와 알고리즘 진화를 결합한 Agent로, 외부 지식 검색, 파일 간 코드 편집 및 시스템 디버깅을 통해 피드백 기반의 반복 루프에서 과학적 알고리즘을 발견합니다. 이 Agent는 새로운 가설을 제시할 뿐만 아니라 정교화, 구현 및 테스트를 수행하여 피상적인 개선과 비효율적인 과도한 정교화를 피합니다. 화학, 수학, 생물학, 재료 및 특허 등 9개 벤치마크 테스트에서 DeepEvolve는 초기 알고리즘을 지속적으로 개선하고 실행 가능한 새로운 알고리즘을 생성하여 지속적인 이득을 얻었습니다. (출처: HuggingFace Daily Papers)

AI/ML 학습 로드맵 및 핵심 개념: 커뮤니티는 AI, 머신러닝, 딥러닝의 포괄적인 학습 경로를 공유했으며, 기초 개념부터 Agentic AI, LLM 생성 매개변수와 같은 고급 기술에 이르기까지 여러 측면을 다룹니다. 이러한 자료는 AI/ML 분야에 진입하거나 지식을 심화하고자 하는 전문가들에게 구조화된 학습 가이드를 제공하여, 모델 개발부터 배포 및 운영에 이르는 전 과정의 기술을 습득하고 AI가 산업 전환을 어떻게 추진하는지 이해하도록 돕는 것을 목표로 합니다. (출처: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

AI/ML 학습 로드맵 및 핵심 개념

AI 벤치마크 테스트 및 학습 자료: HLE, 컨퍼런스 및 GPU 비용 관리: 커뮤니티는 여러 AI 학습 및 실습 자료에 대해 논의했습니다. CAIS는 모델 성능 향상에 맞춰 동적으로 업데이트되는 ‘Humanity’s Last Exam’ 벤치마크 테스트를 발표했습니다. 동시에 머신러닝 컨퍼런스 참가 가이드와 온디맨드 GPU 및 로컬 소형 모델 실행을 포함한 저비용 LLM 개발 전략을 제공했습니다. 또한 GPU Mode Hackathon 개최는 개발자들에게 학습 및 교류의 장을 제공했습니다. (출처: clefourrier, Reddit r/MachineLearning, Reddit r/MachineLearning, Reddit r/MachineLearning, danielhanchen)

AI 벤치마크 테스트 및 학습 자료: HLE, 컨퍼런스 및 GPU 비용 관리

OneFlow: 동시 혼합 모달리티 및 교차 생성 모델: OneFlow는 가변 길이 및 동시 혼합 모달리티 생성을 지원하는 최초의 비자기회귀 멀티모달 모델입니다. 이 모델은 이산 텍스트 토큰의 삽입식 편집 흐름과 이미지 잠재 공간의 흐름 매칭을 결합합니다. OneFlow는 계층적 샘플링을 통해 텍스트-이미지 동시 합성을 구현하며, 문법보다는 콘텐츠를 우선시합니다. 실험 결과, OneFlow는 생성 및 이해 작업에서 자기회귀 기준선보다 우수하며, 훈련 FLOPs를 최대 50%까지 줄이고 동시 생성, 반복 정교화 및 자연 추론식 생성의 새로운 능력을 잠금 해제했습니다. (출처: HuggingFace Daily Papers)

Equilibrium Matching: 암묵적 에너지 모델 기반의 생성 모델링 프레임워크: Equilibrium Matching (EqM)은 새로운 생성 모델링 프레임워크로, 전통적인 확산 및 흐름 모델의 비평형, 시간 조건부 동역학을 버리고 암묵적 에너지 지형의 평형 기울기를 학습합니다. EqM은 최적화 기반 샘플링 프로세스를 채택하여 학습된 지형에서 기울기 하강을 통해 샘플링하며, ImageNet 256×256 FID 1.90의 SOTA 성능을 달성하고 부분 노이즈 제거, OOD 감지 및 이미지 합성 등의 작업을 자연스럽게 처리합니다. (출처: HuggingFace Daily Papers)

💼 비즈니스

OpenAI, AMD와 칩 협력 계약 체결, Nvidia 지배력에 도전: OpenAI는 AMD와 5년간 수십억 달러 규모의 칩 협력 계약을 체결하여 AI 칩 시장에서 Nvidia의 지배력에 도전하는 것을 목표로 합니다. 이는 OpenAI의 칩 공급 다변화 전략의 일환으로, 이전에 Nvidia와도 협력 계약을 맺은 바 있습니다. 이 계약은 AI 산업의 고성능 컴퓨팅 하드웨어에 대한 막대한 수요와 공급망 다양성 추구를 강조합니다. (출처: MIT Technology Review)

OpenAI 상위 고객 명단 유출, 30개 회사 1조 토큰 소비: OpenAI의 상위 고객 명단으로 추정되는 목록이 온라인에 유출되었으며, 30개 회사가 OpenAI 모델을 통해 1조 개 이상의 토큰을 처리했음을 보여줍니다. 이 목록(Duolingo, OpenRouter, Salesforce, Canva, Perplexity 등 포함)은 AI 추론 경제의 빠른 형성을 보여주며, AI 네이티브 빌더, AI 통합업체, AI 인프라 제공업체, 수직 AI 솔루션 제공업체라는 네 가지 주요 유형을 제시합니다. 토큰 소비량은 AI 애플리케이션의 실제 가치와 비즈니스 진행 상황을 측정하는 새로운 기준점으로 간주됩니다. (출처: Reddit r/ArtificialInteligence, 量子位)

OpenAI 상위 고객 명단 유출, 30개 회사 1조 토큰 소비

싱가포르, AI 개발 저작권 안전지대 구축, 글로벌 AI 기업 유치: 싱가포르는 ‘저작권법’을 개정하여 계산 분석 방어 조항을 도입, AI 시스템 개선을 위한 계산 데이터 분석이 저작권 침해 면제 보호를 받으며 계약으로도 이를 막을 수 없도록 명시했습니다. 이러한 움직임은 싱가포르를 전 세계에서 가장 매력적인 AI 모델 개발지로 만들고 투자와 혁신을 유치하며, 유럽과 미국 등 AI 저작권에 신중한 태도를 보이는 지역과 뚜렷한 대조를 이룹니다. 보호 범위가 싱가포르 내로 한정되지만, 기본 모델 개발에 중요한 보장을 제공합니다. (출처: Reddit r/ArtificialInteligence)

🌟 커뮤니티

AI 산업 자금 조달 거래 및 거품 우려: 소셜 미디어에서는 AI 산업의 자금 조달 거래에 대한 의문이 제기되고 있으며, 많은 거래가 실제 가치보다는 인위적으로 주가를 부풀리려는 시도처럼 들린다는 의견이 있습니다. 일부 의견은 많은 AI 제품이 지역 시장에서 실제 적용 효과를 보지 못했으며, 기업들은 오히려 AI 제품이 비효율적이라고 불평한다고 지적합니다. 이러한 현상은 실제 자본 형성 및 파급 효과보다는 시장 과열로 해석됩니다. 동시에 마케팅 분야에서 AI 디지털 트윈의 적용에 대해서도 ‘과대광고인가, 미래인가’에 대한 논의가 있습니다. (출처: Reddit r/ArtificialInteligence, Reddit r/ArtificialInteligence)

AI 산업 자금 조달 거래 및 거품 우려

ChatGPT 콘텐츠 검열 및 사용자 경험 논란: ChatGPT 사용자들은 플랫폼의 콘텐츠 검열이 너무 엄격하여 간단한 레시피 요청이나 캐릭터 간의 포옹조차 ‘성적인 내용’으로 분류하는 반면, 폭력적인 콘텐츠에는 둔감하다고 불평했습니다. 사용자들은 ChatGPT가 ‘쓰레기’가 되고 ‘과잉 보호’되고 있다고 생각하며, OpenAI가 우수한 직원들을 잃었는지 의문을 제기했습니다. 동시에 사용자들은 ChatGPT App에서 LaTeX 렌더링에 문제가 있다고 보고했습니다. 이로 인해 일부 사용자는 구독을 취소하고 OpenAI에게 창의성을 억압하는 것을 멈추라고 촉구했습니다. (출처: Reddit r/ChatGPT, Reddit r/ChatGPT, Reddit r/ChatGPT, jeremyphoward)

ChatGPT 콘텐츠 검열 및 사용자 경험 논란

AI 콘텐츠 역풍 및 창작자들의 우려: AI 생성 콘텐츠가 점점 보편화되면서, 특히 예술 및 창작 분야에서 강력한 반AI 정서가 나타나고 있습니다. 유튜버 MrBeast와 같은 유명 창작자들은 AI 비디오가 수백만 명의 창작 생계를 위협할 수 있다는 우려를 표명했습니다. Taylor Swift의 팬들도 AI 생성 홍보 비디오가 ‘저렴하고 조잡하다’고 비판했습니다. 이러한 반발은 AI 기술이 전통 산업에 미치는 영향에 대한 창작자들의 불안감과 콘텐츠 품질 및 진정성에 대한 관심을 반영합니다. (출처: Reddit r/artificial, MIT Technology Review)

AI 콘텐츠 역풍 및 창작자들의 우려

게임 분야 AI 적용의 어려움과 전망: 커뮤니티는 AI 기술이 강력하고 창의적이며 흥미롭고 역동적인 특성을 가지고 있지만, 왜 아직까지 인기 있는 게임에서 AI를 널리 사용하지 않는지에 대해 의문을 제기했습니다. 일부에서는 AI가 개발 과정에서 이미 널리 사용되고 있지만, AI 모델을 로컬에서 실행하는 비용이 많이 들고 게임 개발자들이 서사를 통제하려는 경향이 있다고 주장합니다. 또한 개발자들이 전통적인 대작에만 집중하고 새로운 아이디어를 간과한다는 의견도 있습니다. 이는 게임 분야에서 AI 도입이 직면한 기술적, 비용적, 창의적 도전을 반영합니다. (출처: Reddit r/artificial)

Perplexity, 크리스티아누 호날두 사용 사례로 AI 검색의 실용성 부각: 축구 스타 크리스티아누 호날두(C罗)는 Prestige Globe Award 연설을 준비하면서 AI 검색 도구 Perplexity를 사용했습니다. 그는 Perplexity가 상의 의미를 이해하고 긴장감을 극복하는 데 도움이 되었다고 말했습니다. 이 사건은 Perplexity 공식 채널과 소셜 미디어를 통해 널리 퍼졌으며, AI 검색이 빠르고 정확한 정보를 제공하는 실용적 가치와 유명인 효과를 통한 홍보 잠재력을 부각시켰습니다. (출처: AravSrinivas, AravSrinivas)

Google AI 연구, 노벨상 수상 및 관련 논란: Google은 Demis Hassabis(AlphaFold)와 Geoff Hinton(AI)을 포함하여 2년 만에 3개의 노벨상을 수상했습니다. 이러한 성과는 Google의 장기적인 연구 투자와 야망을 보여주는 것으로 평가됩니다. 그러나 Jürgen Schmidhuber는 2024년 노벨 물리학상에 표절 문제가 있다고 주장하며, 그 성과가 초기 연구와 크게 중복되고 적절히 인용되지 않았다고 지적하여 AI 분야의 학술 윤리 및 귀속에 대한 논의를 촉발했습니다. (출처: Yuchenj_UW, SchmidhuberAI, SchmidhuberAI)

Google AI 연구, 노벨상 수상 및 관련 논란

AI 컴퓨팅 수요와 AGI/ASI 실현 경로에 대한 철학적 논쟁: AI 비디오 생성에 필요한 막대한 컴퓨팅 자원에 대해, 이러한 실제 수요 기반의 엄청난 컴퓨팅 투자가 오히려 일반 인공지능(AGI)과 초인공지능(ASI)이 여전히 먼 환상임을 보여준다는 견해가 있습니다. 이 논의는 AI 개발 경로에 대한 업계의 성찰을 반영하며, 현재 AI가 특정 애플리케이션에서 성공하는 것이 자원을 분산시켜 더 큰 목표 달성을 지연시킬 수 있는지에 대한 의문을 제기합니다. 동시에 Richard Sutton은 학습의 본질이 수동적인 훈련이 아니라 Agent의 능동적인 행동이라고 강조했습니다. (출처: fabianstelzer, Plinz, dwarkesh_sp)

AI가 노동 시장에 미치는 영향: 박사급 데이터 라벨링 전문가 시급 하락: 소셜 미디어 논의에 따르면 박사급 데이터 라벨링 전문가의 공급 과잉으로 인해 시간당 임금이 100달러에서 50달러로 하락했습니다. 이전에 OpenAI는 박사급 인력을 시간당 100달러에 고용하여 데이터 라벨링을 수행했습니다. 이러한 현상은 AI 데이터 라벨링 시장 경쟁 심화와 고품질 데이터 라벨링 인력 수요 변화를 반영합니다. (출처: teortaxesTex)

AI 보조 소프트웨어 엔지니어 도구, 투자 유치 및 직업 영향: AI 기반 소프트웨어 엔지니어를 위한 도구에 주력하는 스타트업 Relace가 Andreessen Horowitz가 주도한 시리즈 A 펀딩에서 2,300만 달러를 유치했습니다. 이는 AI 툴체인이 더 심층적인 AI 자율 개발 영역으로 확장되고 있음을 의미합니다. 동시에 엔지니어들은 AI 코딩 도구가 작업 방식을 어떻게 변화시키는지 논의하며, AI 도구 사용에 능숙하더라도 인간의 창의성과 문제 해결 능력이 여전히 핵심 가치라고 생각했습니다. (출처: steph_palazzolo, kylebrussell)

AI 보조 소프트웨어 엔지니어 도구, 투자 유치 및 직업 영향

Vibe Coding 문화 현상의 흥망성쇠: 소셜 미디어에서는 ‘Vibe Coding’이라는 문화 현상의 흥망성쇠에 대해 논의했습니다. 일부에서는 Vibe Coding이 편안한 분위기에서 코딩하는 방식이라고 생각하지만, 다른 의견은 이미 ‘사라졌다’고 주장합니다. 관련 논의에서는 ‘Bob Ross vibe coding’과 같은 AI 생성 콘텐츠도 언급되었으며, 이는 개발자 커뮤니티가 코딩 문화와 AI 보조 코딩 방식에 대해 탐구하고 성찰하고 있음을 반영합니다. (출처: arohan, Ronald_vanLoon, nptacek)

💡 기타

미국 정부, 수십억 달러 규모 탄소 포집 공장 자금 지원 취소 가능성: 미국 에너지부는 두 개의 대규모 직접 공기 탄소 포집 공장에 대한 수십억 달러 규모의 자금 지원을 중단할 수 있습니다. 이 프로젝트들은 원래 10억 달러 이상의 정부 보조금을 받을 예정이었으나, 현재 ‘중단’ 상태에 직면해 있습니다. 에너지부는 아직 최종 결정을 내리지 않았으며, 이전에 200개 이상의 프로젝트를 중단하여 75억 달러를 절약했다고 밝혔지만, 이러한 불확실성은 미국 기후 기술 발전과 국제 경쟁력에 대한 업계의 우려를 불러일으켰습니다. (출처: MIT Technology Review)

미국 정부, 수십억 달러 규모 탄소 포집 공장 자금 지원 취소 가능성

로봇 기술의 새로운 발전: 유연한 손목부터 생체 모방 딱정벌레 및 휴머노이드 로봇까지: 로봇 기술 분야에서 여러 가지 발전이 이루어졌습니다. 새로운 병렬 로봇 손목은 좁은 공간에서 유연하고 인간과 유사한 움직임을 구현하여 작동 정밀도를 향상시켰습니다. 동시에 연구자들은 재난 구조를 위해 배낭을 멘 생체 모방 로봇 딱정벌레를 개발하고 있습니다. 또한 휴머노이드 로봇과 오토바이의 상호작용을 보여주는 보고서가 있었으며, 이는 인간 행동을 모방하는 생체 모방 기술의 능력을 보여줍니다. 이러한 발전은 복잡한 환경 적응성과 인간-로봇 상호작용 측면에서 로봇 기술의 한계를 함께 확장하고 있습니다. (출처: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)

로봇 기술의 새로운 발전: 유연한 손목부터 생체 모방 딱정벌레 및 휴머노이드 로봇까지