키워드:제미니 딥 씽크, IMO 2025, AI 훈련 데이터셋, AI 의료 면책 조항, AI 오피스 제품군, 커쎈쉰페이 X5, 문밸리 투자 유치, 링이완우 에이전트, 자연어 수학 추론, 데이터컴프 커먼풀 데이터 유출, 챗GPT 엑셀 기능, 로컬 대형 모델 오피스 노트북, 저작권 준수 AI 비디오 모델

🔥 주목할 만한 뉴스

Google Gemini Deep Think, 국제수학올림피아드(IMO) 금메달 획득: Google DeepMind의 Gemini Deep Think 모델이 IMO 2025에서 6문제 중 5문제를 맞춰 35/42점으로 금메달을 획득했습니다. 작년의 AlphaGeometry 및 AlphaProof와 달리, Gemini Deep Think는 형식 수학 언어로의 변환 없이 자연어를 사용하여 추론을 진행했습니다. 주요 돌파구는 병렬 추론으로, 여러 문제 해결 경로를 동시에 탐색하고 새로운 강화 학습 기술을 사용하여 다단계 추론, 문제 해결 및 정리 증명을 수행하며 고품질 수학 솔루션과 IMO 문제 해결 기술에 대한 훈련을 받았다는 점입니다. (출처: 量子位, 量子位)

OpenAI의 IMO 금메달 관련 발표 논란: OpenAI가 자사의 새로운 모델이 IMO에서 금메달을 획득했다고 발표했지만, 이 주장은 IMO 공식 및 학계 관계자들의 의문을 샀습니다. IMO 공식측은 OpenAI가 공식 협력 테스트에 참여하지 않았으며, “금메달” 성적은 공식적으로 인증되지 않았고, 폐막식 직후 성적을 발표한 OpenAI의 행동은 “무례하고 부적절하다”고 지적했습니다. 또한 OpenAI의 점수는 금메달 커트라인보다 약간 높을 뿐이며, 사소한 감점으로도 은메달로 떨어질 수 있습니다. (출처: 量子位)

대규모 AI 훈련 데이터셋 DataComp CommonPool, 수백만 개인 데이터 포함: 연구 결과, 대규모 AI 훈련 데이터셋인 DataComp CommonPool에 수백만 개의 여권, 신용카드, 출생 증명서 등 개인 식별 정보 이미지가 포함된 것으로 밝혀졌습니다. 연구원들은 CommonPool의 0.1% 데이터 서브셋에서 식별 가능한 얼굴 및 신원 정보가 포함된 수천 장의 이미지를 발견했으며, 따라서 실제 수량은 수억 개에 달할 것으로 추정됩니다. 이는 온라인 데이터 수집의 위험성을 보여줍니다. (출처: MIT Technology Review)

AI 기업, 챗봇이 의사가 아니라는 경고 중단: 연구에 따르면 AI 기업들은 건강 문제에 대한 답변에 의료 면책 조항 및 경고를 거의 포함하지 않고 있으며, 많은 주요 AI 모델은 건강 문제에 답변할 뿐만 아니라 추가 질문을 하고 진단을 시도하기도 합니다. 이러한 관행은 사용자가 안전하지 않은 의료 조언을 신뢰할 위험을 증가시킵니다. 연구원들은 OpenAI, Anthropic, DeepSeek, Google, xAI의 15개 모델을 테스트한 결과, 2025년에는 의료 질문에 답변할 때 경고를 포함하는 모델이 1% 미만인 반면, 2022년에는 이 비율이 26%를 넘었습니다. (출처: MIT Technology Review)

🎯 동향

OpenAI, ChatGPT에 Excel 및 PowerPoint 기능 개발 계획: OpenAI는 ChatGPT에 Excel 및 PowerPoint와 유사한 기능을 개발하고 있으며, 사용자는 자연어 프롬프트를 사용하여 스프레드시트와 프레젠테이션을 생성하고 편집할 수 있습니다. 이러한 기능은 ChatGPT 검색창 아래의 전용 버튼을 통해 액세스할 수 있으며, Microsoft Office와 호환되는 파일을 생성하는 것을 목표로 합니다. OpenAI는 다자간 실시간 문서 편집, 채팅 창, 회의록 작성 및 작업 관리 등의 기능을 포함하는 AI 오피스 제품군을 구축하는 것을 목표로 합니다. (출처: 36氪)

iFLYTEK, 세계 최초 로컬 대형 모델 탑재 오피스 노트북 X5 출시: iFLYTEK은 3세대 오피스 노트북 X5를 출시했습니다. 이는 세계 최초로 로컬 대형 모델을 탑재한 오피스 노트북입니다. X5는 8코어 9T의 AI 연산 능력을 갖추고 있어 네트워크 연결 없이도 음성-텍스트 변환, 회의록 작성, 콘텐츠 생성 등의 AI 기능을 사용할 수 있으며, 데이터 보안 및 개인 정보 보호를 보장합니다. 또한 X5는 더 가볍고 얇은 본체, 더 빠른 화면 주사율, 실제 종이와 펜에 더 가까운 필압 필기 경험을 제공합니다. (출처: 36氪)

Moonvalley, 1억 5,400만 달러 투자 유치, 영화 수준의 AI 비디오 모델 Marey 개발: Moonvalley는 8,400만 달러의 시리즈 A+ 투자를 유치하여 총 투자 금액이 1억 5,400만 달러에 달했습니다. AI 비디오 모델 Marey는 영화 제작을 위해 설계되었으며 저작권 준수, 전/중/후경 레이어 편집 및 3D 카메라 궤적 제어를 지원합니다. 단일 장면 렌더링 비용은 1~2달러에 불과하여 기존 VFX 비용보다 90% 이상 절감됩니다. Marey는 라이선스가 있는 데이터로 훈련되었으며, 제작자가 데이터 삭제 및 추적 보상을 신청할 수 있도록 하여 저작권 분쟁을 방지합니다. (출처: 36氪)

Kai-Fu Lee의 01.AI, Wan Zhi 엔터프라이즈 대형 모델 원스톱 플랫폼 2.0 및 엔터프라이즈급 Agent 출시: 01.AI는 Wan Zhi 엔터프라이즈 대형 모델 원스톱 플랫폼 2.0 버전을 출시하고 01.AI 엔터프라이즈급 Agent를 선보였습니다. 이는 AI를 기업의 “슈퍼 직원”으로 만들기 위한 것입니다. Agent는 대형 모델 기반의 작업 계획 능력을 갖추고 있으며, 추론 메커니즘을 통해 작업 단계를 자율적으로 판단하고 다양한 도구를 활용하여 복잡한 목표를 달성할 수 있으며, 컨설팅 서비스, 금융 거래 및 판매 고객 서비스 등 여러 분야에 적용되었습니다. (출처: 36氪)

JD.com, 세 곳의 Embodied AI 기업에 선도 투자, Liu Qiangdong 적극적인 투자 확대: JD.com은 Chunxin Robotics, Zhongqing Robotics, Zhuji Power 등 세 곳의 Embodied AI 기업에 선도 투자했습니다. Chunxin Robotics는 VLA 모델 및 로봇 하드웨어 업그레이드에 주력하고 있으며, Zhongqing Robotics는 오픈소스 휴머노이드 로봇 PM01을 양산하고 있으며, Zhuji Power는 Embodied AI 로봇 범용 플랫폼 구축을 강조하고 있습니다. JD.com의 투자 선호도는 소프트웨어와 하드웨어 통합, 양산 능력 및 현장 적용에 있습니다. (출처: 量子位)

중국과학원 & Alibaba, 대규모 정밀 사전 훈련 데이터 정제를 위한 RefineX 프레임워크 제안: 중국과학원 계산기술연구소와 Alibaba 등의 팀은 프로그램 편집 작업을 통해 대규모, 정밀 사전 훈련 데이터 정제를 위한 RefineX 프레임워크를 제안했습니다. RefineX는 전문가의 지도를 받은 고품질 엔드투엔드 최적화 결과를 편집 작업 기반 삭제 프로그램으로 추출하여 데이터를 효율적으로 정제하는 동시에 원본 텍스트의 다양성과 자연스러움을 유지합니다. RefineX로 정제된 데이터로 훈련된 모델은 다운스트림 작업에서 상당한 성능 향상을 보였습니다. (출처: 量子位)

판매자, AI 질의응답 최적화 서비스 GEO 활용 노출 증가, 정보 신뢰성 우려 제기: 판매자들은 AI 대형 모델 콘텐츠에 최적화된 GEO 서비스를 활용하여 구조화된 지식 제공 및 시나리오 기반 콘텐츠 설계를 통해 브랜드 정보를 대형 모델의 답변에 통합하여 노출을 늘리고 있습니다. 그러나 AI 대형 모델은 콘텐츠 수집 시 필터링 및 검증 능력이 부족하여 추천 결과에 편향이 발생하고, 심지어 불법 판매자에 의해 악용되어 허위 정보가 유포될 가능성도 있습니다. (출처: 36氪)

🧰 도구

Kimi K2: Kimi는 최신 MoE 기반 모델인 Kimi K2를 출시했습니다. 매개변수 규모는 1T이고, 활성 매개변수는 32B입니다. 이 모델은 코드, Agent 및 수학적 추론 작업에서 뛰어난 성능을 보이며 오픈소스 모델 중 SOTA 성능을 달성했습니다. K2는 MuonClip optimizer, 대규모 Agentic Tool Use 데이터 합성 및 범용 강화 학습 프레임워크 등의 기술을 채택하여 SWE Bench Verified, Tau2 및 AceBench 등의 벤치마크 테스트에서 모두 선두를 차지했습니다. (출처: 量子位)

Qwen3-235B-A22B-2507: Alibaba는 Qwen3-235B 모델을 업데이트하여 혼합 사고 모드를 비활성화하고 Instruct 및 Thinking 모델을 각각 훈련했으며, 성능이 더 향상된 Qwen3-235B-A22B-Instruct-2507 및 FP8 버전을 출시했습니다. 공식 평가에 따르면 새 버전의 Qwen3는 일부 지표에서 Kimi K2를 능가합니다. (출처: 量子位, Reddit r/LocalLLaMA)

📚 학습

Neural Networks: Zero to Hero: Andrej Karpathy의 딥러닝 강의로, 신경망 기초, 역전파, 언어 모델링, MLP, 활성화 함수, 기울기, BatchNorm, WaveNet, GPT 및 Tokenizer 등의 내용을 다룹니다. YouTube 비디오 강의 및 Jupyter Notebook 코드 예제를 통해 학습자가 처음부터 신경망을 구축하고 훈련하는 데 도움을 줍니다. (출처: GitHub Trending)

GR-3 기술 보고서: 범용 로봇 전략 GR-3의 개발에 대해 소개합니다. GR-3는 대규모 시각-언어-행동(VLA) 모델로, 새로운 객체, 환경 및 추상적 개념이 포함된 명령어에 일반화할 수 있으며, 소량의 인간 궤적 데이터를 통해 효율적인 미세 조정이 가능합니다. GR-3는 양손 조작 및 이동이 필요한 작업을 포함하여 장기간 및 정교한 작업 처리에도 능숙합니다. (출처: HuggingFace Daily Papers)

Kimi K2 기술 보고서: Moonshot AI는 Kimi K2의 기술 보고서를 발표하여 MuonClip optimizer, 대규모 Agentic Tool Use 데이터 합성, 범용 강화 학습 프레임워크 등 핵심 기술과 사전 훈련 및 후속 훈련 단계의 세부 사항을 포함한 모델 개발 과정을 자세히 설명했습니다. (출처: 量子位)

💼 비즈니스

Lovable, 2억 달러 시리즈 A 투자 유치, 기업 가치 10억 달러 달성: AI 동반자 앱 Lovable은 출시 8개월 만에 2억 달러의 시리즈 A 투자를 유치하여 기업 가치 10억 달러를 달성하며 유니콘 기업이 되었습니다. (출처: Reddit r/artificial)

Cursor, 기업용 AI 프로그래밍 도구 Koala 인수: AI 프로그래밍 도구 Cursor는 기업용 AI 프로그래밍 도구 Koala를 인수하여 GitHub Copilot에 도전장을 내밀었습니다. (출처: Reddit r/artificial)

Perplexity, 휴대폰 제조업체와 Comet AI 브라우저 사전 설치 협의: Perplexity는 휴대폰 제조업체와 자사 기기에 Comet AI 모바일 브라우저를 사전 설치하는 방안을 협의 중입니다. (출처: Reddit r/artificial)

🌟 커뮤니티

Claude Code 사용 제한 강화로 인한 사용자 불만: Anthropic은 Claude Code의 사용 제한을 강화했지만 사용자에게 알리지 않아 모델 성능 저하에 대한 불만과 코드 품질, 컨텍스트 일관성 및 UI 출력 등의 문제에 대한 불만이 제기되었습니다. 일부 사용자는 TDD(테스트 주도 개발)와 같은 더 체계적인 코딩 방법과 상세한 문서를 채택하여 Claude Code의 성능을 향상시키고 있습니다. (출처: Reddit r/artificial, Reddit r/ClaudeAI, Reddit r/ClaudeAI)

LLM 추론 능력에 대한 의문: Apple에서 발표한 논문 “The Illusion of Thinking”은 대형 언어 모델(LLM)이 실제로 추론 능력을 갖추고 있는지에 대한 논의를 촉발했습니다. 이 논문은 올바른 알고리즘을 제공하더라도 GPT-4, Claude 3.7, Gemini와 같은 추론 모델이 고도로 복잡한 논리 작업에서 완전히 실패한다고 지적합니다. (출처: Reddit r/MachineLearning)

AI 생성 가짜 광고에 대한 우려: 소셜 미디어에는 AI가 생성한 가짜 광고, 특히 “십 대들이 AI로 수백만 달러를 벌었다”는 식의 만화 캐릭터 광고가 넘쳐나 사용자들의 우려와 반감을 불러일으키고 있습니다. (출처: Reddit r/artificial)

AI 오픈소스에 대한 논의: Reddit 사용자들은 AI 모델을 오픈소스로 공개해야 하는지에 대한 문제를 논의했습니다. 일부는 인터넷과 마찬가지로 AI도 모든 사람이 사용하고 구축할 수 있도록 개방하여 인류의 발전을 촉진해야 한다고 주장합니다. 다른 일부는 오픈소스가 지적 재산권 및 데이터 보안 문제, AI 개발자에 대한 경제적 보상에 미치는 영향과 같은 새로운 문제를 야기할 것이라고 주장합니다. (출처: Reddit r/LocalLLaMA)

AI 동반자 앱에 대한 의견 양극화: 한 연구에 따르면 미국 십 대의 72%가 AI 동반자 앱을 사용해 본 적이 있다고 합니다. 일부는 AI 동반자가 정서적 지원과 도움을 줄 수 있다고 생각하는 반면, 다른 일부는 정신 건강 및 사회적 기술에 대한 잠재적 부정적 영향을 우려합니다. (출처: Reddit r/artificial, Reddit r/ChatGPT)

AI 음성 합성에 대한 평가: AI 음성 합성 기술이 발전함에 따라 많은 YouTube 제작자가 AI 더빙을 사용하기 시작하면서 비디오 품질 및 시청자 경험에 미치는 영향에 대한 논의가 촉발되었습니다. 일부는 AI 더빙이 감정과 개성이 부족하다고 생각하는 반면, 다른 일부는 효율성을 높이고 비용을 절감할 수 있다고 생각합니다. (출처: Reddit r/ArtificialInteligence)

OpenAI 비즈니스 모델에 대한 우려: OpenAI 및 Anthropic과 같은 기업은 아직 LLM에서 수익을 창출하지 못하고 있어 비즈니스 모델의 지속 가능성에 대한 우려가 제기되고 있습니다. 일부는 AI 기술의 보급 및 응용 분야 확대에 따라 이러한 기업이 결국 수익을 창출할 것이라고 예상합니다. 다른 일부는 높은 연산 비용과 치열한 시장 경쟁으로 인해 수익 창출이 더욱 어려워질 것이라고 생각합니다. (출처: Reddit r/ArtificialInteligence)

💡 기타

Blackbird: 오픈소스 OSINT 도구: Blackbird는 600개 이상의 플랫폼에서 사용자 이름과 이메일을 검색할 수 있는 강력한 오픈소스 OSINT(오픈소스 인텔리전스) 도구이며 무료 AI 기반 분석 기능을 제공합니다. WhatsMyName과 같은 커뮤니티 기반 프로젝트를 활용하여 낮은 오탐률과 고품질 결과를 보장합니다. 스마트 필터, PDF/CSV 내보내기 및 완전 자동 분석 기능을 포함하며, 이 모든 기능은 CLI를 통해 제공됩니다. (출처: GitHub Trending)

Trippy: 네트워크 진단 도구: Trippy는 traceroute와 ping 기능을 결합한 네트워크 진단 도구로, 네트워크 문제 분석에 도움을 주기 위해 고안되었습니다. Linux, BSD, macOS 및 Windows에서 실행되며 대부분의 패키지 관리자, 사전 컴파일된 바이너리 파일 또는 소스 코드에서 설치할 수 있습니다. (출처: GitHub Trending)

Anki: 지능형 간격 반복 플래시 카드 프로그램: Anki는 사용자가 정보를 더 효율적으로 학습하고 기억하는 데 도움이 되는 지능형 간격 반복 플래시 카드 프로그램입니다. GitHub에서 오픈소스로 제공되며 많은 사용자와 기여자가 있습니다. (출처: GitHub Trending)

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다