キーワード:AI訓練データ著作権, AlphaGenome, OpenAIハードウェア盗作, AI大学入試成績, Gemini CLI, RLT新手法, BitNet b1.58, Biomniエージェント, AI合理的使用判決, DNA塩基対予測, オルトマン盗作疑惑への対応, 大規模言語モデル数学能力向上, ターミナルAIエージェント無料割当量

🔥 焦点

AI学習データの著作権に関する画期的な判決:米裁判所、AIが合法的に購入した書籍を学習に利用することを「フェアユース」と判断:米連邦裁判所は、Anthropicに対する訴訟において、AI企業が合法的に購入した出版済みの書籍を大規模言語モデルの学習に使用することは「フェアユース」の範囲内であり、著者の事前の同意は不要であるとの判断を下しました。裁判所は、AIの学習は原作の「変容的利用」であり、原作市場を直接代替するものではなく、技術革新と公共の利益に資すると判断しました。しかし、裁判所は同時に、海賊版書籍を使用した学習はフェアユースに該当しないとし、Anthropicがその責任を負う可能性は依然として残っているとしました。この判決は2015年のGoogle Books訴訟の判例を参考にしており、AI学習データの著作権リスクを低減する重要な一歩と見なされ、他の同様の訴訟(OpenAIやMetaに対する訴訟など)の審理に影響を与える可能性があります。これ以前にも、Meta社は別の同様の著作権訴訟で有利な判決を得ており、裁判官は原告がMetaによる書籍のAIモデル学習利用が経済的損害をもたらしたことを十分に証明できなかったと判断しました。これらの判決は、AI業界のデータ取得と利用に関してより明確な法的指針を共通して提供していますが、合法的なデータ取得の重要性を強調しています。(来源: 量子位DeepLearning.AI Blogwiredmagazine)

Google DeepMindがAlphaGenomeを発表:AI「顕微鏡」が100万DNA塩基対の遺伝子変異の影響を予測:Google DeepMindは、最大100万塩基対のDNA配列を入力とし、数千種類の分子的特性を予測し、遺伝子変異の影響を評価できるAIモデルAlphaGenomeを発表しました。20以上のゲノム予測ベンチマークテストでトップの成績を収めています。AlphaGenomeは、高解像度の長配列コンテキスト処理、包括的なマルチモーダル予測、効率的な変異スコアリング、新規のスプライシング接続モデルなどの特徴を備え、単一モデルの学習時間はわずか4時間、計算予算は従来のEnformerモデルの半分です。このモデルは、科学者が遺伝子制御を理解し、疾患(特に希少疾患)の理解を加速し、合成生物学の設計を指導し、基礎研究を推進することを支援することを目的としています。現在、非商業的研究用途向けにAPI経由でプレビュー版が提供されており、将来的には完全版をリリースする予定です。(来源: 36氪Googledemishassabis)

谷歌DeepMind发布AlphaGenome:AI“显微镜”预测百万DNA碱基对基因变异影响

OpenAIハードウェア「模倣疑惑」問題がエスカレート、Altman氏が公開メールでIYOの訴訟に反論:AIハードウェアスタートアップ企業IYOが、OpenAIおよび同社が買収したハードウェア企業io(元AppleデザイナーJony Ive氏設立)を商標権侵害と製品模倣で提訴したことに対し、OpenAI CEOのAltman氏はソーシャルメディアで公開反論し、IYOの訴訟を「愚かで、失望させられ、完全に間違っている」と述べました。Altman氏はメールのスクリーンショットを提示し、IYOの創業者Jason Rugolo氏が訴訟前にOpenAIに1000万ドルの投資または買収を積極的に求めていたこと、そしてOpenAIがioの買収を発表した後も自社の知的財産権の共有を望んでいたことを示しました。Altman氏は、IYOが投資または買収が失敗に終わった後に訴訟を起こしたと考えています。IYOの創業者は、Altman氏がネット上で私的制裁を行っていると反論し、自社製品名の権利を主張しています。これ以前に、裁判所はIYOの一時的差止命令を承認し、OpenAIによるIOロゴの使用を差し止めていました。OpenAI側は、自社のハードウェア製品はIYOのカスタム耳装着型デバイスとは異なり、プロトタイプデザインは未定で、少なくとも1年後まで発売されないと述べています。(来源: 量子位36氪)

奥特曼回应OpenAI硬件“抄袭门”争议升级,奥特曼公开邮件反驳IYO诉讼

AI大規模モデルが再び大学入試に挑戦、全体成績が著しく向上、数学能力の進歩が突出:GeekParkの2025年度AI大学入試模試の結果によると、主要な大規模モデル(豆包、DeepSeek R1、ChatGPT o3など)の総合成績は昨年より大幅に向上し、トップクラスの大学に挑戦する潜在能力を示し、トップと推定される豆包は山東省で上位900名以内に入ると予測されています。AIの文系理系への偏りはやや緩和され、理系の平均点はより急速に上昇し、数学が最も進歩の著しい科目となり、平均点は84.25点上昇し、国語と英語を上回りました。マルチモーダル能力が差をつける鍵となり、特に物理や地理など画像問題が多い科目で優れた成績を収めました。AIは複雑な推論や計算で優れた能力を発揮するものの、視覚情報が混乱している単純な問題(ある数学のベクトル問題など)では依然として誤りを犯すことがあります。作文に関しては、AIは構成が整い、論拠が豊富な文章を作成できますが、深い思弁や感情的な共感に欠け、最高レベルの傑作を生み出すことは困難です。(来源: 36氪)

AI大模型再战高考,整体成绩显著提升,数学能力进步突出

🎯 動向

Google Gemini 2.5 Pro搭載のGemini CLIがリリース、高額な無料枠提供が注目を集める:Googleは、ターミナル環境で動作するAIアシスタント、Gemini CLIを正式にリリースしました。これはGemini 2.5 Proモデルをベースとしています。その特徴は、非常に寛大な無料利用枠を提供している点です。100万トークンのコンテキストウィンドウをサポートし、毎分60回、毎日1000回のモデル呼び出しが可能で、これはAnthropicのClaude Codeなどの有料ツールに対して強力な競争力となります。Gemini CLIはApache 2.0オープンソースライセンスを採用し、コード作成、デバッグ、プロジェクト管理、ドキュメント検索、およびMCPを介した他のGoogleサービス(画像・動画生成など)の呼び出しをサポートします。Googleは、複雑な開発タスクを処理する際の汎用モデルの優位性を強調し、純粋なコードモデルはむしろ制限される可能性があると考えています。コミュニティはこの発表に熱狂的に反応し、CLI AIツールの普及と競争を促進すると考えています。(来源: 36氪Reddit r/LocalLLaMAdotey)

谷歌Gemini 2.5 Pro驱动的Gemini CLI发布,提供高额免费配额引发关注

Sakana AIが新手法RLTを提案、7B小規模モデルの「教育」効果がDeepSeek-R1を上回る:Transformerの作者の一人であるLlion Jones氏が設立したSakana AIは、新しい強化学習教師(RLTs)手法を提案しました。この手法では、教師モデルは問題を最初から解決するのではなく、既知の解決策に基づいて明確な段階的説明を出力し、人間の優れた教師の「発見的」教育を模倣します。実験によると、この手法で訓練された7B RLT小規模モデルは、推論スキルを伝授する点で、671BのDeepSeek-R1よりも効果的であり、かつ自身より3倍大きな学生モデル(32Bなど)を効果的に訓練でき、訓練コストも大幅に削減されます。この手法は、従来の教師モデルが自身の問題解決能力に依存し、訓練が遅く高価であるという問題を解決することを目的とし、教師の訓練をその真の目的(学生モデルの学習支援)と整合させることで効率を向上させます。(来源: 量子位SakanaAILabs)

Sakana AI提出RLT新方法,7B小模型“教学”效果超DeepSeek-R1

MicrosoftらがBitNet b1.58を提案、低精度高推論性能LLMを実現:Microsoft、中国科学院大学、清華大学の研究者らは、BitNet b1.58モデルを更新しました。そのほとんどの重みは-1、0、または+1の3つの値(約1.58ビット/パラメータ)に制限されており、20億パラメータ規模でトップクラスの全精度モデルに匹敵する性能を発揮します。このモデルは、量子化対応訓練、2段階学習率、重み減衰などの綿密に設計された訓練戦略によって最適化され、16の一般的なベンチマークテストにおいて、Qwen2.5-1.5B、Gemma-3 1Bなどよりも速度とメモリ使用量で優れており、平均精度はQwen2.5-1.5Bに近く、4ビット量子化版のQwen2.5-1.5Bを上回っています。この研究は、ハイパーパラメータを細かく調整することで、低精度モデルでも高性能を実現できることを示し、効率的なLLM展開のための新しいアイデアを提供します。(来源: DeepLearning.AI Blog)

微软等提出BitNet b1.58,实现低精度高推理性能LLM

スタンフォード大学などがBiomni生物研究インテリジェントエージェントを発表、100以上のツールとデータベースを統合:スタンフォード大学、プリンストン大学などの研究機関は、広範な生物学研究向けに設計されたAIエージェントBiomniを発表しました。このエージェントはClaude 4 Sonnetをベースとし、25の生物学専門分野(ゲノミクス、免疫学、神経科学など)の最近の論文2500本から抽出・選別された150のツール、約60のデータベース、約100の一般的な生物学ソフトウェアパッケージを統合しています。Biomniは、質問応答、仮説提案、プロセス設計、データセット分析、グラフ生成など、さまざまなタスクを実行できます。CodeActフレームワークを採用し、反復的な計画、コード生成、実行を通じてクエリに応答し、別個のClaude 4 Sonnetインスタンスを判定器として導入し、中間出力の妥当性を評価します。Lab-benchなど複数のベンチマークテストや実際のケーススタディにおいて、Biomniは単独のClaude 4 Sonnetや文献検索で強化されたClaudeモデルを上回る性能を示しました。(来源: DeepLearning.AI Blog)

斯坦福等机构推出Biomni生物研究智能体,整合百余工具与数据库

AnthropicがClaude Codeの新機能「AI駆動のArtifactsを作成・共有」を発表:Anthropicは、AIプログラミングアシスタントClaude Codeに新機能を導入し、ユーザーが「Artifacts」(小規模なAIアプリケーションやツールと理解できる)を作成、ホスト、共有し、Claudeのインテリジェンスをこれらの作品に直接埋め込むことを可能にしました。これは、ユーザーがClaudeでコードスニペットを生成したり分析を行ったりするだけでなく、機能的なAI駆動のアプリケーションを構築できることを意味します。重要な特徴は、これらのAIアプリケーションを共有する際、閲覧者は自身のClaudeアカウントで認証を行い、その使用量は作成者ではなく閲覧者自身のサブスクリプション枠に計上されることです。この機能は現在ベータ段階にあり、すべての無料、Pro、Maxユーザーに公開されており、AIアプリケーション作成のハードルを下げ、AI能力の普及と共有を促進することを目的としています。(来源: kylebrussellReddit r/ClaudeAI)

Maya ResearchがVeena TTSモデルを発表、ヒンディー語と英語をサポート、よりインド現地に近い音声:Maya Researchは、Veenaと名付けられたテキスト音声合成(TTS)モデルを発表しました。このモデルは3B Llamaアーキテクチャをベースとし、Apache 2.0ライセンスを採用しています。Veenaの顕著な特徴は、コードミックス(code-mix)のシナリオを含む、インド訛りの英語とヒンディー語の音声を生成できることであり、既存のTTSモデルにおけるインド現地化発音の不備を解決します。このモデルの遅延は80ミリ秒未満で、無料のGoogle Colab環境で実行でき、Hugging Face Hubで公開されています。チームは、タミル語、テルグ語、ベンガル語など他のインド言語のサポートを積極的に開発していると述べています。(来源: huggingfacehuggingface)

Maya Research发布Veena TTS模型,支持印地语和英语,音色更贴近印度本土

智象未来がvivago2.0を発表、マルチモーダル生成・編集能力を統合:AIの大家である梅涛氏が設立した智象未来(HiDream.ai)は、マルチモーダルAI創作ツールvivago2.0を発表しました。この製品は、画像生成、画像から動画への変換、AIポッドキャスト(リップシンク)、エフェクトテンプレートなどの機能を統合し、ユーザーがインスピレーションを共有・獲得できるクリエイティブコミュニティも設けています。そのコア技術は、新しい画像インテリジェントエージェントHiDream-A1に基づいており、このエージェントは、以前にオープンソース化され、テキストからの画像生成コンペでトップに立ったHiDream-I1(170億パラメータの画像生成基盤モデル)とHiDream-E1(インタラクティブ画像編集モデル)の進化したクローズドソース版を統合しています。vivago2.0は、マルチモーダルコンテンツ作成のハードルを下げ、数百種類のエフェクトテンプレートを提供し、自然言語対話による画像の生成と修正(Image Agent)をサポートすることを目的としています。(来源: 量子位)

智象未来发布vivago2.0,集成多模态生成与编辑能力

NVIDIAがRTX 5050シリーズGPUを発表、デスクトップ版とノートPC版でVRAM構成が異なる:NVIDIAはGeForce RTX 5050シリーズGPUを正式に発表しました。デスクトップ版とノートPC版があり、7月に発売予定で、中国国内のデスクトップ版の希望小売価格は2099元からです。デスクトップ版RTX 5050は2560個のBlackwell CUDAコアを搭載し、8GB GDDR6 VRAMを装備、最大消費電力は130Wです。ノートPC版RTX 5050も2560個のCUDAコアを搭載していますが、より電力効率の高い8GB GDDR7 VRAMを装備しています。NVIDIAは、DLSS 4技術と組み合わせることで、RTX 5050は『サイバーパンク2077』などのゲームでレイトレーシングのフレームレートが150fpsを突破でき、RTX 3050と比較してラスタライズ性能が平均で60%(デスクトップ版)および2.4倍(ノートPC版)向上すると主張しています。今回のVRAM構成の差異化は、NVIDIAの異なる市場セグメントにおけるコストと性能のバランス戦略を反映しています。(来源: 量子位)

英伟达发布RTX 5050系列GPU,桌面版与笔记本版显存配置各异

LM StudioがMCPプロトコルをサポートするよう更新、ローカルLLMとMCPサーバーを接続可能に:デスクトップLLM実行ツールLM Studioが新バージョン(0.3.17)をリリースし、モデルコンテキストプロトコル(MCP)のサポートを追加しました。ユーザーは、ローカルで実行されている大規模言語モデルをMCP互換サーバーに接続し、例えば外部ツールやサービスを呼び出すことができるようになりました。LM Studioはこのためにプログラムインターフェースを更新し、ユーザーがMCPサービスをインストールおよび設定できるようにし、ローカルMCPサーバープロセスを自動的にロードおよび管理できるようにしました。設定を容易にするため、LM Studioはワンクリックでインポート可能なMCPサーバー設定リンクを生成するためのオンラインツールも提供しています。(来源: multimodalartkarminski3)

LM Studio更新支持MCP协议,可连接本地LLM与MCP服务器

Gradioが軽量な実験追跡ライブラリTrackioを発表:Hugging Face傘下のGradioチームは、軽量な実験追跡および可視化ライブラリであるTrackioを発表しました。このツールは1000行未満のPythonコードで書かれており、完全にオープンソースで無料であり、ローカルまたはホスト環境での使用をサポートしています。Trackioは、開発者が機械学習実験プロセスにおける各種指標と結果をより便利に記録・監視し、実験管理プロセスを簡素化することを支援することを目的としています。(来源: ClementDelangue_akhaliq)

OmniGen 2発表:Apache 2.0ライセンスのSOTA画像編集および多機能ビジュアルモデル:新しいOmniGen 2モデルは、画像編集においてSOTA(State-of-the-Art)レベルに達しており、Apache 2.0オープンソースライセンスを採用しています。このモデルは画像編集に優れているだけでなく、コンテキスト生成、テキストから画像への変換、視覚理解など、さまざまなタスクを実行できます。ユーザーはHugging Face Hubで直接デモとモデルを体験できます。(来源: huggingface)

OmniGen 2发布:Apache 2.0许可的SOTA图像编辑及多功能视觉模型

Atlasアーキテクチャ提案:長期コンテキスト記憶を備え、Transformerに挑戦:新たに提案されたAtlasアーキテクチャは、LLMにおける長期記憶問題の解決を目指しており、言語モデリングタスクにおいてTransformerや現代の線形RNNよりも優れていると主張しています。Atlasはテスト時にコンテキストを記憶する方法を学習する能力を備え、Titansモデルの有効コンテキスト長を向上させ、BABILongベンチマークテストでは1000万コンテキストウィンドウ長で80%以上の精度を達成します。研究者らはまた、Atlasの考え方に基づいて、厳密に一般化するsoftmax attentionの別のモデル群についても議論しています。(来源: behrouz_ali)

Atlas架构提出:具长程上下文记忆,挑战Transformer

Moondream 2Bビジュアルモデル更新:視覚的推論とUI理解を強化、テキスト生成速度40%向上:Moondream 2Bビジュアルモデルの新バージョンがリリースされ、視覚的推論、物体検出、UI理解が改善され、テキスト生成速度が40%向上しました。これは、小規模なマルチモーダルモデルが特定の能力において継続的に最適化されており、より効率的で正確な視覚言語インタラクションを提供することを目指していることを示しています。(来源: mervenoyann)

Inworld AIとModularが提携し、低コスト高品質TTSモデルを発表:Inworld AIは、最先端のTTSコストを20分の1、100万文字あたり5ドルに削減するとされる新しいテキスト音声合成(TTS)モデルを発表しました。このモデルはLlamaアーキテクチャに基づいており、そのトレーニングとモデリングコードはオープンソース化される予定です。パートナーのModularは、技術提携を通じて、NVIDIA B200上で最低遅延、最速のTTS推論プラットフォームを実現し、共同技術報告書を発表すると述べています。(来源: clattner_llvm)

Higgsfield AIがSoulモデルを発表:高美的写真生成に特化:Higgsfield AIは、Higgsfield Soulと名付けられた新しい写真生成モデルを発表し、高い美的価値とファッションレベルのリアリズムを特徴としています。このモデルは50種類以上の入念にキュレーションされたプリセットを提供し、プロの写真撮影に匹敵する画像を生成することを目指し、従来のスマートフォン写真に挑戦します。(来源: _akhaliq)

🧰 工具

Gemini CLI:Googleが発表したオープンソースのターミナルAIエージェント、毎日1000回のGemini 2.5 Pro無料呼び出しを提供:Googleは、オープンソースのコマンドラインAIエージェントであるGemini CLIを発表しました。これにより、ユーザーはターミナルで直接Gemini 2.5 Proモデルを使用できます。このツールは100万トークンのコンテキストウィンドウを提供し、無料ユーザーは毎日最大1000回(毎分60回)のリクエスト枠を得られます。Gemini CLIは、コード作成、デバッグ、ファイルシステムI/O、ウェブコンテンツ理解、プラグイン、およびMCPプロトコルをサポートし、開発者がより効率的にソフトウェアを構築・保守できるよう支援することを目的としています。そのオープンソース性(Apache 2.0ライセンス)と高い無料枠により、Claude Codeなどの既存ツールの強力な競合相手となり、ローカルモデルのサポートを推進する可能性があります。(来源: Reddit r/LocalLLaMAdoteyyoheinakajima)

Gemini CLI:谷歌推出的开源终端AI智能体,提供每日1000次Gemini 2.5 Pro免费调用

AnthropicがClaude Codeの新機能「AI駆動のArtifactsを作成・共有、ユーザーは自身の利用枠を使用」を発表:Anthropicは、AIプログラミングアシスタントClaude Codeに新機能を導入し、ユーザーが「Artifacts」(小規模なAIアプリケーションやツールと理解できる)を作成、ホスト、共有し、Claudeのインテリジェンスをこれらの作品に直接埋め込むことを可能にしました。これは、ユーザーがClaudeでコードスニペットを生成したり分析を行ったりするだけでなく、機能的なAI駆動のアプリケーションを構築できることを意味します。重要な特徴は、これらのAIアプリケーションを共有する際、閲覧者は自身のClaudeアカウントで認証を行い、その使用量は作成者ではなく閲覧者自身のサブスクリプション枠に計上されることです。この機能は現在ベータ段階にあり、すべての無料、Pro、Maxユーザーに公開されており、AIアプリケーション作成のハードルを下げ、AI能力の普及と共有を促進することを目的としています。(来源: kylebrussellReddit r/ClaudeAIdotey)

LM StudioがMCPプロトコルをサポートするよう更新、ローカルLLMとMCPサーバーを接続可能に:デスクトップLLM実行ツールLM Studioが新バージョン(0.3.17)をリリースし、モデルコンテキストプロトコル(MCP)のサポートを追加しました。ユーザーは、ローカルで実行されている大規模言語モデルをMCP互換サーバーに接続し、例えば外部ツールやサービスを呼び出すことができるようになりました。LM Studioはこのためにプログラムインターフェースを更新し、ユーザーがMCPサービスをインストールおよび設定できるようにし、ローカルMCPサーバープロセスを自動的にロードおよび管理できるようにしました。設定を容易にするため、LM Studioはワンクリックでインポート可能なMCPサーバー設定リンクを生成するためのオンラインツールも提供しています。(来源: multimodalartkarminski3)

LM Studio更新支持MCP协议,可连接本地LLM与MCP服务器

Superconductor:モバイルまたはデスクトップでClaude Codeエージェントチームを管理するツール:Superconductorは、ユーザーが携帯電話やノートパソコンから複数のClaude Codeエージェントで構成されるチームを管理できる新しいツールです。ユーザーは非公式なタスク指示書(tickets)を作成し、各指示書に対して複数のエージェントを起動でき、各エージェントは独自のリアルタイムアプリケーションプレビューを持ちます。開発者は、最もパフォーマンスの高いエージェントの成果をワンクリックでPR(Pull Request)として生成できます。このツールは、マルチエージェントコラボレーションとコード生成プロセスを簡素化することを目的としています。(来源: full_stack_dl)

UdioがSessions機能を発表、AI音楽編集の精度を向上:AI音楽生成プラットフォームUdioは、標準版およびプロ版のサブスクリプションユーザー向けに「Sessions」機能を発表しました。この機能は、トラック編集用の新しいタイムラインビューを導入し、ユーザーがより正確に音楽を制作できるようにし、AIのランダム生成への依存を減らします。現在、Sessionsはトラックの拡張または編集をサポートしており、将来的にはさらに多くの機能が追加される予定です。(来源: TomLikesRobots)

Ollamaクライアントが更新、MCP統合をサポート、GitHubスター数が1000を突破:Ollamaクライアントが更新され、そのツール呼び出し機能を任意のAnthropic MCPサーバーと統合できるようになりました。これは、ユーザーがOllamaのローカル実行モデルの利便性とMCPが提供する外部ツール能力を組み合わせることができることを意味します。同時に、このプロジェクトのGitHubでのスター数は1000を超えました。(来源: ollama)

Ollama客户端更新,支持MCP集成,GitHub星标破千

📚 学習

Andrew Ng氏が新コースを発表:ACPエージェント通信プロトコル:DeepLearning.AIはIBM Researchと共同で、エージェント通信プロトコル(ACP)に関する短期コースを発表しました。ACPは、統一されたRESTfulインターフェースを通じてエージェント間の通信を標準化するオープンプロトコルであり、複数のチームやフレームワークをまたいでマルチエージェントシステムを構築する際の統合の課題を解決することを目的としています。このコースでは、ACPを使用して異なるフレームワーク(CrewAI、Smoljamesなど)で構築されたエージェントを接続し、シーケンシャルおよび階層的なワークフローコラボレーションを実現し、ACPエージェントをBeeAIプラットフォーム(オープンソースのエージェント登録・共有プラットフォーム)にインポートする方法を学びます。受講者はACPエージェントのライフサイクルを学び、MCP(モデルコンテキストプロトコル)、A2A(エージェント間)などのプロトコルと比較します。(来源: AndrewYNg)

ジョンズ・ホプキンス大学がDSPyコースを開設:ジョンズ・ホプキンス大学はDSPyに関するコースを開設しました。DSPyは、LLMのプロンプトと重みをアルゴリズム的に最適化するためのフレームワークであり、従来手動で調整が必要だったプロンプトエンジニアリングのプロセスを、より体系的でプログラム可能なモジュール構築と最適化のプロセスに変換します。Shopify CEOのTobi Lutke氏も、DSPyがコンテキストエンジニアリングのための彼の主要なツールであると述べています。(来源: stanfordnlplateinteraction)

约翰霍普金斯大学推出DSPy课程

LM Studioチュートリアル:オープンソースHugging Faceモデルを使用してローカルでプライベートなChatGPT風体験を実現:Niels Rogge氏は、LM StudioとHugging Face上のオープンソースモデル(Mistral 3.2-Smallなど)を組み合わせて、ローカルで100%プライベートかつオフラインのChatGPT風体験を実現する方法を実演するYouTubeチュートリアルを公開しました。チュートリアルでは、GGUF、量子化などの概念、およびモデルが4ビット量子化下でも大きなスペースを占有する理由を説明し、LM StudioとOpenAI APIの互換性を示しています。(来源: _akhaliq)

_akhaliq

LlamaIndexがエージェントの記憶に関するオンラインセミナーを開催:LlamaIndexはAIMakerspaceと共同で、エージェントの記憶に関するオンラインディスカッションを開催します。内容は、永続的なチャット履歴、静的、事実、ベクトルブロックを使用した長期記憶の実装、カスタム記憶実装ロジック、および記憶が不可欠となる場合などの議題をカバーします。このディスカッションは、開発者が対話において真のコンテキストを必要とするエージェントを構築するのに役立つことを目的としています。(来源: jerryjliu0)

LlamaIndex将举办关于智能体记忆的在线研讨会

WeaviateポッドキャストがRAGベンチマークと評価について議論:Weaviateポッドキャスト第124回では、検索評価分野で重要な貢献をしてきたNandan Thakur氏を招き、検索拡張生成(RAG)のベンチマークテストと評価について議論しました。内容は、BEIR、MIRACL、TREC、および最新のFreshStackなどのベンチマーク、ならびにRAGにおける推論、クエリ作成、ループ検索、ページ分割検索結果、ハイブリッドリトリーバーなど、複数の議題に及びます。(来源: lateinteraction)

Weaviate播客探讨RAG基准与评估

PyTorchがflux-fastレシピを発表、H100上でFluxモデルを2.5倍高速化:PyTorchは、flux-fastという名前のシンプルなレシピを発表しました。これは、複雑な調整なしにH100 GPU上でFluxモデルの実行速度を2.5倍に向上させることを目的としています。このソリューションは、高性能コンピューティングの実装を簡素化することを目的としており、関連コードが提供されています。(来源: robrombach)

PyTorch推出flux-fast配方,H100上Flux模型加速2.5倍

MLSys 2026会議情報が公開:MLSys 2026会議は、2026年5月にシアトル(ベルビュー)で開催される予定で、論文提出期限は今年の10月30日です。MLSys 2025のすべての会議録画は、公式サイトで無料で視聴可能です。この会議は、機械学習システム分野の研究と進歩に焦点を当てています。(来源: JeffDean)

MLSys 2026会议信息公布

スタンフォード大学CS336コース「ゼロから構築する言語モデル」が注目を集める:スタンフォード大学でPercy Liang氏らが教えるCS336コース「ゼロから構築する言語モデル」(Language Models from Scratch) が高い評価を得ています。このコースは、学生が言語モデルの技術的詳細を深く理解し、自らモデルを構築することで研究者と技術的詳細との乖離を埋めることを目的としています。コース内容と課題は、LLMの専門家になるための重要な学習リソースと見なされています。(来源: nrehiew_jpt401)

💼 商業

MetaがScale AIに143億ドルを投資し、CEOのAlexandr Wang氏を招聘、AI研究開発を加速:Meta社はAI能力強化のため、データラベリング企業Scale AIと契約を結び、143億ドルを投じて同社の非議決権株式49%を取得し、創業者兼CEOのAlexandr Wang氏とそのチームを招聘しました。Alexandr Wang氏はMetaの超知能研究に特化した新設ラボを担当します。この動きは、Llama 4モデルの反響が芳しくなく、AI研究部門の人事混乱に対応するため、MetaにトップクラスのAI人材と大規模データ運用能力を注入することを目的としています。Scale AIは資金をイノベーション加速と株主への一部資金分配に充て、最高戦略責任者のJason Droege氏が暫定CEOに就任します。この取引は、直接買収を避けることで一部の政府審査を回避した可能性があります。(来源: DeepLearning.AI Blog)

Meta斥资143亿美元投资Scale AI并招募其CEO Alexandr Wang,加速AI研发

OpenRouterが4000万ドルのシリーズA資金調達を完了、a16zとMenloがリード:LLM推論のコントロールプレーンおよびモデルマーケットプレイスであるOpenRouterは、a16zとMenlo VenturesがリードするシードラウンドとシリーズAラウンドで合計4000万ドルの資金調達を完了したと発表しました。OpenRouterは、開発者がさまざまなLLMを選択して使用するための統一インターフェースとなることを目指しており、現在400以上のモデルを提供し、年間処理トークン量は100兆に達しています。資金調達は、サポートするモデルモダリティ(画像生成、マルチモーダルインタラクションモデルなど)の拡張、よりスマートなルーティングメカニズム(地理的ルーティング、エンタープライズレベルのGPU割り当て最適化など)の実現、およびモデル発見機能の強化に使用されます。(来源: amasadswyx)

OpenRouter完成4000万美元A轮融资,a16z和Menlo领投

人型ロボット企業「霊宝CASBOT」が約1億元のエンジェルプラスラウンド資金調達を完了、Lens Technologyがリード:人型ロボットブランド「霊宝CASBOT」は、約1億元のエンジェルプラスラウンド資金調達を完了したと発表しました。このラウンドはLens Technologyがリードし、天津佳益および既存株主である国投創合、河南アセットがフォローオンしました。資金は製品量産、技術研究開発、市場拡大の加速に使用されます。霊宝CASBOTは汎用人型ロボットと具身知能の実用化に注力しており、特殊作業向けとより広範なヒューマン・マシン・インタラクションシーン(案内、教育など)向けの2つの二足歩行型ロボットCASBOT 01と02を発表しています。同社の中核技術には、強化学習による事後訓練と組み合わせた階層的エンドツーエンドモデルが含まれ、すでに工業製造および鉱物エネルギー分野で招金集団、中鉱集団などと提携しています。(来源: 36氪36氪)

人形机器人公司「灵宝CASBOT」获近亿元天使+轮融资,蓝思科技领投

🌟 コミュニティ

Andrej Karpathy氏、「プロンプトエンジニアリング」に代わり「コンテキストエンジニアリング」を提唱、LLMアプリケーション構築の複雑性を強調:Andrej Karpathy氏はTobi Lutke氏の意見に賛同し、「プロンプトエンジニアリング」よりも「コンテキストエンジニアリング」の方が、産業レベルのLLMアプリケーションの中核スキルをより正確に表現していると主張しています。彼は、プロンプトは通常、ユーザーが日常的に入力する短いタスク記述を指すのに対し、コンテキストエンジニアリングは、コンテキストウィンドウ内にタスク記述、少数例、RAG、マルチモーダルデータ、ツール、状態履歴などの情報を正確に埋め込み、LLMのパフォーマンスを最適化するための精巧な芸術であり科学であると指摘しています。彼はまた、LLMアプリケーションはそれだけにとどまらず、問題分解、制御フロー、マルチモデルスケジューリング、UI/UX、セキュリティ評価など、一連の複雑なソフトウェアエンジニアリングの問題を解決する必要があるため、「ChatGPTのラッパー」という言い方は誤りであると強調しています。(来源: karpathycode_stardotey)

Hugging Faceが収益モデルに関するコミュニティの疑問に対応するため有料チームプランを発表:Hugging Faceがどのように収益を上げているのかというコミュニティからの疑問(ユーザー@levelsioのツイートなどが引き金)に対し、Hugging Faceの共同創業者Clement Delangue氏は「収益化不安を煽られた」とユーモラスに反応し、新しい有料プレミアムチームプランを発表しました。Hugging Faceは、多数のAIモデルをホストし、無料APIを提供し、APIキーを強制しないプラットフォームとして、そのビジネスモデルは常にコミュニティの議論の的となっていました。新プランの発表は、同社が積極的に商業化の道を模索・拡大していることを示しています。(来源: huggingfaceClementDelangue)

Hugging Face推出付费团队计划以应对盈利模式的社区疑问

AIコードアシスタントのユーザーロイヤルティとマルチツール連携がコミュニティで話題に:The Informationの報道によると、開発者のコーディングアシスタントに対するロイヤルティは想像以上に高い可能性があると指摘されています。同時に、コミュニティでは、開発者が同じコードリポジトリ内でClaude Code、Codex (CLI)、Gemini (CLI)など複数のAIコーディングツールを同時に使用する現象も見られます。これは、開発者が効率向上のために様々なAIツールを積極的に試していること、そして単一のツールに完全に依存するのではなく、自身のワークフローに最適な特定の機能の組み合わせを探している可能性を反映しています。(来源: steph_palazzolocode_star)

社区热议AI代码助手用户忠诚度及多工具协作

AIが医療診断で潜在能力を発揮、「セカンドオピニオン」議論を呼ぶ:ソーシャルメディアで再びAI補助診断の事例が登場し、喉の痛みを訴える患者が医師から経過観察を勧められた後、ChatGPTでアドバイスを得て超音波検査を受け、最終的に甲状腺がんを発見しました。このような出来事は議論を呼び、医療問題においてAIを利用して「セカンドオピニオン」を得ることを奨励し、これが命を救う可能性があるとされています。同時に、アリババ達摩院のGRAPEモデルが通常のCTスキャンで早期胃がんを検出する研究も『Nature Medicine』に掲載され、AIのがん早期発見における大きな可能性を示しています。(来源: aidan_mclauYuchenj_UW)

AI在医疗诊断中展现潜力,引发“第二意见”讨论

AI時代の「発狂文学」とAIによる寄り添い現象:若者の間で流行している「発狂文学」は、感情のはけ口であり、ささやかな抵抗の手段として、AIツールと交錯しつつあります。多くのユーザーが、生成系AI(文小言の蛋小黄など)を感情のはけ口や寄り添いの相手として利用し、孤独を紛らわせ、慰めを得、さらには意思決定の補助(喧嘩の反省など)に用いています。AIはその忍耐強さ、偏見のなさ、いつでも利用可能という特性から、低コストでプライバシー性の高い「電子の友人」となり、ユーザーが混乱した時に慰めを見つける手助けをし、精神状態の改善に役立つと考えられています。(来源: 36氪)

AI时代“发疯文学”与AI陪伴现象

LLMが汎用人工知能(AGI)であるか否かについての議論が続く:コミュニティでは、大規模言語モデル(LLM)が汎用人工知能(AGI)に到達するかどうか、またいつ到達するかについての議論が続いています。LLMは多くのタスクで優れた性能を発揮するものの、真のAGIにはまだ距離があり、特に人間の科学的天才の理論や内部動作データがない状況ではなおさらだという意見があります。AGIの実現時期についても、近い将来の2028年から、より遠い2035~2040年まで、様々な見解が存在します。(来源: menhguin)

关于LLM是否是通用智能(AGI)的讨论持续

💡 その他

世界初のチャットボットEliza、60年ぶりに復元成功:マサチューセッツ工科大学の科学者ジョセフ・ワイゼンバウム氏が1960年代半ばに発明した世界初のチャットボットElizaは、オリジナルコードが長年失われていましたが、そのプリントアウトが再発見されました。スタンフォード大学とマサチューセッツ工科大学のチームの努力により、オリジナルコードのクリーンアップとデバッグ、機能の修復、シミュレーション実行環境の開発などを経て、Elizaは60年ぶりに「復活」しました。オリジナルのElizaは、ユーザーが入力したテキストを分析し、キーワードを抽出して文を再構成することで応答し、ロジャーズ派セラピストのイメージでユーザーと対話し、多くのテスターに感情的な愛着を抱かせました。修復されたElizaのコードとシミュレーターはGithubで公開され、一般に体験できるようになっています。(来源: 36氪)

世界上首个聊天机器人Eliza在60年后被成功复原

AI画像生成ツールMidjourney、ディズニーなどから著作権訴訟に直面するも、独自の創作モデルが人気:AI画像生成プラットフォームMidjourneyは、生成された画像がディズニーやユニバーサル・ピクチャーズなどの企業の視覚資産の著作権を侵害する可能性があるとして、法的訴訟に直面しています。しかし、このツールは、Discordコミュニティでテキストプロンプトを通じて高度に芸術的で様式化された画像を生成するという独自の創作モデルにより、世界中のクリエイターに広く受け入れられています。Midjourneyチームは50人未満で、資金調達は行っていませんが、年間収益は2億ドルに達しています。その製品哲学は「想像力至上」を強調し、AIを人間の思考を拡張するエンジンとして位置づけ、単純な代替ツールではなく、「非ツール化」されたミニマルなインタラクションとコミュニティ共創文化を通じて、デジタルクリエイティブのパラダイムを再構築しています。(来源: 36氪)

AI图像生成工具Midjourney面临迪士尼等版权诉讼,但其独特创作模式受追捧

AIが駆動するリーダーシップ変革:階層的服従から人間と機械の共生へ:AIが仕事に深く浸透するにつれて、従来のリーダーシップは課題に直面しています。Googleの調査によると、若手リーダーの82%がAIを使用しており、Oracleのデータでは25%の従業員がリーダーよりもAIに尋ねることを好んでいます。AIはリーダーシップ環境の変化を引き起こしています。情報や経験はもはやリーダー専用の堀ではなくなり、意思決定の透明化はプレッシャーをもたらし、管理対象は純粋な人間のチームから「人間と機械の混合体」へと変化しています。復旦大学管理学院は「共生リーダーシップ」の概念を提唱し、伝統経済とデジタル経済、企業とエコシステム、人間の脳と機械の脳の融合共生を強調しています。AI時代のリーダーは、新旧の原動力の転換を乗りこなし、協調ネットワークの中で価値を創造し、人間と機械の協調による相乗効果を発揮する必要があり、その中核的競争力は、AIを人類のためにどのように役立てるかを知っていることにあります。(来源: 36氪)

AI驱动的领导力变革:从层级式服从到人机共生