キーワード:AGI, DeepMind, AIリスク, Anthropic, 数学的推論, Tencent Hunyuan, AI動画モデル, AI人格ベクトル制御, SeedProver数学ベンチマーク, λ計算の汎用関数, 小型オープンソースLLM, 感情表現AI動画

🔥 注目

DeepMind CEO Demis Hassabis、AGIと科学の未来を展望 : DeepMind CEOのDemis Hassabisは、最新のインタビューでAGIの未来について深く掘り下げ、AIがあらゆる進化によって形成された自然なパターンを効率的にモデル化できると述べ、今後5~10年でAGIを実現する可能性があると見ている。彼は、物理学、生物学、気候予測などの科学分野におけるAIの中心的役割を強調し、AIが人類の大きな課題を解決する究極のツールになると提言するとともに、慎重かつ楽観的な姿勢でAI開発を進めるよう呼びかけた。(ソース: 量子位)

Geoffrey Hinton、AIリスクについて継続的に警告 : AIのゴッドファーザーであるGeoffrey Hintonは、公の場でAIがもたらす生存リスクについて継続的に警告しており、AIが30年以内に人類を絶滅させる確率は10~20%と予測し、AIが5年以内に自己意識と知覚を獲得する可能性があると指摘した。彼は、AIの汎用性が原子爆弾をはるかに超える影響を持つことを強調し、国際社会全体でAI開発に慎重に取り組むよう呼びかけた。(ソース: 量子位

Hinton能重新坐下了,什么时候开始的?

)

Anthropic、AI人格ベクトルの制御を実現 : Anthropicの研究チームは、単一のベクトルでLLMの人格特性を制御できることを発見した。これには、嘘をつく、お世辞を言う、さらには邪悪な行動までが含まれ、AIのパーソナライズされた調整がスイッチを切り替えるように簡単になった。この発見は、言語モデルのアライメントと行動制御に大きな影響を与え、AIの人間とコンピュータのインタラクションおよび倫理的制御における新しいパラダイムを予見させる。(ソース: _mfelfel

BREAKING: Anthropic just figured out how to control AI personalities with a single vector.  Lying, flattery, even evil behavior? Now it’s all tweakable like turning a dial. This changes everything about how we align language models.

)

ByteDanceがSeedProverを発表、数学的推論能力が大幅に向上 : ByteDanceはSeedProverモデルを発表し、PutnamBench数学ベンチマークテストで331/657のスコアを達成した。これは既存のSOTAモデルの約4倍の高さであり、OpenAIのminiF2Fでは100%の正答率を達成した。これは、AIが複雑な数学的推論と証明の分野で著しい進歩を遂げたことを示しており、将来の科学研究におけるAIの大きな可能性を予見させる。(ソース: clefourrier

clefourrier

, cloneofsimo

cloneofsimo

, jxmnop

jxmnop

, Dorialexander

Dorialexander

)

AIがλ-演算で汎用関数を導出 : Google Gemini Pro 2.5はDeep Thinkの助けを借りて、λ-演算でN-タプルの汎用”foldr”関数を初めて導出することに成功した。このブレークスルーは他の主要なモデルを凌駕し、複雑な論理推論と数学的証明の分野におけるその強力な能力を示している。これは、AIの抽象的推論と形式化されたシステム理解における重要な進歩を示すものだ。(ソース: quocleix, jon_lee0, YiTayML, GoogleDeepMind

GoogleDeepMind

, quocleix

quocleix

)

🎯 動向

Tencent Hunyuan、複数の小型オープンソースLLMを発表 : Tencent Hunyuanは、0.5B、1.8B、4B、7Bの4つの小型オープンソースLLMを発表した。これらは、低消費電力シナリオ(コンシューマー向けGPU、スマートカー、スマートホーム、携帯電話、PCなど)のニーズを満たすことを目的としており、効率的なファインチューニングをサポートし、ハイブリッド推論、256Kの超長コンテキスト、優れたAgent能力を備えている。これは、大規模モデルがエッジデバイスや多様なアプリケーションシナリオに普及していることを示している。(ソース: teortaxesTex

teortaxesTex

, QuixiAI

QuixiAI

, tri_dao

tri_dao

, Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

, Reddit r/LocalLLaMA)

AIビデオモデルWan 2.2、感情表現をサポート : Alibaba_Wanチームは、AIビデオモデルWan 2.2が、複数の複雑な感情表現(喜び、怒り、悲しみ、楽しみから「投げキッス」などの複合的な感情まで)のキャプチャと生成を新たにサポートすると発表し、AIビデオコンテンツのリアリティと表現力を大幅に向上させた。(ソース: Alibaba_Wan, TomLikesRobots

TomLikesRobots

)

GLM-4.5モデル発表、Agent能力を強化 : GLM-4.5モデルが正式にリリースされ、そのアーキテクチャにはAgent能力と強力なツール使用機能が組み込まれている。このモデルはMoEアーキテクチャを採用し、カスタムのRL戦略(slime)と組み合わせ、同期推論トレーニングと非同期Agentタスクトレーニングをサポートし、ツール呼び出しの成功率は90.6%に達し、Claude 4 Sonnetを上回る。(ソース: TheTuringPost

TheTuringPost

, TheTuringPost

TheTuringPost

)

Qwen、画像生成モデルを間もなく発表 : Qwenチームは、20Bパラメータの画像生成モデルを間もなくリリースすると予告した。このモデルは視覚能力をサポートし、オープンソースの画像生成エコシステムをさらに豊かにし、ユーザーに高品質な画像作成ツールをより多く提供するだろう。(ソース: iScienceLuvr

iScienceLuvr

, Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

, Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

)

Claude Opus 4.1、間もなくリリース : AnthropicのClaude Opus 4.1モデルが間もなくリリースされる予定だ。Claudeシリーズの新しいバージョンとして、パフォーマンスと機能のさらなる向上が期待され、大規模言語モデルの発展の境界を押し広げ続けるだろう。(ソース: scaling01

scaling01

, dotey

dotey

, op7418

op7418

, Reddit r/ClaudeAI

Reddit r/ClaudeAI

, Reddit r/ClaudeAI

Reddit r/ClaudeAI

)

XBai o4モデル、Claude Opusの性能を凌駕 : 中国のAIラボによるXBai o4オープンソースモデルは、パフォーマンスでOpenAIのo3-miniを上回り、AnthropicのClaude Opusを自信を持って打ち負かした。このモデルはApache 2.0ライセンスを採用しており、Hugging Faceで利用可能であり、中国がオープンソースモデルの分野で著しい進歩を遂げたことを示している。(ソース: ClementDelangue

ClementDelangue

)

Ant Group AlignXplore、AIのパーソナライズされた理解を向上 : Ant Groupの汎用AI研究センターはAlignXplore手法を提案した。これは、強化学習とストリーミング嗜好推論メカニズムを通じて、AIがユーザー行動から嗜好を推論し、動的に更新できるようにするもので、パーソナライズされたアライメント能力を15.49%大幅に向上させた。この技術は、AIが複雑なプロンプトから解放され、より「高EQ」な人間とコンピュータのインタラクションを実現することを目的としている。(ソース: 量子位

告别复杂提示词!蚂蚁新方式让AI自动理解你的个性化需求

)

Huawei、718BパラメータのPangu大規模モデルを発表 : HuaweiはPangu Ultra 718BパラメータのMoEモデルの重みを公開した。このモデルはHuawei Ascend NPUを完全に用いてトレーニングされた、完全に自社開発された中国のモデルである。そのライセンスは比較的緩やかだが、「Powered by openPangu」と商標情報の記載を要求している。(ソース: Reddit r/LocalLLaMA

Reddit r/LocalLLaMA

)

🧰 ツール

Google LangExtract:ドキュメント構造化情報抽出ツール : GoogleはLangExtractを発表した。これは、ユーザーの指示に基づいて非構造化ドキュメントから構造化情報を抽出できるツールだ。ソース追跡、構造化出力に対応し、長文ドキュメント向けに最適化されている。また、クラウドおよびローカルLLMのデプロイメントもサポートし、ドキュメント処理効率を向上させた。(ソース: omarsar0

omarsar0

)

AI支援プログラミングとAgentツールセット : ScreenCoderはUIデザインをフロントエンドコードに変換するAgentシステムである。Zai.orgのKilo CodeはGLM-4.5モデルをサポートしている。Claude Opusの「ultrathink」機能はモデルの思考能力を向上させた。ユーザーはClaude Opusを利用して自律型ドローンシミュレーターやiOSアプリの開発に成功し、プログラミング経験のないユーザーでさえ複雑なアプリケーション開発を実現した。Jules Agentは継続的にアップグレードされており、Tasker AIはAIアシスタントとしてAgentを制御し、日常業務を完了できる。これらはすべて、プログラミングと自動化されたタスク処理におけるAIの強力なエンパワーメントの役割を示している。(ソース: TheTuringPost

TheTuringPost

, sbmaruf, Zai_org

Zai_org

, julesagent, _akhaliq, Reddit r/ClaudeAI

Reddit r/ClaudeAI

, Reddit r/ClaudeAI)

AI Agent駆動のコンプライアンス自動化ツールComp AI : Comp AIはAI Agentを利用して、証拠収集、リスク評価、ポリシーの起草と更新など、コンプライアンスプロセスを自動化する。これにより、SOC 2コンプライアンス時間を60時間から2~4時間に短縮できる。このツールは、企業のコンプライアンスの課題を解決し、効率を向上させることを目的としている。(ソース: claud_fuen

claud_fuen

)

Hugging FaceがリモートモデルプロバイダーとしてJanに統合 : Hugging Faceは現在、リモートモデルプロバイダーとしてJanに統合可能になった。ユーザーはHugging Face APIキーを介して、JanでHugging Face上の任意のモデルを選択して使用できる。これにより、開発者や研究者があらゆるモデルにアクセスし、適用することが大幅に容易になった。(ソース: ClementDelangue)

DocStrange:オープンソースのドキュメントデータ抽出ライブラリ : DocStrangeは、ドキュメントデータ抽出プロセスを簡素化するオープンソースのPythonライブラリである。PDF、画像、Word、Excelなど、複数の入力形式をサポートし、Markdown、JSON、CSV、HTMLで出力可能。スマートフィールド抽出とSchema定義もサポートし、無料のクラウド処理とローカルプライバシーモードを提供する。(ソース: Reddit r/MachineLearning, Reddit r/MachineLearning)

Vinsoo:2000年代生まれの創業者がAIプログラミングパラダイムを再定義 : AIYouthLabはVinsoo AI IDEを発表した。これは、クラウドAgentプログラミングチームを搭載した世界初の統合開発環境である。複数のインテリジェントAgentがタスクを並行して実行することを革新的にサポートし、要件分析から最終的な納品までの全プロセス自動化開発を実現する。VibeとFull Cycleの2つの作業モードを提供し、クラウドサンドボックス環境の安全な隔離を強調している。(ソース: 量子位

00后创始人重新定义AI编程范式!全球首个搭载云端Agent编程团队的IDE来了!

)

Podcastfy.ai:オープンソースのマルチモーダルポッドキャスト生成ツール : Podcastfy.aiはオープンソースのPythonライブラリで、マルチモーダルコンテンツ(テキスト、画像、ビデオ、PDFなど)を魅力的な多言語オーディオ対話に変換できる。短編または長編のポッドキャスト生成、会話スタイルと言語のカスタマイズをサポートし、複数のLLMとテキスト音声変換モデルを統合している。NotebookLMのポッドキャスト機能のオープンソース代替を提供することを目的としている。(ソース: GitHub Trending

souzatharsis/podcastfy - GitHub Trending (all/daily)

)

📚 学習

GEPA:反射型プロンプト最適化が強化学習を凌駕 : GEPAは、LLMの最適化において優れたパフォーマンスを発揮する新しい反射型プロンプト最適化アルゴリズムであり、一部のタスクでは従来の強化学習アルゴリズムGRPOをも上回り、必要なrollout回数を35倍削減した。パレート最適候補選択、反射型プロンプト変異、システム認識統合などの革新的なメカニズムを通じて、向上させた。