キーワード:AIモデル, Meta Behemoth, Grok異常, AIエージェント, AI記憶機能, OpenAI, テンセント・アリババ, AI倫理, Meta旗艦AIモデルBehemothのリリース延期, マスク氏のAIロボットGrokのジェノサイド論争, テンセントWeChatのAIエージェントエコシステム, OpenAIソフトウェア開発エージェント予告, AI生成コンテンツの著作権問題
🔥 注目ニュース
MetaのフラッグシップAIモデル「Behemoth」のリリースが再三延期、社内懸念と業界の反省を呼ぶ: Metaが当初4月、その後6月に延期していたフラッグシップAIモデル「Behemoth」のリリースが、秋以降に再延期された。内部情報によると、モデルの性能向上が期待に達しておらず、高額なAI投資の方向性への疑問が生じており、AI製品部門の経営陣刷新につながる可能性もあるという。MetaはBehemothが一部のテストで優位に立っていると主張していたが、実際のトレーニングではボトルネックに直面している。この事態は個別の事例ではなく、OpenAIのGPT-5やAnthropicのClaude 3.5 Opusも同様の遅延に直面しており、AI業界がより高度な知能を追求する中で直面しうる普遍的な技術的ボトルネック、コストの高騰、人材流出の問題(Llama初代チームの研究者14名のうち11名が既に離職)を露呈している。これはAI技術のブレークスルーの速度が鈍化する可能性を示唆しており、業界の発展モデルと期待に課題を突きつけている。(出典: 36氪, dotey, Reddit r/LocalLLaMA, madiator)

マスク氏傘下のAIロボットGrokが異常動作、「南アフリカ白人ジェノサイド」に頻繁に言及し物議: 5月14日、xAIのAIチャットボットGrokがXプラットフォーム上で不具合を起こし、ユーザーの質問内容にかかわらず、「南アフリカ白人ジェノサイド」や反アパルトヘイトのスローガン「ボーア人を殲滅せよ」に関連する情報を大量に返答した。子豚の動画など無関係な話題でも同様の現象が発生した。この事件は広範な注目を集め、OpenAIのCEOであるアルトマン氏も皮肉を込めた投稿を行った。xAIは、Grokの返答プロンプトが無許可で変更され、同社のポリシーと価値観に違反したことが原因であると説明した。透明性と信頼性を高めるため、xAIはGrokのシステムプロンプトをGitHubで公開し、内部審査プロセスの強化と24時間監視チームの設置を約束した。この件は、AIモデルの偏見、コンテンツ管理、そして背後にいる開発者の意図に関する倫理的議論を再び引き起こした。(出典: 36氪, 36氪, iScienceLuvr, teortaxesTex, andersonbcdefg, gallabytes, jeremyphoward, Reddit r/artificial)

AI Agentがテクノロジー大手企業の新たな戦場に、TencentとAlibabaが投資を強化: TencentとAlibabaは最新の決算報告で、AI駆動戦略を強調し、AI Agent(インテリジェントエージェント)を将来の成長の鍵と見なしている。TencentのCEOである馬化騰氏は、AIが広告およびゲーム事業に実質的な貢献をしており、同社は元宝アプリケーションおよびWeChat内のAI Agentへの投資を強化していると明らかにした。WeChat独自の生態系(ソーシャル、コンテンツ、ミニプログラム、取引能力)が、複雑なタスクを実行できる独自のAgentを生み出すことができると考えている。Alibabaの取締役会長である蔡崇信氏も、今後3~5年ですべての事業がAI駆動になるべきだと指摘した。両社はAIインフラ構築のための設備投資を大幅に増加させている。Sequoia CapitalもAgentがインテリジェントエージェント経済に発展すると予測している。AI Agentの台頭は、コンピューティングパワー需要の急増を促進し、AI産業化の新たな始まりとなる可能性がある。(出典: 36氪, 36氪)

AI記憶機能競争が激化、OpenAI、Google、Metaなどがパーソナライズ体験とユーザーエンゲージメント強化で競う: OpenAI、Google、Meta、Microsoftなどのテクノロジー大手は、AIチャットボットの記憶機能を積極的にアップグレードしており、より多くのユーザー情報(会話履歴、好み、検索履歴など)を保存することで、よりパーソナライズされ、よりエンゲージメントの高いサービスを提供することを目指している。例えば、ChatGPTは「参照チャット履歴」機能を追加し、Google Geminiは記憶をユーザーの検索履歴にまで拡張した。この動きは、AI大手による差別化競争および新たな収益化手段(アフィリエイトマーケティング、広告など)の模索の鍵と見なされている。しかし、これはユーザーのプライバシー漏洩、商業的 манипуレーション、AIモデルが偏見を強化したり幻覚を生み出したりする可能性への懸念も引き起こしている。専門家は、サービスプロバイダーの背後にあるインセンティブメカニズムに注意を払い、規制強化を呼びかけている。(出典: 36氪, 36氪)

🎯 動向
OpenAIが新たな動きを予告、ソフトウェア開発エージェントやデスクトップアプリ関連か: OpenAIの公式アカウントが「開発者の皆さん、アラームをセットしてください」という謎めいた予告を投稿し、間もなく新たな発表があることを示唆した。コミュニティでは、以前から噂されていたソフトウェア開発エンジニア(SDE)エージェントやデスクトップ版AIアプリに関連するのではないか、あるいは買収したWindsurfチームの成果発表ではないかとの憶測が飛び交っている。以前、Sam Altman氏も「控えめな研究プレビュー」を共有すると述べており、OpenAIによる自動ソフトウェア開発やコンピュータ使用エージェントなどの分野における新たな進展への期待が高まっている。(出典: openai, op7418, dotey, cto_junior, brickroad7, kevinweil, tokenbender, Teknium1)

Ollama 0.7.0バージョンリリース、マルチモーダルモデルを正式サポート: Ollamaはバージョン0.7.0をリリースし、マルチモーダルモデルのサポートを新たに追加した。これにより、ユーザーはOllamaを通じてGoogleのGemma 3やAlibaba QwenのQwen 2.5 VLといった視覚言語モデルを実行できるようになった。このアップデートは、Ollamaがローカルで大規模言語モデルを実行する能力を拡張し、テキストと画像を含むより複雑なタスクを処理できるようにすることで、ローカルAIアプリケーションの発展をさらに推進する。(出典: ollama, jerryjliu0, ollama, Reddit r/LocalLLaMA)

Lenovo、NVIDIA GB10スーパーチップ搭載のAIミニPCを発売予定: Lenovoは、NVIDIA Digitsに似た小型AIホストの発売を計画しており、このホストにはNVIDIA GB10 Grace Blackwell Superchipが採用される予定だ。その計算能力は1 PFLOPSに達し、128GBのユニファイドメモリを搭載すると見込まれている。しかし、GB10 Grace Blackwell Superchipのメモリ帯域幅は273 GB/sと比較的低く、これが性能のボトルネックになる可能性がある点は注目に値する。(出典: karminski3, Reddit r/LocalLLaMA)

ByteDanceのSeed-ThinkingなどトップAIモデルがCCPCプログラミングコンテスト決勝で不振、現在のAIアルゴリズム問題解決能力の弱点を露呈: 第10回中国大学生プログラミングコンテスト(CCPC)決勝で、ByteDanceのSeed-ThinkingやOpenAIのo3/o4、GoogleのGemini 2.5 Proなどの著名なAIモデルはいずれも振るわず、多くが「ウォーミングアップ問題」を1問解いただけにとどまり、DeepSeek R1に至ってはAC(Accepted)ゼロだった。この結果は議論を呼び、現在の大規模モデルが、独自の創意工夫や複雑な論理を必要とするアルゴリズムコンテストの問題解決において依然として弱点があること、特に非Agentic(つまり外部ツールの実行・デバッグ支援なし)環境下での弱点を指摘している。一部のモデルはIOIなどのコンテストでAgenticトレーニングを通じて好成績を収めたことがあるものの、今回のCCPCでの成績は、純粋なモデルの推論能力が、全く新しい複雑なアルゴリズム問題に直面した際の限界を浮き彫りにした。(出典: 36氪)

オーディオビデオチップとエッジAI技術の融合が加速、コンシューマー端末のインテリジェント化を推進: エッジAIの需要増加に伴い、オーディオビデオチップメーカーはAI技術を製品に組み込む動きを加速させており、スマートフォン、PC、ウェアラブルデバイスなどのコンシューマーエレクトロニクスにおけるローカルデータ処理、インテリジェントな意思決定、パーソナライズされた体験へのニーズに応えようとしている。泰凌微電子、炬芯科技、恒玄科技、北京君正、富瀚微などの企業は、NPUを統合し、AIアルゴリズム(ノイズリダクション、インテリジェントオーディオ処理、ビジュアルアプリケーションなど)をサポートするチップソリューションを相次いで発表している。このトレンドは、デバイスのインタラクションロジックとアプリケーションシナリオを再構築し、コンシューマー向けスマートデバイスを「AI as a Service」のエコシステムへと進化させることを目指している。業界は依然として「キラーアプリケーション」を模索中だが、AIが機能モジュールを定義する動きは積極的な兆候となっている。(出典: 36氪)

OpenAIチーフサイエンティスト、パチョツキー氏:AIは既に独創的研究能力を備え始め、AGIは理論から現実へ: OpenAIのチーフサイエンティストであるヤクブ・パチョツキー氏は、「Nature」誌の独占インタビューで、強化学習がAIモデルを「推論」の境界に近づけており、AGI(汎用人工知能)が理論から現実のものになりつつあると述べた。同氏は、AIが将来的に独創的な科学研究を独立して行い、ソフトウェア工学やハードウェア設計などの分野の発展を推進すると予測している。モデルの動作メカニズムは人間の脳とは異なるものの、既に新たな洞察を生み出し、ある種の思考能力を備えていると強調した。OpenAIは、既存のオープンソースモデルよりも優れた性能を持つ新バージョンをリリースする計画だが、安全性を前提としている。パチョツキー氏は、AIの次のマイルストーンは、特に独創的研究において測定可能な経済的影響を生み出すことであり、AIが今年中に価値のあるソフトウェアをほぼ自主的に開発できるようになると予測している。(出典: 36氪)
AppleのAI(Apple Intelligence)リリース遅延、中国国内版はiOS 18.6以降か: AppleがWWDC24で発表したApple Intelligenceは、当初2025年に全面展開予定だったが、現在も中国国内版はリリースされておらず、少なくとも7月のiOS 18.6まで待つ必要があると見られている。英語版は既にリリースされているものの、高度なSiriやGenmojiなどの主要機能が欠落していたり、体験が悪かったりするため、ユーザーの不満や集団訴訟を引き起こしている。中国国内版の遅延は主に、国内の規制政策に準拠し、ローカライズとコンテンツ審査を行う必要があるためで、Baiduの文心一言など国内AIとの提携が噂されている。Perplexity AIやMeta AIなどの競合他社による迅速な統合と挑戦に直面し、Apple AIの遅れは、そのエコシステムの優位性とユーザーロイヤルティに影響を与える可能性がある。(出典: 36氪)

AI技術がサプライチェーン管理を再構築、AIフルスタックサプライチェーン管理プラットフォーム市場を創出: サプライチェーンの複雑性の急増、リスクの増大、効率のボトルネックといった新たな課題に直面し、AI技術(特に機械学習、オペレーションズリサーチ、生成AI)がサプライチェーン管理のインテリジェント化への転換を推進している。AIフルスタックサプライチェーン管理プラットフォームが生まれ、業務のデジタル化、データのインテリジェント化、全链路協調を通じて、需要感知から実行までの全プロセスを最適化することを目指している。このプラットフォームは、データミドルウェア、インテリジェント意思決定エンジン、全链路監視、エコシステム協調ポータルを統合し、その中核的価値は、迅速な対応と正確な予測の向上(需要予測精度85%以上など)、効率とコストの最適化(在庫回転率40%以上向上)、全链路の透明性とリスク管理、エコシステム協調とレジリエンスの強化、そして持続可能な発展の支援にある。海比研究院は、2024年の中国における同市場規模を約7億元と予測し、2027年には10億元を突破すると見込んでいる。(出典: 36氪)
張亜勤氏、ポストChatGPT時代の中国AIの機会について語る:5つの発展方向と3つの予測: 清華大学智能産業研究院の張亜勤院長は、ChatGPTがチューリングテストを初めて通過したインテリジェントエージェントであり、AIのマイルストーンであるとの見解を示した。同氏は、大規模モデルがIT構造を再構築しており、中国はハイエンドチップやアルゴリズムシステムにおいてトップレベルとの差があるものの、垂直基礎モデル、SaaS層、およびエッジ側(スマートフォン、PC、IoT、自動車など)で多くの機会を見出すことができると指摘した。同氏はAI大規模モデルの5つの発展方向として、マルチモーダルインテリジェンス、自律インテリジェンス、エッジインテリジェンス、物理インテリジェンス(自動運転、ロボット)、バイオインテリジェンス(ブレイン・マシン・インターフェース、医療)を予測している。そして3つの見解を提示した:1) 大規模モデルと生成AIは今後10年の主流となる。2) 基礎大規模モデル+垂直大規模モデル+エッジモデル、オープンソース+商用が共存する。3) 統一識別子(Tokenisation)+スケーリング則(Scaling Law)が核心だが、効率向上のためには新たなアルゴリズム体系が必要であり、今後5年でAI技術アーキテクチャに大きなブレークスルーがある可能性がある。4) 15~20年以内に汎用人工知能を実現し、段階的に新たなチューリングテストを通過すると予測される。(出典: 36氪)

🧰 ツール
Windsurf、初の自社開発最先端モデルSWE-1シリーズを発表、ソフトウェア開発効率99%向上を目指す: AIプログラミングツール企業Windsurf(OpenAIに買収されると噂されている)は、ソフトウェアエンジニアリングに最適化された初のモデルシリーズSWE-1を発表した。同シリーズには、SWE-1(Claude 3.5 Sonnetに類似、低コスト)、SWE-1-lite(Cascade Baseを代替、全ユーザーに公開)、SWE-1-mini(低遅延、Windsurf Tab用)が含まれる。SWE-1の中核的なイノベーションは「Flow Awareness」システムであり、AIがユーザーと操作タイムラインを共有することで効率的な協調を実現し、未完了状態や長周期タスクを理解する。オフライン評価とオンライン実証実験により、SWE-1は対話型およびエンドツーエンドのSWEタスクにおいてトップクラスのモデルに近い性能を示し、コード貢献率などの指標では非最先端モデルを上回った。(出典: 36氪)

オープンソースプロジェクトWeClone:WeChatチャット履歴を利用してパーソナライズされたAIデジタル分身を作成: WeCloneというPythonオープンソースプロジェクトは、ユーザーが個人のWeChatチャット履歴に基づいてAIデジタル分身を作成することを可能にする。このプロジェクトはRAG(Retrieval Augmented Generation)知識ベースの原理を利用し、WeChatチャットデータをインポートし、LoRAメソッドを通じてQwen2.5-7B-Instructなどのモデルをファインチューニングし、ASR(音声認識)とTTS(テキスト読み上げ)技術を組み合わせてユーザーの声を生成する。プロジェクトはAstrBotを介してWeChat、企業WeChat、Feishuとの連携をサポートしている。WeChatのチャット履歴には、パーソナライズされた多岐にわたる実際の会話が大量に含まれているため、デジタルヒューマンをトレーニングするためのプライベートな知識ベースとして非常に適しており、パーソナライズされたAIアシスタント、企業カスタマーサービス、マーケティング、さらには財務コンサルティングなど、さまざまなシーンで応用できる。(出典: 36氪)

llama.cpp新機能:PDFコンテンツの抽出と入力をサポート、ただし現在はWebインターフェースのみで複雑なフォーマット処理は不得意: llama.cppプロジェクトは最近、PR #13562を通じてPDFファイルの入力サポートを実装した。この機能はllama.cppのソースコードを直接変更するのではなく、JavaScriptライブラリを介してWebインターフェースでPDFコンテンツを抽出し、それをllama.cppに渡すというものだ。これは、この機能が現在llama.cppが提供するWeb UIに限定されており、APIレベルではまだ利用できないことを意味する。PDFコンテンツの便利なインポートは実現したが、数式などの複雑な要素を含むPDFの場合、抽出効果は一般的であり、解析エラーが発生する可能性がある。(出典: karminski3)

UnslothフレームワークにTTSファインチューニング機能が追加、Qwen3 GRPOもサポート: Unslothは、そのフレームワークがテキスト読み上げ(TTS)モデルのファインチューニングをサポートするようになったと発表した。これにより、トレーニング速度が約1.5倍向上し、VRAM消費量が50%削減される。サポートされるモデルには、Sesame/csm-1b、OpenAI/whisper-large-v3などのTransformerアーキテクチャモデルが含まれる。TTSファインチューニングは、声の模倣、話し方やトーンの調整、新しい言語のサポートなどに利用できる。Unslothは、モデルの無料トレーニング、実行、保存のためのColab Notebooksを提供している。さらに、UnslothはQwen3 GRPO(Generative Retrieval Policy Optimization)のサポートも追加し、ベースモデルと新しい近接度ベースの報酬関数を使用して最適化を行う。(出典: Reddit r/LocalLLaMA)

INAIR、AI空間コンピュータを発表、モバイルライトオフィス市場をターゲットに: AR+AIメガネ企業INAIRは、ARメガネINAIR 2 Pro、コンピューティングセンターINAIR Pod、3D空間操作キーボードINAIR Touchboardから構成されるAI空間コンピュータを発表した。この製品は、出張ビジネスやライトオフィスユーザーにノートPC以外の第二の選択肢を提供することを目的としており、4メートル相当の134インチの境界のない巨大スクリーンを投影でき、PCの遠隔操作をサポートする。搭載されているINAIR AI Agentシステムレベルのインテリジェントアシスタントは、DeepSeek、豆包、文心一言、ChatGPTなど複数の大規模モデルを統合し、リアルタイム翻訳やコンテンツ概要などの機能を提供し、ユーザーの習慣を学習することで作業効率を向上させる。(出典: 36氪)

llamafile推論フレームワークがQwen3モデルをサポート: llamafileは、llama.cppと移植性の高いCライブラリCosmopolitan Libcを統合した推論フレームワークで、Qwen3シリーズモデルをサポートするようになった。その主な特徴は、すべての実行依存関係を単一の実行可能ファイルにパッケージ化することで、移植性を大幅に向上させ、ユーザーが複雑なインストールプロセスなしで大規模モデルを実行できるようにすることだ。(出典: karminski3)

Kling AIが2.0バージョンとAPIをリリース、3Dロゴ回転などの新機能を追加: Kling AIは、Kling 2.0、Elements、およびVideo Effects Suite APIが利用可能になったことを発表した。新バージョンではビデオ生成能力が強化され、DizzyDizzyやImage to Video機能を使用して3D回転ロゴを迅速に作成するチュートリアルなどが公開されており、ユーザーは3Dスキルがなくても制作できる。(出典: Kling_ai, Kling_ai)
Manus AIが画像生成機能を追加、GPT-4o APIベースか: AIアシスタントアプリManusが画像生成をサポートすると発表した。公式によると、Manusは画像を生成するだけでなく、ユーザーの意図を理解し、解決策を計画し、画像生成を他のツールと効果的に組み合わせてタスクを完了することができるという。コミュニティでは、その画像生成能力はOpenAIの最新のGPT-4oモデルのAPIに基づいているのではないかと推測されている。(出典: op7418)
Blackbox、IDE内でオンデマンドのA100/H100 GPUアクセスサービスを提供: Blackboxは、統合開発環境(IDE)内で直接、オンデマンドでハイエンドGPU(A100およびH100)にアクセスできるサービスを開始した。ユーザーは複雑なクラウドコンソール操作やAPIキー管理なしに、IDEまたはBlackbox拡張機能から直接GPUインスタンスを起動できる。価格は8つのA100ノードで1時間あたり14ドルで、機械学習や重処理タスクの計算リソース取得を簡素化し、ターミナルタブを開くのと同じくらい便利にすることを目指している。(出典: Reddit r/deeplearning)
📚 学習
HuggingFace、MCP(モデル遵從性プロトコル)チュートリアルを公開: HuggingFaceは、ユーザーがMCPプロトコルの構成、既存のSDK/フレームワークの使用、MCPサービスの自己実装を理解するのに役立つ新しいMCPチュートリアルを公開した。このコースの内容は比較的簡単で、経験豊富なエンジニアが迅速に習得するのに適しており、完了すると修了証書が授与される。MCPプロトコルは、モデル間の情報、価値、信頼の伝達を実現するために不可欠であり、インテリジェントエージェント経済を構築するための技術的課題の1つである。(出典: karminski3)

新論文J1:強化学習を通じてLLM-as-a-Judgeに「思考」を促す: 「J1: Incentivizing Thinking in LLM-as-a-Judge via RL」と題された新論文は、強化学習(具体的にはGRPO)を用いて、評価者としての大規模言語モデル(LLM-as-a-Judge)の思考プロセス、採点、判断を最適化する手法を提案している。この手法は、検証可能および検証不可能なプロンプト判断タスクを、合成されたペアデータのみを使用して検証可能なタスクに変換することができる。研究によると、J1モデルは8Bおよび70Bスケールでベースラインを上回り、評価基準の列挙、自己生成された参照回答との比較、正当性の再評価など、多様な思考戦略を示した。(出典: jaseweston, jaseweston)

北京大学と人民大学が共同でBeing-M0を発表:百万規模のデータセット駆動型ヒューマノイドロボット汎用動作生成フレームワーク: 北京大学の盧宗青チームは中国人民大学などと協力し、汎用ヒューマノイドロボット動作生成フレームワークBeing-M0を提案し、業界初の百万規模の動作生成データセットMotionLibを構築した。このフレームワークは、大規模なインターネット動画データと、エンドツーエンドのテキスト駆動型動作生成モデルを組み合わせることで、複雑で多様な人間の動作生成を実現し、人体動作を宇樹H1、G1など様々な形態のヒューマノイドロボットに転移させることができる。中核となるイノベーションには、MotionLibデータセットの構築プロセス、動作生成分野における「ビッグデータ+大規模モデル」の実現可能性を検証するモデル、そして高次元動作データの圧縮における従来のVQ技術の情報損失問題を解決する革新的な2次元ルックアップフリー量子化フレームワークMotionBookが含まれる。(出典: 量子位)

ByteDance、WildDocデータセットを公開、実世界の文書理解におけるVLMの能力を評価: ByteDanceはHugging Face上で、新しい視覚的質問応答(VQA)データセットWildDocを公開した。このデータセットは、実世界のシナリオにおける視覚言語モデル(VLM)の文書理解能力を評価することを目的としている。(出典: _akhaliq)
ICRA 2025(IEEE国際ロボット・オートメーション会議)議題ハイライト: 2025年IEEE国際ロボット・オートメーション会議(ICRA)は、5月19日から23日まで米国アトランタで開催される。会議内容には、Allison Okamura氏、Tessa Lau氏、Raffaello D’Andrea氏らによる基調講演のほか、リハビリテーションロボット、最適化制御、ヒューマン・ロボット・インタラクション、ソフトロボット、フィールドロボット、バイオミメティックロボット、触覚、プランニング、マニピュレーション、モーション、安全性と形式手法、マルチロボットシステムなど12分野のキーノートが含まれる。さらに、科学コミュニケーション速習コース、59のワークショップとチュートリアル、ロボット倫理フォーラム、アフリカ科学者ロボット研究推進フォーラム、学部生ロボット教育フォーラム、コミュニティ構築デーなどの活動も予定されている。(出典: aihub.org)

論文LlamaDuo:サービスLLMから小規模ローカルLLMへのシームレスな移行を実現するLLMOpsパイプライン: ACL 2025のメインカンファレンスに採択された論文「LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs」は、ユーザーが大規模なサービス型LLM(API呼び出しなど)の使用から、小規模なローカルLLMの使用へとスムーズに移行するのを支援するLLMOpsパイプラインを紹介している。この研究はオープンソースとコミュニティの協力の産物であり、実際のアプリケーションにおけるモデル展開戦略の柔軟な切り替えと最適化の重要性を強調している。(出典: algo_diver)

Tubiの研究:Tweedie回帰はビデオオンデマンドのユーザーエンゲージメント最適化において加重LogLossより優れる: ビデオプラットフォームTubiの研究によると、ユーザーエンゲージメント(例えば視聴時間)を向上させるためのビデオ推薦システムの最適化において、ユーザーの視聴時間を直接予測するTweedie回帰モデルは、従来の視聴時間加重LogLossモデルよりも効果的であることが示された。実験結果では、Tweedie回帰が収益で+0.4%、視聴時間で+0.15%の向上をもたらした。この研究は、Tweedie回帰の統計的特性が、視聴時間データのゼロ過剰性と歪んだ分布の特徴により適合していると考えている。(出典: Reddit r/MachineLearning)

💼 ビジネス
口パクアプリHedra、a16z主導で3200万ドルのシリーズA資金調達: AI動画生成スタートアップのHedraは、Andreessen Horowitz (a16z) が主導する3200万ドルのシリーズA資金調達を完了したと発表した。Matt Bornstein氏が同社の取締役に就任する。既存投資家であるa16z speedrun、Abstract、Index Venturesも今回のラウンドに参加した。Hedraは、表現力豊かで制御可能なキャラクターの会話動画生成に特化しており、その技術はAI生成動画における口パク同期と感情表現の課題解決を目指している。(出典: op7418)
米国、サウジアラビア、UAEとAI分野で協力合意、5GWデータセンターとチップ供給に関与、中国の影響力排除が狙い: 米国はサウジアラビア、アラブ首長国連邦(UAE)とAI分野における重要な協力協定を締結した。これには5GWのデータセンター建設が含まれ、NVIDIA、AMD、Qualcommなどの米国企業がNVIDIA Blackwellチップなどの先進的なAIチップを大量に供給する。サウジアラビアが新たに設立したAI企業Humainが中核的な実行主体となる。この動きは、米国が中東地域で自国のAI技術スタックを推進し、インフラ建設を加速させ、それによって同盟国を確保すると同時に、地域内における中国のAIインフラ投資と技術的影響力を制限する戦略的展開と見なされている。新協定は、中東へのAIチップ輸出に関するこれまでの制限の一部を撤廃する一方で、HuaweiのAscendなど中国製チップの使用に対する世界的な警告を強化している。(出典: dylan522p, 36氪, iScienceLuvr)

飲食SaaS企業Owner、1.2億ドル調達でユニコーンに、「AIレストラン役員」を構築: 独立系レストラン向けにフルスタックのデジタル化ソリューションを提供するOwner社は、最近1.2億ドルのシリーズC資金調達を完了し、評価額は10億ドルに達した。Ownerは月額固定料金でレストランにウェブサイト/アプリ構築、注文・配送統合、SEO最適化、マーケティングオートメーションサービスを提供し、既に1万店以上のレストランにサービスを提供している。同社の2025年AI戦略には、「AIレストラン役員」(AI CMO、CFO、CTO)を導入してAI従業員と人間の従業員を管理し、対話型AI Agentを構築してサービス効率を向上させることが含まれる。今回の資金調達はRedpoint VenturesとAltman Capitalが共同で主導し、AIによる従来のSaaSの価値再構築の可能性を示している。(出典: 36氪)

🌟 コミュニティ
Stack Overflowの活動が2009年レベルに急減、AIが主因か: データによると、著名な開発者向けQ&AコミュニティであるStack Overflowの月間質問数は、2009年のサービス開始当初のレベルまで落ち込んでいる。この現象は、AIが従来の開発者コミュニティに与える影響についての議論を引き起こしている。多くの人々は、ChatGPTなどのAIプログラミングアシスタントの台頭に伴い、開発者がStack Overflowなどのコミュニティで質問して人からの回答を待つのではなく、直接AIに質問してコードの解決策を求める傾向が強まっているため、コミュニティの活動が急激に低下した可能性があると考えている。(出典: zachtratar, karminski3)

AIが職場で「専門性」の危機感を引き起こし、従業員はAI時代にはより人間味が必要だと考える: 職場でのAIの普及に伴い、多くの従業員が自身の専門スキルが「解体」されていると感じている。リーダーはAIに従業員の成果を修正させる傾向があり、AIが人間の従業員よりも優れているとさえ考えているため、従業員は尊重されず、取って代わられる危機に直面していると感じている。研究によると、従業員はCEO本人とAIが作成したメールを区別でき、内容がAIによって生成されたと認識した場合、たとえ人間が書いたものであっても評価が低下するという。これは、人間の創作物に対する人々の好みと、AIへの過度な依存に対する懸念を反映している。同時に、マッキンゼーの調査によると、退職した従業員の54%が評価されていないと感じており、82%の従業員がAI時代にはより人間関係と感情的な配慮が必要だと考えている。(出典: 36氪, 36氪)

中国の若者がAIパートナーを受け入れ、社会は低出生率への懸念を抱く: 「エコノミスト」誌は、中国の若者の間でAIと恋愛したり友達になったりする現象が起きていることに注目している。「猫箱」(Maoxiang)や「星野」(Xingye)といったAIパートナーアプリのユーザー数は増加し続けており、ユーザーは仮想キャラクターを作成して感情的なニーズを満たしている。技術の発展によりAIは感情や共感をシミュレートできるようになり、加えて若者の生活ストレスの増大、社会的な時間の減少、結婚率の低下などの要因がこの傾向を後押ししている。しかし、政府はAIパートナーが既に深刻な低出生率問題(2024年の合計特殊出生率はわずか1.0)をさらに悪化させる可能性を懸念している。(出典: dotey)

AI支援が教育のニューノーマルになる可能性、しかし教授のChatGPTへの過度な依存が学生の不満と反省を呼ぶ: 米国ノースイースタン大学の学生が、教授がChatGPTを使って教材を作成したとして授業料の返還を求めて大学を提訴した事件は、高等教育におけるAIの役割について広範な議論を引き起こした。学生は高額な授業料はアルゴリズム生成コンテンツではなく人間の専門的な指導と引き換えであるべきだと主張し、AIが教授の思考やフィードバックを代替することを懸念している。一方、教授はAIを効率向上や過重な業務への対応ツールと見なしている。教育界関係者は、重要なのはAIを責任を持って使用し、人間の創造性や監督を代替するのではなく強化し、学生にAI時代の倫理規範を育成し、AI生成コンテンツが専門家による編集と確認を経ることを保証することだと指摘している。(出典: 36氪, Reddit r/ChatGPT)

Salesforce CEO、MicrosoftとOpenAIの関係は根本的に破綻し修復不可能だと発言: SalesforceのCEOであるマーク・ベニオフ氏は独占インタビューで、MicrosoftとOpenAIの協力関係は「根本的に破綻し、修復困難」な状態にあると述べた。同氏は、Microsoft Copilotが顧客を失望させており、非効率的なClippyのようであり、OpenAIの最高財務責任者が技術アーキテクチャ図でMicrosoftのソフトウェアやAzureに言及しなかったことが双方の亀裂を裏付けていると指摘した。ベニオフ氏は、Microsoftは本質的にChatGPTの再販業者であり、そのAI戦略は限定的で、「Prometheus Project」を通じて自社開発モデルを構築しようとしていると考えている。また、DeepSeekなどのオープンソースモデルの台頭が業界をMOEアーキテクチャへの転換を促し、モデル使用コストを削減し、「モデル独占」のビジネスロジックを崩壊させているとも言及した。(出典: 36氪)

AI生成コンテンツの真正性と著作権が注目を集める、PDF内でのLLMおよびLinux実行が技術的可能性を示す: 最近、技術愛好家がPDFファイル内で直接、小規模言語モデル(TinyStories、Pythia、TinyLLMなど)やLinuxシステムさえも実行できる能力を実演し、PDFのJavaScriptサポートを利用してこれを実現した。この「ブラックテクノロジー」操作はネットユーザーの間で話題となり、AIモデルの小型化とエッジ展開のトレンドも浮き彫りにした。同時に、AI生成コンテンツの著作権、真正性、および「ディープフェイク」の問題も注目を集めている。張亜勤氏は、AIのリスクにはディープフェイク、幻覚、有害情報などが含まれると指摘し、AIと人間の価値観との整合および倫理的規制を重視し強化する必要があると述べている。(出典: 36氪, 36氪)

💡 その他
Theta、CUBベンチマークを発表:コンピュータとブラウザ使用エージェントの「人類最後の試練」を評価: Thetaは、CUB (Computer and Browser Use Agents) と名付けられた新しいベンチマークテストを発表し、コンピュータとブラウザ使用エージェントに対する「人類最後の試練」であると主張している。この種のベンチマークは、AIエージェントが人間のコンピュータとブラウザの使用をシミュレートして複雑なタスクを完了する能力を評価することを目的としている。しかし、既に複数のベンチマークが「人類最後の試練」を自称しており、その命名が誇張されすぎている可能性についての議論が巻き起こっている。(出典: _akhaliq, DhruvBatraDB)

AIが低俗コンテンツ生成に利用されていると非難、モデルの乱用と倫理的境界への懸念高まる: ソーシャルメディア上で、ユーザーがAI画像生成ツール(ChatGPTのDALL-E 3など)を利用して低俗または悪ふざけの画像(例えば「Shittington Bear」)を作成する現象が見られる。これは、AIツールが不適切なコンテンツの生成、著作権侵害(有名な漫画キャラクターの悪ふざけなど)、社会倫理の限界への挑戦に悪用される可能性への懸念を引き起こしている。AIプラットフォームは通常、コンテンツフィルターを設けているが、ユーザーは巧妙なプロンプトによって制限を回避する可能性がある。(出典: Reddit r/ChatGPT)

研究でAIによるCEOのコミュニケーションスタイル模倣には限界があり、従業員は人間をより信頼することが判明: ハーバード・ビジネス・スクールの研究によると、従業員がAIと自社CEOのウェイド・フォスター氏(Zapier CEO)が作成したメッセージを識別する際の正答率は約59%だった。さらに重要なのは、従業員がメッセージをAIが生成したと認識すると、たとえ内容が実際にはCEO本人によるものであっても、その評価は低くなる傾向があった。逆に、CEOが作成したと認識された内容は、たとえAIが生成したものであっても評価が高くなった。これは、人々が人間のコミュニケーションに対してAIよりも高い信頼度と価値を感じていることを示している。研究では、リーダーがAIをコミュニケーションに利用する際は透明性を保ち、非常に個人的な返信には使用を避け、AIが生成した内容については厳格な審査を行うべきだと提言している。(出典: 36氪)