AI 日報AI日報 – 2025-07-11(夕刊)256kコンテキストウィンドウGrok 4Grok 4 HeavyHLEベンチマークテストxAIイーロン・マスクの見解引用コンテキストウィンドウベンチマークテストモデルのバイアス大規模言語モデル数学的推論長文理解能力