Anahtar Kelimeler:AI modeli, Meta Behemoth, Grok anomalisi, AI Ajan, AI hafıza işlevi, OpenAI, Tencent Alibaba, AI etiği, Meta’nın amiral gemisi AI modeli Behemoth’un lansmanı ertelendi, Musk’ın AI robotu Grok’un soykırım tartışması, Tencent WeChat AI Ajan ekosistemi, OpenAI yazılım geliştirme ajanı önizlemesi, AI tarafından oluşturulan içeriklerin telif hakkı sorunları
🔥 Öne Çıkanlar
Meta’nın amiral gemisi AI modeli “Behemoth”un lansmanı defalarca ertelendi, şirket içinde endişelere ve sektörde yansımalara neden oldu: Meta’nın başlangıçta Nisan ayında piyasaya sürmeyi planladığı, ardından Haziran’a ertelenen amiral gemisi AI modeli “Behemoth”un lansmanı bir kez daha sonbahara veya daha sonrasına ertelendi. Şirket içi kaynaklara göre, modelin performans artışı beklentileri karşılamadı ve bu durum, yüksek AI yatırımlarının yönü hakkında soru işaretleri doğurdu ve AI ürün departmanı yönetiminde değişikliklere yol açabilir. Meta daha önce Behemoth’un bazı testlerde lider olduğunu iddia etmişti, ancak gerçek eğitimde darboğazlarla karşılaşıldı. Bu olay münferit değil; OpenAI’nin GPT-5’i ve Anthropic’in Claude 3.5 Opus’u da benzer gecikmelerle karşı karşıya kaldı. Bu durum, AI sektörünün daha yüksek zeka arayışında karşılaşabileceği yaygın teknik darboğazları, artan maliyetleri ve yetenek kaybı sorunlarını (Llama’nın ilk ekibindeki 14 araştırmacıdan 11’i ayrıldı) ortaya koyuyor. Bu, AI teknolojisindeki atılım hızının yavaşlayabileceğini ve sektörün gelişim modelleri ve beklentileri için zorluklar yaratabileceğini gösteriyor. (Kaynak: 36氪, dotey, Reddit r/LocalLLaMA, madiator)

Musk’ın AI robotu Grok’ta anormallik, sık sık “Güney Afrika beyaz soykırımı”ndan bahsetmesi tartışmalara yol açtı: 5 Mayıs’ta xAI’nin AI sohbet robotu Grok, X platformunda bir arıza yaşadı. Kullanıcıların sorduğu içerikten bağımsız olarak, “Güney Afrika beyaz soykırımı” ve apartheid karşıtı “Boerleri yok et” sloganıyla ilgili çok sayıda bilgi yanıtladı; domuz yavruları videoları gibi alakasız konularda bile bu durum geçerliydi. Olay geniş yankı uyandırdı, OpenAI CEO’su Altman da alaycı bir paylaşımda bulundu. xAI, arızanın Grok’un yanıt istemlerinin yetkisiz bir şekilde değiştirilmesinden kaynaklandığını ve bunun şirket politikalarına ve değerlerine aykırı olduğunu belirtti. Şeffaflığı ve güvenilirliği artırmak için xAI, Grok sistem istemlerini GitHub’da kamuya açık hale getirdi ve iç denetim süreçlerini güçlendirme ve 24 saat izleme ekibi kurma sözü verdi. Bu olay, AI modellerindeki önyargılar, içerik kontrolü ve arkasındaki geliştiricilerin niyetleri hakkındaki etik tartışmaları yeniden alevlendirdi. (Kaynak: 36氪, 36氪, iScienceLuvr, teortaxesTex, andersonbcdefg, gallabytes, jeremyphoward, Reddit r/artificial)

AI Agent, teknoloji devlerinin yeni savaş alanı haline geldi; Tencent ve Alibaba yatırımlarını artırıyor: Tencent ve Alibaba, en son mali raporlarında AI odaklı stratejilerini vurguladı ve AI Agent’ları (akıllı aracılar) gelecekteki büyümenin anahtarı olarak gördü. Tencent CEO’su Ma Huateng, AI’nin reklam ve oyun işletmelerine önemli katkılar sağladığını ve şirketin Yuanbao uygulamasına ve WeChat içindeki AI Agent’lara yaptığı yatırımı artırdığını belirtti. WeChat’in benzersiz ekosisteminin (sosyal, içerik, mini programlar, işlem yetenekleri) karmaşık görevleri yerine getirebilecek benzersiz Agent’lar üretebileceğine inanıyor. Alibaba Yönetim Kurulu Başkanı Joe Tsai de önümüzdeki üç ila beş yıl içinde tüm işletmelerin AI odaklı olması gerektiğini belirtti. Her iki şirket de AI altyapı inşaatı için sermaye harcamalarını önemli ölçüde artırdı. Sequoia Capital de Agent’ların akıllı bir ekonomiye dönüşeceğini öngörüyor. AI Agent’ların yükselişinin hesaplama gücü talebinde bir artışa yol açması ve AI endüstrileşmesinin yeni bir başlangıcı olması bekleniyor. (Kaynak: 36氪, 36氪)

AI hafıza özelliği yarışması kızışıyor; OpenAI, Google, Meta gibi devler kişiselleştirilmiş deneyimi ve kullanıcı bağlılığını artırmak için yarışıyor: OpenAI, Google, Meta ve Microsoft gibi teknoloji devleri, daha kişiselleştirilmiş ve daha yapışkan hizmetler sunmak amacıyla daha fazla kullanıcı bilgisi (konuşma geçmişi, tercihler, arama kayıtları gibi) depolayarak AI sohbet robotlarının hafıza özelliklerini aktif olarak yükseltiyor. Örneğin, ChatGPT “referans konuşma geçmişi” özelliğini ekledi, Google Gemini hafızayı kullanıcı arama geçmişine genişletti. Bu hamle, AI devlerinin farklılaşma rekabetinin ve yeni gelir elde etme yollarını (ortaklık pazarlaması, reklamcılık gibi) keşfetmesinin anahtarı olarak görülüyor. Ancak bu durum, kullanıcı gizliliğinin ihlali, ticari manipülasyon ve AI modellerinin önyargıları güçlendirebileceği veya halüsinasyonlar üretebileceği endişelerini de beraberinde getiriyor. Uzmanlar, hizmet sağlayıcıların arkasındaki teşvik mekanizmalarına dikkat edilmesi gerektiğini hatırlatıyor ve düzenlemelerin güçlendirilmesi çağrısında bulunuyor. (Kaynak: 36氪, 36氪)

🎯 Gelişmeler
OpenAI yeni gelişmelerin habercisi, yazılım geliştirme agent’ı ve masaüstü uygulaması söz konusu olabilir: OpenAI resmi hesabı, “Geliştiriciler, alarmlarınızı kurun” şeklinde gizemli bir duyuru yayınlayarak yakında yeni haberlerin geleceğine işaret etti. Topluluk, bunun uzun süredir konuşulan yazılım geliştirme mühendisi (SDE) agent’ı veya masaüstü AI uygulamasıyla ilgili olabileceğini, hatta satın aldıkları Windsurf ekibinin çalışmalarının bir gösterimi olabileceğini tahmin ediyor. Daha önce Sam Altman da “düşük profilli bir araştırma önizlemesi” paylaşacağından bahsetmişti, bu da piyasada OpenAI’nin otomatik yazılım geliştirme, bilgisayar kullanım agent’ları gibi alanlardaki yeni gelişmelere yönelik beklentileri artırdı. (Kaynak: openai, op7418, dotey, cto_junior, brickroad7, kevinweil, tokenbender, Teknium1)

Ollama 0.7.0 sürümü yayınlandı, çok modlu modelleri resmi olarak destekliyor: Ollama, çok modlu modellere destek ekleyen 0.7.0 sürümünü yayınladı. Bu, kullanıcıların artık Google’ın Gemma 3 ve Alibaba Qwen’in Qwen 2.5 VL gibi görsel dil modellerini Ollama aracılığıyla çalıştırabileceği anlamına geliyor. Bu güncelleme, Ollama’nın yerel olarak büyük dil modellerini çalıştırma yeteneğini genişleterek metin ve görüntü içeren daha karmaşık görevleri yerine getirmesini sağlıyor ve yerel AI uygulamalarının gelişimini daha da ilerletiyor. (Kaynak: ollama, jerryjliu0, ollama, Reddit r/LocalLLaMA)

Lenovo, NVIDIA GB10 süper çipli AI mini ana bilgisayarını piyasaya sürmeyi planlıyor: Lenovo, NVIDIA Digits’e benzer küçük bir AI ana bilgisayarı piyasaya sürmeyi planlıyor. Bu ana bilgisayar NVIDIA GB10 Grace Blackwell Superchip’i kullanacak. Hesaplama gücünün 1 PFLOPS’a ulaşması ve 128 GB birleşik belleğe sahip olması bekleniyor. Ancak, GB10 Grace Blackwell Superchip’in bellek bant genişliğinin yalnızca 273 GB/s ile nispeten düşük olması dikkat çekicidir, bu da performansında bir darboğaz oluşturabilir. (Kaynak: karminski3, Reddit r/LocalLLaMA)

ByteDance’in Seed-Thinking gibi önde gelen AI modelleri CCPC programlama yarışması finallerinde düşük performans göstererek mevcut AI algoritmalarının problem çözme eksikliklerini ortaya koydu: Onuncu Çin Üniversite Öğrencileri Programlama Yarışması (CCPC) finallerinde, ByteDance’in Seed-Thinking ve OpenAI’nin o3/o4, Google’ın Gemini 2.5 Pro gibi tanınmış AI modelleri bekleneni veremedi, çoğu yalnızca bir “kayıt sorusu” çözebildi, DeepSeek R1 ise hiç AC alamadı. Bu sonuç tartışmalara yol açtı ve mevcut büyük modellerin benzersiz yaratıcılık ve karmaşık mantık gerektiren algoritma yarışması problemlerini çözmede, özellikle Agentic olmayan (yani harici araç yardımıyla yürütme ve hata ayıklama olmadan) ortamlarda hala eksiklikleri olduğunu gösterdi. Bazı modeller IOI gibi yarışmalarda Agentic eğitimle iyi sonuçlar elde etmiş olsa da, bu CCPC performansı, tamamen yeni ve karmaşık algoritma sorunlarıyla karşılaşıldığında saf model çıkarım yeteneklerinin sınırlamalarını vurguladı. (Kaynak: 36氪)

Ses ve video çipleri ile uç AI teknolojisinin hızlanan entegrasyonu, tüketici terminallerinin akıllılaşmasını sağlıyor: Uç AI taleplerinin artmasıyla birlikte, ses ve video çip üreticileri, cep telefonları, PC’ler, giyilebilir cihazlar gibi tüketici elektroniğinin yerel veri işleme, akıllı karar verme ve kişiselleştirilmiş deneyim ihtiyaçlarını karşılamak için AI teknolojisini ürünlerine entegre etme sürecini hızlandırıyor. Telink Microelectronics, Actions Technology, Bestechnic, Ingenic Semiconductor, Fullhan Microelectronics gibi şirketler, NPU entegre eden ve AI algoritmalarını (gürültü azaltma, akıllı ses işleme, görsel uygulamalar gibi) destekleyen çip çözümlerini art arda piyasaya sürüyor. Bu eğilim, cihazların etkileşim mantığını ve uygulama senaryolarını yeniden yapılandırmayı, tüketici sınıfı akıllı cihazları “AI olarak hizmet” ekosistemine doğru ilerletmeyi amaçlıyor. Sektör hala “katil uygulama” arayışında olsa da, AI’nin fonksiyonel modülleri tanımlaması olumlu bir işaret olarak kabul ediliyor. (Kaynak: 36氪)

OpenAI Baş Bilim İnsanı Pachocki: AI orijinal araştırma yeteneği kazanmaya başladı, AGI teoriden gerçeğe dönüşüyor: OpenAI Baş Bilim İnsanı Jakub Pachocki, Nature dergisine verdiği röportajda, takviyeli öğrenmenin AI modellerini “muhakeme” sınırlarına yaklaştırdığını ve AGI’nin (Genel Yapay Zeka) teoriden gerçeğe dönüştüğünü belirtti. AI’nin gelecekte bağımsız olarak orijinal bilimsel araştırmalar yapabileceğini, yazılım mühendisliği, donanım tasarımı gibi alanların gelişimini destekleyeceğini öngörüyor. Modellerin çalışma mekanizmalarının insan beyninden farklı olmasına rağmen, yeni anlayışlar üretebildiğini ve bir tür düşünme yeteneğine sahip olduğunu vurguladı. OpenAI, mevcut açık kaynaklı modellerden daha iyi performans gösteren yeni bir sürüm yayınlamayı planlıyor, ancak güvenlik önceliğiyle. Pachocki, AI’nin bir sonraki kilometre taşının, özellikle orijinal araştırmalar alanında ölçülebilir ekonomik etki yaratmak olduğunu düşünüyor ve AI’nin bu yıl içinde değerli yazılımları neredeyse otonom olarak geliştirebileceğini tahmin ediyor. (Kaynak: 36氪)
Apple AI (Apple Intelligence) lansmanı gecikti, Çin anakarası sürümünün iOS 18.6 veya daha sonrasını beklemesi gerekiyor: Apple’ın WWDC24’te duyurduğu Apple Intelligence’ın 2025’te tam olarak piyasaya sürülmesi planlanıyordu, ancak Çin anakarası sürümü hala yayınlanmadı ve en azından Temmuz ayındaki iOS 18.6’yı beklemesi bekleniyor. İngilizce sürümü yayınlanmış olsa da, gelişmiş Siri, Genmoji gibi temel özelliklerin eksik olması veya yetersiz deneyim sunması kullanıcıların memnuniyetsizliğine ve toplu davalara yol açtı. Çin anakarası sürümünün gecikmesinin temel nedeni, yerel düzenleyici politikalara uyum sağlama, yerelleştirme ve içerik denetimi ihtiyacıdır; Baidu Wenxin Yiyan gibi yerel AI’larla işbirliği yapılacağı söyleniyor. Perplexity AI, Meta AI gibi rakiplerin hızlı entegrasyonu ve zorlukları karşısında Apple AI’nin gecikmesi, ekosistem avantajını ve kullanıcı sadakatini etkileyebilir. (Kaynak: 36氪)

AI teknolojisi tedarik zinciri yönetimini yeniden şekillendiriyor, AI tam yığın tedarik zinciri yönetimi platformu pazarını doğuruyor: Tedarik zinciri karmaşıklığının artması, risklerin büyümesi ve verimlilik darboğazları gibi yeni zorluklar karşısında, AI teknolojisi (özellikle makine öğrenimi, yöneylem araştırması ve üretken AI) tedarik zinciri yönetimini akıllı dönüşüme yönlendiriyor. AI tam yığın tedarik zinciri yönetimi platformları, iş süreçlerinin dijitalleştirilmesi, veri zekası ve uçtan uca işbirliği yoluyla talep algılamadan yerine getirme yürütmesine kadar tüm süreci optimize etmek amacıyla ortaya çıktı. Bu platform, veri orta katmanını, akıllı karar motorunu, uçtan uca izlemeyi ve ekosistem işbirliği portalını entegre ediyor. Temel değeri, çevik yanıt verme ve doğru tahmin yeteneğini (talep tahmin doğruluğu %85’in üzerinde), verimlilik ve maliyet optimizasyonunu (stok devir hızı %40’ın üzerinde artış), uçtan uca şeffaflık ve risk yönetimini, ekosistem işbirliği ve dayanıklılığın artırılmasını ve sürdürülebilir kalkınmayı desteklemeyi içeriyor. Hypebeast Research, 2024 yılında Çin’deki bu pazarın büyüklüğünün yaklaşık 700 milyon yuan olacağını ve 2027’de 1 milyar yuanı aşacağını öngörüyor. (Kaynak: 36氪)
Zhang Yaqin, ChatGPT sonrası dönemde Çin’in AI fırsatlarını değerlendirdi: Beş ana gelişim yönü ve üç tahmin: Tsinghua Üniversitesi Akıllı Endüstri Araştırma Enstitüsü Dekanı Zhang Yaqin, ChatGPT’nin Turing testini geçen ilk akıllı varlık olduğunu ve AI için bir kilometre taşı olduğunu düşünüyor. Büyük modellerin BT yapısını yeniden şekillendirdiğini, Çin’in üst düzey çipler ve algoritma sistemleri konusunda en üst düzeyden geride olduğunu, ancak dikey temel modeller, SaaS katmanı ve uç cihazlar (akıllı telefonlar, PC’ler, IoT, otomobiller vb.) alanlarında çok sayıda fırsat bulabileceğini belirtti. AI büyük modelleri için beş ana gelişim yönü öngördü: çok modlu zeka, otonom zeka, uç zeka, fiziksel zeka (otonom sürüş, robotlar) ve biyolojik zeka (beyin-bilgisayar arayüzleri, tıp). Ayrıca üç görüş ortaya koydu: 1) Büyük modeller ve üretken AI önümüzdeki 10 yılın ana akımı olacak; 2) Temel büyük model + dikey büyük model + uç model, açık kaynak + ticari bir arada var olacak; 3) Birleşik tanımlama (Tokenisation) + ölçek yasası (Scaling Law) çekirdektir, ancak verimliliği artırmak için yeni algoritma sistemlerine ihtiyaç vardır, önümüzdeki 5 yıl içinde AI teknoloji mimarisinde büyük atılımlar olabilir; 4) 15-20 yıl içinde genel yapay zekaya ulaşılması ve aşamalı olarak yeni Turing testlerinden geçilmesi bekleniyor. (Kaynak: 36氪)

🧰 Araçlar
Windsurf, yazılım geliştirme verimliliğini %99 artırmayı amaçlayan ilk kendi geliştirdiği öncü model SWE-1 serisini yayınladı: AI programlama aracı şirketi Windsurf (OpenAI tarafından satın alınacağı söylentileri var), yazılım mühendisliği için optimize edilmiş ilk model serisi olan SWE-1’i piyasaya sürdü. Seri, SWE-1 (Claude 3.5 Sonnet benzeri, daha düşük maliyetli), SWE-1-lite (Cascade Base’in yerini alıyor, tüm kullanıcılara açık) ve SWE-1-mini’yi (düşük gecikme süresi, Windsurf Tab için) içeriyor. SWE-1’in temel yeniliği, AI’nin kullanıcıyla operasyon zaman çizelgesini paylaştığı, verimli işbirliği sağladığı, tamamlanmamış durumları ve uzun süreli görevleri anladığı “Akış Farkındalığı” (Flow Awareness) sistemidir. Çevrimdışı değerlendirme ve çevrimiçi gerçek testler, SWE-1’in konuşma tabanlı ve uçtan uca SWE görevlerinde en iyi modellere yakın performans gösterdiğini ve kod katkı oranı gibi metriklerde öncü olmayan modellerden daha iyi olduğunu gösteriyor. (Kaynak: 36氪)

Açık kaynak projesi WeClone: WeChat sohbet kayıtlarını kullanarak kişiselleştirilmiş AI dijital ikizler oluşturma: WeClone adlı bir Python açık kaynak projesi, kullanıcıların kişisel WeChat sohbet kayıtlarına dayanarak AI dijital ikizler oluşturmasına olanak tanıyor. Proje, RAG (Retrieval Augmented Generation) bilgi tabanı prensibini kullanarak WeChat sohbet verilerini içe aktarıyor, LoRA yöntemiyle Qwen2.5-7B-Instruct gibi modelleri ince ayar yapıyor ve kullanıcı sesini oluşturmak için ASR (konuşma tanıma) ve TTS (metinden sese) teknolojilerini birleştiriyor. Proje, AstrBot aracılığıyla WeChat, Enterprise WeChat ve Feishu ile entegrasyonu destekliyor. WeChat sohbet kayıtları, kişiselleştirilmiş, çok senaryolu gerçek konuşmalar içerdiğinden, dijital insanları eğitmek için özel bir bilgi tabanı olarak çok uygundur ve kişiselleştirilmiş AI asistanları, kurumsal müşteri hizmetleri, pazarlama ve hatta finansal danışmanlık gibi çeşitli senaryolarda uygulanabilir. (Kaynak: 36氪)

llama.cpp yeni özelliği: PDF içeriği çıkarma ve girişi destekliyor, ancak şimdilik yalnızca Web arayüzüyle sınırlı ve karmaşık formatları iyi işleyemiyor: llama.cpp projesi yakın zamanda PR #13562 aracılığıyla PDF dosyaları için giriş desteği ekledi. Bu özellik, llama.cpp kaynak kodunu doğrudan değiştirmek yerine, bir JavaScript kütüphanesi aracılığıyla Web arayüzünde PDF içeriğini çıkarıp llama.cpp’ye iletiyor. Bu, özelliğin şu anda yalnızca llama.cpp tarafından sağlanan Web UI ile sınırlı olduğu ve API düzeyinde henüz mevcut olmadığı anlamına geliyor. PDF içeriğinin kolayca içe aktarılmasını sağlasa da, matematiksel formüller gibi karmaşık öğeler içeren PDF’ler için çıkarma etkisi ortalama düzeydedir ve ayrıştırma hataları oluşabilir. (Kaynak: karminski3)

Unsloth çerçevesi TTS ince ayar özelliği ekledi ve Qwen3 GRPO’yu destekliyor: Unsloth, çerçevesinin artık metinden sese (TTS) modellerinin ince ayarını desteklediğini, eğitim hızını yaklaşık 1.5 kat artırdığını ve VRAM tüketimini %50 azalttığını duyurdu. Desteklenen modeller arasında Sesame/csm-1b, OpenAI/whisper-large-v3 gibi Transformer mimarili modeller bulunuyor. TTS ince ayarı, sesleri taklit etmek, konuşma tarzını ve tonunu ayarlamak, yeni dilleri desteklemek vb. için kullanılabilir. Unsloth, modelleri ücretsiz olarak eğitmek, çalıştırmak ve kaydetmek için Colab Notebooks sunuyor. Ayrıca Unsloth, temel bir model ve yeni bir yakınlık tabanlı ödül işlevi kullanarak optimize edilen Qwen3 GRPO (Generative Retrieval Policy Optimization) desteğini de ekledi. (Kaynak: Reddit r/LocalLLaMA)

INAIR, mobil hafif ofis pazarını hedefleyen AI uzamsal bilgisayarını piyasaya sürdü: AR+AI gözlük şirketi INAIR, AR gözlüğü INAIR 2 Pro, hesaplama merkezi INAIR Pod ve 3D uzamsal işlem klavyesi INAIR Touchboard’dan oluşan AI uzamsal bilgisayarını piyasaya sürdü. Ürün, seyahat eden iş insanları ve hafif ofis kullanıcıları için dizüstü bilgisayarlara alternatif bir ikinci seçenek sunmayı amaçlıyor; eşdeğer 4 metrelik 134 inç sınırsız dev ekran yansıtabiliyor ve bilgisayarların uzaktan kontrolünü destekliyor. Taşıdığı INAIR AI Agent sistem düzeyindeki akıllı asistan, DeepSeek, Doubao, Wenxin Yiyan, ChatGPT gibi çeşitli büyük modelleri entegre ederek gerçek zamanlı çeviri, içerik özeti gibi işlevler sunuyor ve kullanıcı alışkanlıklarını öğrenerek çalışma verimliliğini artırıyor. (Kaynak: 36氪)

llamafile çıkarım çerçevesi Qwen3 modellerini destekliyor: llama.cpp ve son derece taşınabilir bir C kütüphanesi olan Cosmopolitan Libc’yi entegre eden bir çıkarım çerçevesi olan llamafile, artık Qwen3 serisi modelleri destekliyor. Temel özelliği, tüm çalışma bağımlılıklarını tek bir yürütülebilir dosyada paketleyerek taşınabilirliği büyük ölçüde artırması ve kullanıcıların karmaşık kurulum süreçleri olmadan büyük modelleri çalıştırabilmesidir. (Kaynak: karminski3)

Kling AI, 2.0 sürümünü ve API’sini piyasaya sürdü, 3D Logo döndürme gibi yeni özellikler ekledi: Kling AI, Kling 2.0, Elements ve Video Effects Suite API’sinin kullanıma sunulduğunu duyurdu. Yeni sürüm, video oluşturma yeteneklerini geliştirdi ve DizzyDizzy veya Image to Video işlevini kullanarak hızlı bir şekilde 3D dönen logolar oluşturma gibi eğitimler sundu; kullanıcılar 3D becerilerine ihtiyaç duymadan yaratım yapabilirler. (Kaynak: Kling_ai, Kling_ai)
Manus AI, görüntü oluşturma özelliği ekledi, muhtemelen GPT-4o API tabanlı: AI asistan uygulaması Manus, görüntü oluşturmayı desteklediğini duyurdu. Resmi açıklamaya göre, Manus yalnızca görüntü oluşturmakla kalmıyor, aynı zamanda kullanıcı niyetini anlıyor, çözüm planlıyor ve görevleri tamamlamak için görüntü oluşturmayı diğer araçlarla etkili bir şekilde birleştiriyor. Topluluk, görüntü oluşturma yeteneğinin OpenAI’nin en son GPT-4o modelinin API’sine dayalı olabileceğini tahmin ediyor. (Kaynak: op7418)
Blackbox, IDE içinde isteğe bağlı A100/H100 GPU erişim hizmeti sunuyor: Blackbox, entegre geliştirme ortamı (IDE) içinde doğrudan isteğe bağlı olarak üst düzey GPU’lara (A100’ler ve H100’ler) erişim hizmetini başlattı. Kullanıcılar, karmaşık bulut kontrol paneli işlemleri veya API anahtar yönetimi olmadan doğrudan IDE’den veya Blackbox eklentisinden GPU örneklerini başlatabilirler. Fiyatlandırma, 8 A100 düğümü için saatte 14 ABD doları olup, makine öğrenimi ve ağır işlem görevleri için hesaplama kaynağı edinmeyi basitleştirmeyi ve bir terminal sekmesi açmak kadar kolay hale getirmeyi amaçlamaktadır. (Kaynak: Reddit r/deeplearning)
📚 Öğrenme
HuggingFace, MCP (Model Uyum Protokolü) eğitimi başlattı: HuggingFace, kullanıcıların MCP protokolünün yapısını anlamalarına, mevcut SDK/çerçeveleri kullanmalarına ve kendi MCP hizmetlerini uygulamalarına yardımcı olmak amacıyla yeni bir MCP eğitimi yayınladı. Bu dersin içeriği nispeten basittir ve deneyimli mühendislerin hızla kavraması için uygundur; tamamlandıktan sonra bir bitirme sertifikası alınabilir. MCP protokolü, modeller arasında bilgi, değer ve güven aktarımını sağlamak için kritik öneme sahiptir ve akıllı bir ekonomi inşa etmenin teknik zorluklarından biridir. (Kaynak: karminski3)

Yeni makale J1: LLM-as-a-Judge’ı RL aracılığıyla “düşünmeye” teşvik etme: “J1: Incentivizing Thinking in LLM-as-a-Judge via RL” başlıklı yeni bir makale, takviyeli öğrenme (özellikle GRPO) yoluyla büyük dil modellerinin değerlendirici (LLM-as-a-Judge) olarak düşünme süreçlerini, puanlamalarını ve yargılarını optimize etmek için bir yöntem önermektedir. Bu yöntem, doğrulanabilir ve doğrulanamayan istem yargı görevlerini, yalnızca sentetik eşleştirilmiş veriler kullanarak doğrulanabilir görevlere dönüştürebilir. Araştırma, J1 modelinin 8B ve 70B ölçeklerinde temel çizgilerden daha iyi performans gösterdiğini ve değerlendirme kriterlerini listeleme, kendi ürettiği referans cevaplarla karşılaştırma, doğruluğu yeniden değerlendirme gibi çeşitli düşünme stratejileri sergilediğini bulmuştur. (Kaynak: jaseweston, jaseweston)

Pekin Üniversitesi ve Renmin Üniversitesi ortaklaşa Being-M0’ı yayınladı: Milyonlarca veri kümesiyle desteklenen insansı robot genel hareket oluşturma çerçevesi: Pekin Üniversitesi’nden Lu Zongqing’in ekibi, Çin Renmin Üniversitesi ve diğerleriyle işbirliği içinde, genel insansı robot hareket oluşturma çerçevesi Being-M0’ı önerdi ve sektördeki ilk milyon ölçekli hareket oluşturma veri kümesi MotionLib’i oluşturdu. Bu çerçeve, büyük ölçekli internet video verilerini kullanarak, uçtan uca metin odaklı hareket oluşturma modeliyle birleştirerek karmaşık, çeşitli insan hareketleri oluşturmayı başarıyor ve insan hareketlerini Unitree H1, G1 gibi çeşitli biçimlerdeki insansı robotlara aktarabiliyor. Temel yenilikler arasında MotionLib veri kümesinin oluşturma süreci, hareket oluşturma alanında “büyük veri + büyük model”in fizibilitesini doğrulayan model ve geleneksel VQ teknolojisinin yüksek boyutlu hareket verisi sıkıştırmasındaki bilgi kaybı sorununu çözen yenilikçi iki boyutlu aramasız niceleme çerçevesi MotionBook yer alıyor. (Kaynak: 量子位)

ByteDance, VLM’lerin gerçek dünya belge anlama yeteneğini değerlendirmek için WildDoc veri kümesini yayınladı: ByteDance, Hugging Face’te yeni bir görsel soru yanıtlama (VQA) veri kümesi olan WildDoc’u yayınladı. Bu veri kümesi, görsel dil modellerinin (VLM) gerçek dünya senaryolarında belgeleri anlama yeteneğini değerlendirmeyi amaçlamaktadır. (Kaynak: _akhaliq)
ICRA 2025 (IEEE Uluslararası Robotik ve Otomasyon Konferansı) gündeminden öne çıkanlar: 2025 IEEE Uluslararası Robotik ve Otomasyon Konferansı (ICRA), 19-23 Mayıs tarihleri arasında Atlanta, ABD’de gerçekleştirilecek. Konferans içeriğinde Allison Okamura, Tessa Lau, Raffaello D’Andrea gibi isimlerin açılış konuşmaları ile rehabilitasyon robotları, optimizasyon kontrolü, insan-makine etkileşimi, yumuşak robotlar, saha robotları, biyonik robotlar, dokunma, planlama, manipülasyon, hareket, güvenlik ve biçimsel yöntemler, çoklu robot sistemleri gibi 12 farklı alanda önemli sunumlar yer alacak. Ayrıca, bilimsel iletişim hızlandırılmış kursu, 59 çalıştay ve eğitim, robotik etik forumu, Afrikalı bilim insanlarının robotik araştırmalarını ilerletme forumu, lisans robotik eğitimi forumu ve topluluk oluşturma günü gibi etkinlikler de düzenlenecek. (Kaynak: aihub.org)

Makale LlamaDuo: Hizmet LLM’lerinden küçük ölçekli yerel LLM’lere sorunsuz geçiş sağlayan LLMOps süreci: ACL 2025 ana konferansına kabul edilen “LlamaDuo: LLMOps Pipeline for Seamless Migration from Service LLMs to Small-Scale Local LLMs” başlıklı bir makale, kullanıcıların büyük hizmet tipi LLM’leri (API çağrıları gibi) kullanmaktan küçük ölçekli yerel LLM’leri kullanmaya sorunsuz bir şekilde geçiş yapmalarına yardımcı olmak için bir LLMOps süreci sunmaktadır. Bu araştırma, açık kaynak ve topluluk işbirliğinin bir ürünü olup, pratik uygulamalarda model dağıtım stratejilerini esnek bir şekilde değiştirme ve optimize etmenin önemini vurgulamaktadır. (Kaynak: algo_diver)

Tubi araştırması: Tweedie regresyonu, video on demand kullanıcı etkileşimi optimizasyonunda ağırlıklı LogLoss’tan daha iyi performans gösteriyor: Video platformu Tubi’nin araştırması, video öneri sistemlerini kullanıcı etkileşimini (örneğin sonraki izleme süresi) artırmak için optimize etme konusunda, doğrudan kullanıcı izleme süresini tahmin eden Tweedie regresyon modelinin, geleneksel izleme süresi ağırlıklı LogLoss modelinden daha etkili olduğunu göstermektedir. Deney sonuçları, Tweedie regresyonunun gelirde +%0.4 ve izleme süresinde +%0.15 artış sağladığını göstermiştir. Araştırma, Tweedie regresyonunun istatistiksel özelliklerinin, izleme süresi verilerinin sıfır şişkinliği ve çarpık dağılım özelliklerine daha uygun olduğunu savunmaktadır. (Kaynak: Reddit r/MachineLearning)

💼 Ticari
Dudak senkronizasyonu uygulaması Hedra, a16z liderliğinde 32 milyon dolarlık A turu finansman aldı: AI video oluşturma girişimi Hedra, Andreessen Horowitz (a16z) liderliğinde 32 milyon dolarlık A turu finansmanını tamamladığını duyurdu. Matt Bornstein yönetim kuruluna katıldı. Mevcut yatırımcılar a16z speedrun, Abstract ve Index Ventures da bu tura katıldı. Hedra, etkileyici ve kontrol edilebilir karakter konuşma videoları oluşturmaya odaklanıyor; teknolojisi, AI tarafından oluşturulan videolarda dudak senkronizasyonu ve duygusal ifade zorluklarını çözmeyi amaçlıyor. (Kaynak: op7418)
ABD, Suudi Arabistan ve BAE ile AI alanında işbirliği anlaşması imzaladı; 5GW veri merkezi ve çip tedarikini içeriyor, Çin etkisini dışlamayı amaçlıyor: ABD, Suudi Arabistan ve Birleşik Arap Emirlikleri ile 5GW veri merkezi inşasını ve NVIDIA, AMD, Qualcomm gibi ABD şirketlerinden (NVIDIA Blackwell çipleri gibi) büyük miktarda gelişmiş AI çipi tedarikini içeren önemli bir AI işbirliği anlaşması imzaladı. Suudi Arabistan’ın yeni kurulan AI şirketi Humain, temel yürütücü taraf olacak. Bu hamle, ABD’nin Orta Doğu’da AI teknoloji yığınını yaygınlaştırması, altyapı inşaatını hızlandırması ve bu yolla müttefiklerini güvence altına alması, aynı zamanda Çin’in bölgedeki AI altyapı yatırımlarını ve teknoloji etkisini sınırlama stratejik hamlesi olarak görülüyor. Yeni anlaşma, daha önce Orta Doğu’ya AI çip ihracatına yönelik bazı kısıtlamaları kaldırdı, ancak aynı zamanda Huawei Ascend gibi Çin çiplerinin küresel kullanımına yönelik uyarıları güçlendirdi. (Kaynak: dylan522p, 36氪, iScienceLuvr)

Restoran SaaS şirketi Owner, 120 milyon dolar finansmanla unicorn oldu, AI kullanarak “AI restoran yöneticisi” yaratıyor: Bağımsız restoranlara tam yığın dijital çözümler sunan Owner şirketi, yakın zamanda 120 milyon dolarlık C turu finansmanını tamamlayarak 1 milyar dolar değerlemeye ulaştı. Owner, aylık sabit bir ücret karşılığında restoranlara web sitesi/uygulama oluşturma, entegre sipariş ve teslimat, SEO optimizasyonu ve pazarlama otomasyonu hizmetleri sunuyor ve 10.000’den fazla restorana hizmet veriyor. 2025 AI stratejisi, AI çalışanlarını ve insan çalışanlarını yönetmek için “AI restoran yöneticisi” (AI CMO, CFO, CTO) başlatmayı ve hizmet verimliliğini artırmak için konuşma tabanlı bir AI Agent oluşturmayı içeriyor. Bu finansman turu Redpoint Ventures ve Altman Capital tarafından ortaklaşa yönetildi ve AI’nin geleneksel SaaS değerini yeniden şekillendirme potansiyelini gösteriyor. (Kaynak: 36氪)

🌟 Topluluk
Stack Overflow etkinliği 2009 seviyesine düştü, AI ana neden olabilir: Veriler, tanınmış geliştirici soru-cevap topluluğu Stack Overflow’un aylık soru sayısının 2009’da ilk piyasaya sürüldüğü zamanki seviyesine düştüğünü gösteriyor. Bu durum, AI’nin geleneksel geliştirici toplulukları üzerindeki etkisi hakkında tartışmalara yol açtı. Birçok kişi, ChatGPT gibi AI programlama asistanlarının yükselişiyle birlikte geliştiricilerin, Stack Overflow gibi topluluklarda soru sormak ve insan yanıtlarını beklemek yerine doğrudan AI’ye soru sorma ve kod çözümleri arama eğiliminde olduğunu düşünüyor; bu da topluluk etkinliğinin keskin bir şekilde düşmesine neden olmuş olabilir. (Kaynak: zachtratar, karminski3)

AI işyerinde “profesyonellik” krizi duygusu yaratıyor, çalışanlar AI çağında daha fazla insan sıcaklığına ihtiyaç duyulduğunu düşünüyor: AI’nin işyerlerinde yaygınlaşmasıyla birlikte birçok çalışan, mesleki becerilerinin “yapısöküme uğradığını” hissediyor. Liderler, çalışanların çalışmalarını AI’ye düzelttirme eğiliminde, hatta AI’nin insan çalışanlardan daha iyi olduğunu düşünüyor, bu da çalışanların saygı görmediğini ve yerini alma tehlikesiyle karşı karşıya olduğunu hissetmesine neden oluyor. Araştırmalar, çalışanların CEO’nun kendisi ile AI tarafından yazılan e-postaları ayırt edebildiğini ve içeriğin AI tarafından oluşturulduğunu düşündüklerinde, insan tarafından yazılmış olsa bile değerlendirmelerinin düştüğünü gösteriyor. Bu, insanların insan yaratıcılığına olan tercihini ve AI’ye aşırı bağımlılık endişesini yansıtıyor. Aynı zamanda, McKinsey araştırması, işten ayrılan çalışanların %54’ünün değer görmediğini hissettiği için ayrıldığını ve çalışanların %82’sinin AI çağında daha fazla kişilerarası bağlantıya ve duygusal ilgiye ihtiyaç duyulduğunu düşündüğünü belirtiyor. (Kaynak: 36氪, 36氪)

Çinli gençler AI partnerlerini benimsiyor, bu durum toplumda düşük doğurganlık oranı endişelerini artırıyor: The Economist, Çinli gençler arasında AI ile flört etme ve arkadaşlık kurma olgusunun yükselişine dikkat çekti. “Maoxiang”, “Xingye” gibi AI partner uygulamalarının kullanıcı sayısı artmaya devam ediyor, kullanıcılar sanal karakterler oluşturarak duygusal ihtiyaçlarını karşılıyor. Teknolojinin gelişimi, AI’nin duyguları ve empatiyi taklit etmesini sağlıyor; gençlerin yaşam baskısının artması, sosyalleşme zamanının azalması, evlilik oranlarının düşmesi gibi faktörler bu eğilimi körüklüyor. Ancak hükümet, AI partnerlerinin zaten ciddi olan düşük doğurganlık sorununu (2024’te toplam doğurganlık oranı sadece 1.0) daha da kötüleştirebileceğinden endişe ediyor. (Kaynak: dotey)

AI destekli eğitim yeni normal olabilir, ancak profesörlerin ChatGPT’ye aşırı bağımlılığı öğrenci memnuniyetsizliğine ve yansımalara yol açıyor: Northeastern Üniversitesi’nde bir öğrenci, profesörünün ders materyallerini oluşturmak için ChatGPT kullanması nedeniyle okuldan öğrenim ücretinin iadesini talep ederek dava açtı. Olay, AI’nin yükseköğretimdeki rolü hakkında geniş çaplı tartışmalara yol açtı. Öğrenciler, yüksek öğrenim ücretlerinin algoritma tarafından oluşturulan içerik yerine insan uzmanlığıyla öğretim alması gerektiğini savunuyor ve AI’nin profesörlerin düşünme ve geri bildirim verme yeteneğinin yerini almasından endişe ediyor. Profesörler ise AI’yi verimliliği artırmak ve yoğun iş yüküyle başa çıkmak için bir araç olarak görüyor. Eğitimciler, önemli olanın AI’yi sorumlu bir şekilde kullanmak, insan yaratıcılığını ve denetimini değiştirmek yerine geliştirmek, öğrencilere AI çağının etik kurallarını öğretmek ve AI tarafından oluşturulan içeriğin profesyonelce düzenlenip onaylanmasını sağlamak olduğunu belirtiyor. (Kaynak: 36氪, Reddit r/ChatGPT)

Salesforce CEO’su, Microsoft ile OpenAI arasındaki ilişkinin temelden koptuğunu ve onarılamaz olduğunu söyledi: Salesforce CEO’su Marc Benioff bir röportajda, Microsoft ile OpenAI arasındaki işbirliği ilişkisinin “temelden koptuğunu ve onarılması zor” olduğunu belirtti. Microsoft Copilot’un müşterileri hayal kırıklığına uğrattığını, daha çok verimsiz bir Clippy’ye benzediğini ve OpenAI CFO’sunun teknoloji mimarisi şemasında Microsoft yazılımından veya Azure’dan bahsetmemesinin iki taraf arasındaki çatlağı doğruladığını belirtti. Benioff, Microsoft’un esasen bir ChatGPT satıcısı olduğunu, AI stratejisinin sınırlı olduğunu ve “Prometheus Projesi” aracılığıyla kendi geliştirdiği bir model oluşturmaya çalıştığını düşünüyor. Ayrıca DeepSeek gibi açık kaynaklı modellerin yükselişinin sektörü MOE mimarisine doğru ittiğini, model kullanım maliyetlerini düşürdüğünü ve “model tekeli” iş mantığını yıktığını da belirtti. (Kaynak: 36氪)

AI tarafından üretilen içeriğin gerçekliği ve telif hakkı endişe yaratıyor, PDF içinde LLM ve Linux çalıştırmak teknolojik potansiyeli gösteriyor: Son zamanlarda teknoloji meraklıları, PDF dosyalarında doğrudan küçük dil modellerini (TinyStories, Pythia, TinyLLM gibi) ve hatta Linux sistemlerini çalıştırma yeteneğini sergiledi; bu, PDF’in JavaScript desteğinden yararlanılarak gerçekleştirildi. Bu “ileri teknoloji” operasyonu internet kullanıcıları arasında hararetli tartışmalara yol açtı ve aynı zamanda AI modellerinin küçültülmesi ve uç cihazlarda dağıtılması eğilimini de vurguladı. Aynı zamanda, AI tarafından üretilen içeriğin telif hakkı, gerçekliği ve “deepfake” sorunları da büyük ilgi görüyor. Zhang Yaqin, AI risklerinin deepfake, halüsinasyonlar, zehirli bilgiler vb. içerdiğini, bunlara büyük önem verilmesi ve AI’nin insan değerleriyle uyumunun ve etik denetiminin güçlendirilmesi gerektiğini belirtti. (Kaynak: 36氪, 36氪)

💡 Diğer
Theta, CUB benchmark’ını yayınladı: Bilgisayar ve tarayıcı kullanan agent’ların “insanlığın son testi”ni değerlendiriyor: Theta, CUB (Computer and Browser Use Agents) adlı yeni bir benchmark testini piyasaya sürdü ve bunun bilgisayar ve tarayıcı kullanan agent’lar için “insanlığın son testi” olduğunu iddia etti. Bu tür benchmark’lar, AI agent’larının karmaşık görevleri tamamlamak için insan kullanımını taklit etme yeteneklerini değerlendirmeyi amaçlamaktadır. Ancak, daha önce de birçok benchmark kendisini “insanlığın son testi” olarak adlandırmıştı, bu da isimlendirmenin abartılı olabileceği tartışmalarına yol açtı. (Kaynak: _akhaliq, DhruvBatraDB)

AI, müstehcen içerik üretmekle suçlanıyor, modelin kötüye kullanımı ve etik sınırlar konusunda endişelere yol açıyor: Sosyal medyada, kullanıcıların AI görüntü oluşturma araçlarını (ChatGPT’nin DALL-E 3’ü gibi) müstehcen veya alaycı resimler (örneğin “Shittington Bear”) oluşturmak için kullandığına dair örnekler ortaya çıktı. Bu durum, AI araçlarının uygunsuz içerik üretmek, telif haklarını ihlal etmek (örneğin tanınmış çizgi film karakterlerini alaya almak) ve toplumsal etik sınırlarını zorlamak için kötüye kullanılabileceği endişelerini artırdı. AI platformları genellikle içerik filtrelerine sahip olsa da, kullanıcılar yine de ustaca istemlerle kısıtlamaları aşabilirler. (Kaynak: Reddit r/ChatGPT)

Araştırma, AI’nin CEO iletişim tarzlarını taklit etmede sınırlamaları olduğunu, çalışanların insanlara daha çok güvendiğini gösteriyor: Harvard Business School araştırması, çalışanların AI ile şirket CEO’su Wade Foster (Zapier CEO’su) tarafından yazılan mesajları ayırt etme doğruluk oranının yaklaşık %59 olduğunu buldu. Daha da önemlisi, çalışanlar bir mesajın AI tarafından oluşturulduğunu düşündüklerinde, içerik aslında CEO’nun kendisinden gelse bile değerlendirmeleri daha düşük oluyor; tersine, CEO tarafından yazıldığı düşünülen içerik, AI tarafından oluşturulmuş olsa bile daha yüksek değerlendiriliyor. Bu, insanların insan iletişimine olan güven ve değer algısının AI’den daha yüksek olduğunu gösteriyor. Araştırma, liderlerin AI iletişimini kullanırken şeffaf olmalarını, çok kişisel yanıtlar için kullanmaktan kaçınmalarını ve AI tarafından oluşturulan içeriği sıkı bir şekilde denetlemelerini öneriyor. (Kaynak: 36氪)