Anahtar Kelimeler:Yapay Zeka Ajanı, Microsoft Build 2025, AlphaEvolve, GPT-4, Azure Yapay Zeka Dökümhanesi, NVIDIA Computex 2025, Yapay Zeka Programlama Araçları, Somutlaştırılmış Yapay Zeka, GitHub Copilot VSCode Eklentisi, Model Bağlam Protokolü (MCP), Doğal Dil Ağı (NLWeb), Meituan NoCode, Tencent QBot Akıllı Asistanı

🔥 Odak Noktası

Microsoft Build 2025, “Akıllı Temsilci Ağı” çağını başlatıyor, AI tabanlı geliştirmeyi tamamen benimsiyor: Microsoft, Build 2025 geliştirici konferansında “Open Agentic Web” vizyonunu duyurdu ve 50’den fazla güncelleme yayınladı. Temel güncellemeler arasında GitHub Copilot’un VSCode eklentisinin açık kaynak yapılması, Model Context Protocol (MCP) ve Natural Language Web (NLWeb) açık standartlarının tanıtılması ve xAI’nin Grok gibi 1900’den fazla modelin Azure AI Foundry’ye dahil edilmesi yer alıyor. Bu girişimler, modelden AI Agent’a kadar geliştirme sürecini birleştirmeyi, AI Agent’ların senaryolar arası otonom çalışmasını ve birlikte çalışabilirliğini sağlamayı amaçlıyor. Microsoft CEO’su Satya Nadella, AI Agent’ların problem çözme yöntemlerini yeniden şekillendireceğini vurguladı ve OpenAI CEO’su Sam Altman, NVIDIA CEO’su Jensen Huang ve xAI kurucusu Elon Musk ile birlikte AI Agent’ların yazılım geliştirme, altyapı ve fiziksel dünya uygulamalarındaki geleceğini tartıştı. (Kaynak: 36Kr | GitHub Blog | VS Code Blog | The Verge)

Google DeepMind, AlphaEvolve’u yayınladı; AI Agent, 56 yıllık matris çarpımı verimlilik rekorunu kırdı: Google DeepMind, Gemini tarafından desteklenen kodlama AI Agent’ı AlphaEvolve’u tanıttı. Evrimsel algoritmalar ve otomatik değerlendirme sistemleri aracılığıyla, 56 yıldır kullanılan Strassen algoritmasından daha verimli bir 4×4 karmaşık matris çarpım algoritması keşfederek, gereken skaler çarpım sayısını 49’dan 48’e düşürdü. Bu atılım sadece matematik teorisi açısından önemli olmakla kalmayıp, Google’ın dahili uygulamalarında da değerini kanıtladı; örneğin, Gemini mimarisindeki büyük matris çarpım işlemlerini %23 hızlandırdı, Gemini eğitim süresini %1 kısalttı ve FlashAttention performansını %32.5 artırdı. AlphaEvolve, AI’ın otomatik bilimsel keşif ve algoritma optimizasyonu alanındaki muazzam potansiyelini gösteriyor ve matematiksel problemlerden veri merkezi kaynak planlamasına ve AI model eğitimi hızlandırmasına kadar çeşitli karmaşık sorunları çözebiliyor. (Kaynak: Google DeepMind Blog | QbitAI)

Araştırma, GPT-4’ün kişiselleştirilmiş tartışmalarda insanlardan %64 daha ikna edici olduğunu gösteriyor: Nature Human Behaviour dergisinde yayınlanan bir araştırma, OpenAI’nin GPT-4 modelinin, tartışma yaptığı kişinin cinsiyeti, yaşı, eğitim geçmişi gibi kişisel bilgilerine erişip argümanlarını buna göre ayarladığında, insanlardan %64 daha ikna edici olduğunu ortaya koydu. Lozan Federal Teknoloji Enstitüsü gibi kurumların işbirliğiyle yürütülen ve 900 katılımcının yer aldığı bu çalışma, Büyük Dil Modelleri’nin (LLM) ikna etme konusundaki güçlü yeteneğini bir kez daha doğruladı. Araştırmacılar, bu durumun, AI araçlarının az miktarda kullanıcı bilgisiyle karmaşık ve ikna edici argümanlar oluşturabildiğini ve kişiselleştirilmiş yanlış bilgi yayılımı için potansiyel bir tehdit oluşturduğunu belirterek, politika yapıcıları ve platformları bu riski ciddiye almaya ve yanlış bilgilere karşı koymak için LLM’leri kullanarak kişiselleştirilmiş karşı anlatılar oluşturmayı keşfetmeye çağırdı. (Kaynak: Nature Human Behaviour | MIT Technology Review)

Microsoft ve Hugging Face işbirliğini derinleştiriyor, Azure AI Foundry 10.000’den fazla açık kaynak modeli entegre ediyor: Microsoft Build konferansında Microsoft, Hugging Face ile işbirliğini genişlettiğini duyurdu. Azure AI Foundry artık metin, ses, görüntü gibi çeşitli modaliteleri ve görevleri kapsayan 10.000’den fazla Hugging Face açık kaynak modelini entegre ediyor. Bu adım, Azure kullanıcılarının AI uygulamaları ve AI Agent’lar oluşturmak için çeşitli açık kaynak modelleri daha kolay ve güvenli bir şekilde dağıtmasını amaçlıyor. Entegre edilen tüm modeller güvenlik testlerinden geçirilmiş, safetensors formatını kullanıyor ve kurumsal düzeydeki uygulamaların güvenliğini sağlamak için uzaktan kod içermiyor. Taraflar gelecekte en yeni ve popüler modelleri sunmaya, daha fazla modaliteyi (video, 3D gibi) desteklemeye ve AI Agent’lar ile araçlar için optimizasyonu güçlendirmeye devam etmeyi planlıyor. (Kaynak: HuggingFace Blog)

Microsoft and Hugging Face expand collaboration

🎯 Eğilimler

NVIDIA, Computex 2025’te birçok yeni AI ürününü piyasaya sürerek AI fabrikası dönüşümünü hızlandırıyor: CEO Jensen Huang, Computex 2025’te GeForce RTX 5060 GPU, Grace Blackwell GB300 süper bilgi işlem platformu, kişisel AI süper bilgisayarı DGX Spark (GB10 ile donatılmış, birkaç hafta içinde piyasada) ve DGX Station’ı (784GB bellek, DeepSeek R1 çalıştırabilir) tanıttı. Huang, NVIDIA’nın GPU tedarikçisinden küresel bir AI altyapı sağlayıcısına dönüştüğünü ve “kullanıma hazır” AI fabrikaları yaratmayı hedeflediğini vurguladı. Aynı zamanda NVIDIA, DeepMind ve Disney ile ortaklaşa geliştirilen fizik motoru Newton’u Temmuz ayında açık kaynak olarak sunacak ve fiziksel AI gelişimini desteklemek için Isaac GR00T insansı robot temel modelini piyasaya sürecek. NVIDIA ayrıca Tayvan’da yeni bir ofis kuracağını duyurdu ve Çinli AI yeteneklerinin önemini vurguladı. (Kaynak: 36Kr | 36Kr)

Microsoft, AB kullanıcılarının iPhone gibi cihazlarda varsayılan sesli asistanı değiştirmesine izin vermeyi planlıyor: Bloomberg’e göre Apple, AB kullanıcılarının iPhone, iPad, Mac gibi cihazlardaki varsayılan sesli asistanı Siri’den Google Assistant veya Amazon Alexa gibi diğer seçeneklere değiştirmesine izin vermeyi planlıyor. Bu hamle, AB’nin Dijital Piyasalar Yasası’nın (DMA) antitröst baskısına bir yanıt olabilir. Siri, son yıllarda işlevsellik eksikliği ve yetersiz zekası nedeniyle eleştiriliyor; Apple içinde Siri’nin gelişim yönü konusunda anlaşmazlıklar var ve mevcut mimarisi Büyük Dil Modelleri (LLM) ile etkili bir şekilde entegre olamıyor. Apple, LLM tabanlı yeni bir Siri üzerinde çalışıyor ve Apple Intelligence’ı tanıtmış olsa da, kullanıcıların varsayılan asistanı değiştirmesine izin vermek ekosistemini etkileyebilir. (Kaynak: 36Kr)

Apple, kendi geliştirdiği AI sohbet robotunu dahili olarak test ediyor, yetenekleri ChatGPT ile karşılaştırılabilir olabilir: Bloomberg muhabiri Mark Gurman, Apple’ın kendi geliştirdiği AI sohbet robotu projesini dahili olarak test ettiğini açıkladı. Yeni AI başkanı John Giannandrea liderliğinde proje son altı ayda önemli ilerleme kaydetti ve bazı yöneticiler mevcut sürümünün yeteneklerinin ChatGPT’nin en son sürümüne yakın olduğuna inanıyor. Robotun anlık web arama ve bilgi entegrasyon yeteneklerine sahip olabileceği belirtiliyor. Bu hamle, OpenAI gibi harici hizmetlere olan bağımlılığı azaltmayı ve Siri’nin rekabet gücünü artırmayı amaçlayabilir. WWDC 2025’te Siri yükseltmelerine odaklanılmasa da, Apple’ın AI’a yaptığı yatırımlar, AI çağında sesli asistanını yeniden canlandırmak için artarak devam ediyor. (Kaynak: 36Kr)

Windows, Model Context Protocol’ü (MCP) yerel olarak destekleyecek: Microsoft, Build 2025 konferansında Windows işletim sisteminin Model Context Protocol’ü (MCP) yerel olarak destekleyeceğini duyurdu. Bu, AI uygulamalarının Windows üzerinde geliştirilmesini ve dağıtılmasını basitleştirmeyi amaçlıyor. MCP, “AI uygulamaları için USB-C” olarak benzetiliyor ve farklı AI modelleri ile uygulamalar için standartlaştırılmış bir etkileşim yöntemi sunmaya çalışıyor. Windows AI Foundry platformu bu desteği entegre ederek geliştiricilerin Windows cihazlarında yerel AI modellerini ve AI Agent’larını daha kolay çalıştırmasını ve yönetmesini sağlayacak. (Kaynak: op7418 | Reddit r/LocalLLaMA)

👀 Microsoft just created an MCP Registry for Windows

Microsoft Azure AI Foundry, xAI’nin Grok büyük modelini bünyesine katıyor: Microsoft, Build 2025 geliştirici konferansında Elon Musk’ın xAI şirketinin Grok 3 ve Grok 3 mini büyük modellerinin Azure AI Foundry platformuna katılacağını duyurdu. Azure kullanıcıları bu modelleri doğrudan bulut platformu üzerinden kullanabilecek ve ücretlendirebilecek. Bu hamle, daha önce OpenAI, Meta ve DeepSeek gibi modelleri içeren Azure’daki mevcut AI modeli sayısını (1900’ü aştı) daha da genişletiyor. Musk, video bağlantısıyla geliştiricilerden geri bildirim beklediğini ve gelecekte Grok hizmetlerini daha fazla şirkete sunmayı umduğunu belirtti. (Kaynak: 36Kr)

Percy Liang’ın ekibi, açık AI model geliştirmeyi teşvik etmek için Marin projesini başlattı: Stanford Üniversitesi profesörü Percy Liang liderliğindeki ekip, açık modelleri “tamamen katılımcı bir şekilde” oluşturmayı amaçlayan Marin projesini başlattı. Proje, açık geliştirme sürecini vurgulayarak herkesin katkıda bulunmasına olanak tanıyor. İlk Marin modelleri yayınlandı ve 8B modeli test için Together AI platformunda kullanıma sunuldu. Bu girişim, AI alanında sadece ağırlıkları, kodu ve verileri değil, tüm Ar-Ge ekosistemini açarak daha derin bir açıklık çağrısına yanıt veriyor. (Kaynak: vipulved)

vipulved

Intel, Arc Pro B60 profesyonel ekran kartını piyasaya sürdü, KTransformers Intel GPU desteğini duyurdu: Intel, 24GB belleğe ve 456GB/s bellek bant genişliğine sahip yeni profesyonel sınıf ekran kartı Arc Pro B60’ı piyasaya sürdü. Tek kart fiyatı yaklaşık 500 dolar olan bu kart, AI hesaplamaları için yeni bir donanım seçeneği sunuyor. Aynı zamanda, KTransformers çerçevesi Intel GPU’ları desteklediğini duyurdu. Testler, Xeon 5 + DDR5 + Arc A770 platformunda DeepSeek-R1 Q4 nicelenmiş modelinin yaklaşık 7.5 token/s hızında çalıştığını göstererek, büyük modellerin yerel olarak çalıştırılması için daha fazla donanım olasılığı sunuyor. (Kaynak: karminski3 | karminski3)

karminski3

DeepMind, Google I/O konferansının ipuçlarını verdi: Google DeepMind resmi hesabı, 20 Mayıs’ta (Pasifik saatiyle sabah 10) düzenlenecek olan Google I/O konferansının ipuçlarını verdi ve X platformunda canlı yayınlanacağını duyurdu. Konferansta, Google’ın AI alanındaki güçlü ivmesini sürdürecek bir dizi AI ile ilgili önemli güncelleme ve ürünün duyurulması bekleniyor. (Kaynak: GoogleDeepMind)

🧰 Araçlar

AgenticSeek: Tamamen yerel çalışan, Manus AI’a rakip AI Agent: AgenticSeek, web’de otonom olarak gezinebilen, kod yazabilen ve görevleri planlayabilen, tamamen yerel olarak çalışan bir AI asistanı sağlamayı amaçlayan açık kaynaklı bir projedir. Tüm veriler kullanıcının cihazında kalarak gizliliği sağlar. Bu araç, yerel çıkarım modelleri için özel olarak tasarlanmıştır, sesli etkileşimi destekler ve AI Agent kullanım maliyetini (sadece elektrik tüketimi) ve veri sızıntısı riskini azaltmayı hedefler. (Kaynak: GitHub Trending)

Fosowl/agenticSeek - GitHub Trending (all/monthly)

Meituan, AI programlama aracı NoCode’u dahili olarak test ediyor, Vibe Coding olarak konumlandırılıyor: 36Kr’nin özel haberine göre, Meituan yakın zamanda “NoCode” adlı bir AI programlama aracını piyasaya sürecek. nocode.cn alan adı kaydedildi ve gri test aşamasına girdi. Ürün, Meituan’ın Ar-Ge Kalite ve Verimlilik ekibi tarafından geliştirildi ve Lovable’ın “atmosfer programlamasına” benzer şekilde, teknik olmayan kişilere yönelik olarak konumlandırılıyor. Diyalog tabanlı etkileşim yoluyla veri analizi, ürün prototipleri, operasyon araçları oluşturma gibi kodlama ve dağıtım görevlerini otomatik olarak tamamlıyor. NoCode, çok adımlı mantıksal çıkarım yapabilen bir Code Agent mimarisi kullanıyor ve küçük ve orta ölçekli işletmelerin BT engellerini azaltmak için tüccarlara ve genel kullanıcılara açılması planlanıyor. (Kaynak: 36Kr)

Meituan yapay zeka programlama yeteneklerini açacak, yeni ürün NoCode'u piyasaya sürecek|36Kr Özel

Tencent QQ Browser, AI tarayıcısına yükseltildi, QBot akıllı asistanı entegre edildi: QQ Browser, AI tarayıcısına yükseltildiğini ve Tencent Hunyuan ile DeepSeek çift modeline dayanan QBot adlı bir AI asistanını tanıttığını duyurdu. QBot, AI arama, AI gezinme, AI ofis, AI öğrenme, AI yazma gibi işlevleri entegre ediyor ve karmaşık görevleri yerine getirebilen Manus benzeri AI Agent yeteneklerini sunuyor. Gri testin ilk grubundaki Agent’lar arasında, kullanıcılar için kişiselleştirilmiş üniversite giriş sınavı başvuru planları oluşturabilen “AI Üniversite Giriş Sınavı Asistanı” bulunuyor. QQ Browser’ın 400 milyondan fazla kullanıcısı var ve bu yükseltme, AI aracılığıyla kullanıcıların bilgi edinme ve görevleri işleme verimliliğini artırmayı amaçlıyor. (Kaynak: 36Kr)

OpenAI Codex, ChatGPT iOS sürümüne geldi, mobil programlama görevlerini destekliyor: OpenAI, programlama asistanı Codex’in artık ChatGPT’nin iOS uygulamasına entegre edildiğini duyurdu. Kullanıcılar doğrudan telefonlarından yeni kodlama görevleri başlatabilir, kod farklarını görüntüleyebilir, değişiklik talep edebilir ve hatta PR gönderebilirler. Bu özellik ayrıca kilit ekranında gerçek zamanlı aktivite takibini destekleyerek kullanıcıların Codex’in çalışma ilerlemesini her an takip etmelerini ve bilgisayara döndüklerinde tamamlanmamış görevlere devam etmelerini kolaylaştırıyor. Bu, AI programlamanın mobil ve çoklu senaryo işbirliğine doğru önemli bir adım attığını gösteriyor. (Kaynak: karinanguyen_ | gdb)

karinanguyen_

NotebookLM mobil uygulaması yayınlandı, Android ve iOS’u destekliyor: Google’ın AI not alma aracı NotebookLM, mobil uygulamasını resmi olarak başlattı ve Android ile iOS platformlarında kademeli olarak kullanıma sunuldu. Mobil sürüm, sesli özetler, diyaloglar gibi temel işlevleri sunarak kullanıcıların her zaman her yerde AI kullanarak içerik analizi yapmasını ve öğrenmesini kolaylaştırıyor. Kullanışlı bir özellik, kullanıcıların (resmi hesaplar hariç) görüntüledikleri içeriği doğrudan NotebookLM’e ileterek işleyebilmeleridir. (Kaynak: op7418)

op7418

Public, AI yatırım aracı “Generated Assets”i piyasaya sürdü: Yatırım platformu Public, kullanıcıların AI’a yatırım fikirleri sunmasına olanak tanıyan yeni ürünü “Generated Assets”i yayınladı. AI, buna göre yatırım önerileri, özelleştirilmiş yatırım endeksleri döndürür ve geçmiş getirileri karşılaştırabilir ve performansı gerçek zamanlı olarak izleyebilir. Bu, kullanıcıların kişiselleştirilmiş yatırım portföyleri oluşturma ve yönetme engelini düşürmeyi amaçlayan bir tür “atmosfer yatırımı” veya “tematik yatırım”ın AI uygulamasıdır. (Kaynak: op7418)

op7418

ClaraVerse: Çeşitli AI araçlarını entegre eden “hepsi bir arada” uygulama: ClaraVerse adlı bir AI araç paketi topluluk tarafından paylaşıldı. Sohbet arayüzü, AI bileşenleri, Ollama (yerel büyük model çalıştırma), n8n (iş akışı/zamanlanmış görevler), AI Agent şablonları, ComfyUI (görüntü oluşturma) ve AI indeksli bir resim kitaplığını entegre ediyor. Kullanıcılara tek duraklı bir AI çalışma platformu sunarak farklı AI araçlarının kullanımını ve geçişini basitleştirmeyi amaçlıyor. (Kaynak: karminski3)

karminski3

Qdrant vektör veritabanı, Microsoft NLWeb protokolünü entegre etti: Vektör veritabanı Qdrant, Microsoft’un Build konferansında duyurduğu NLWeb açık protokolünün ilk ortaklarından biri olduğunu açıkladı. NLWeb, geleneksel arama kutularını doğal dil tabanlı, anlamsal ve niyet algılayan arayüzlere dönüştürmeyi amaçlıyor. Qdrant ile entegrasyon sayesinde web siteleri, hızlı, filtrelenmiş vektör araması için Qdrant’ı kullanarak, ön uç veya arka uç mantığını büyük ölçüde değiştirmeden anlamsal olarak alakalı sonuçlar sunabilir. (Kaynak: qdrant_engine)

qdrant_engine

📚 Öğrenme

DeepMind, Visual Planning’i öneriyor: Saf görüntü dizisi çıkarım paradigması: Yi Xu ve diğer araştırmacılar, modellerin tamamen görüntü dizileri aracılığıyla düşünmesini ve planlamasını sağlamak için “Visual Planning” adlı yeni bir çıkarım paradigması önerdiler. Bu, insanların zihinlerinde adımları tasarlama şeklini taklit eder ve dil veya metin düşüncesi gerektirmez. Bu yöntem, AI’ın dilsel olmayan sembolik sistemler altında karmaşık çıkarımlar yapma olasılığını araştırıyor ve çok modlu AI’ın gelişimi için yeni fikirler sunuyor. (Kaynak: madiator)

madiator

Stanford ve diğer kurumlar Terminal-Bench’i başlattı: AI Agent’ların terminal görev yeteneklerini değerlendirmek için bir kıyaslama ölçütü: Stanford Üniversitesi ve Laude araştırmacıları, AI Agent’ların gerçek dünya terminal ortamlarında karmaşık görevleri tamamlama yeteneklerini değerlendirmek için bir çerçeve ve kıyaslama ölçütü olan Terminal-Bench’i başlattı. Birçok AI Agent’ın (Claude Code, Codex CLI gibi) değerli görevleri terminal etkileşimi yoluyla gerçekleştirdiği göz önüne alındığında, bu kıyaslama ölçütü, pratik dağıtıma yönelik AI Agent yeteneklerinin geliştirilmesini teşvik etmek için gerçek etkinliklerini ölçmeyi amaçlamaktadır. (Kaynak: madiator | andersonbcdefg)

madiator

DeepSeek-V3 Teknik Açıklaması: Verimli Model için Donanım-Yazılım Ortak Tasarımı: DeepSeek-V3 modeli, donanım-yazılım ortak tasarımı sayesinde yalnızca 2048 NVIDIA H800 GPU üzerinde eğitildi. Temel yenilikleri arasında Multi-head Latent Attention (MLA), Mixture of Experts (MoE), FP8 karma hassasiyetli eğitim ve çok düzlemli ağ topolojisi bulunmaktadır. Bu teknolojiler, daha düşük maliyetle daha iyi model performansı elde etmeyi amaçlayarak birlikte çalışır ve AI model tasarımının daha yüksek maliyet etkinliği yönündeki yeni bir eğilimi temsil eder. (Kaynak: TheTuringPost)

TheTuringPost

Yeni makale derin öğrenmede temsili iyimserliği tartışıyor: Kırık Dolaşık Temsil Hipotezi: Kenneth Stanley ve arkadaşları “Derin Öğrenmede Temsili İyimserliği Sorgulamak: Kırık Dolaşık Temsil Hipotezi” başlıklı bir pozisyon belgesi yayınladı. Araştırma, alışılmadık açık uçlu arama yoluyla keşfedilen ve tek bir görüntü çıktısı verebilen ağların temsillerinin zarif ve modüler olduğunu; SGD’nin aynı çıktıyı öğrenen ağların temsillerinin ise kaotik ve dolaşık olduğunu belirtiyor. Bu, iyi çıktı davranışının altında kötü iç temsillerin gizlenebileceğini gösteriyor, ancak aynı zamanda temsillerin daha iyi olabileceği olasılığını da ortaya koyuyor. Bu durum, modellerin genelleme, yaratıcılık ve öğrenme yetenekleri üzerinde derin etkilere sahip olup, temel modellerin ve LLM’lerin iyileştirilmesi için yeni fikirler sunuyor. (Kaynak: hardmaru | togelius | bengoertzel)

hardmaru

RL eğitimi güncellendi, LLM bölümlerine odaklanıldı (DPO, GRPO, düşünce zinciri vb.): Sirbayes, Pekiştirmeli Öğrenme (RL) eğitiminin yeni bir sürümünü yayınladı. Bu güncelleme esas olarak Büyük Dil Modelleri (LLM) bölümüne odaklanıyor ve DPO (Direct Preference Optimization), GRPO (Group Relative Policy Optimization), düşünce zinciri (Thinking) gibi en son içerikleri ekliyor. Aynı zamanda, Çoklu Ajanlı Pekiştirmeli Öğrenme (MARL), Model Tabanlı Pekiştirmeli Öğrenme (MBRL), Çevrimdışı Pekiştirmeli Öğrenme ve DPG (Deep Deterministic Policy Gradient) gibi bölümlerde de küçük güncellemeler yapıldı. (Kaynak: sirbayes)

sirbayes

ByteDance, Önceden Eğitilmiş Model Ortalaması (Pre-trained Model Averaging) stratejisini önerdi: ByteDance araştırma ekibi, büyük dil modellerinin ön eğitimi sırasında model birleştirme için yeni bir çerçeve olan Önceden Eğitilmiş Model Ortalaması (PMA) stratejisini öneren bir makale yayınladı. Araştırma, sabit bir öğrenme oranıyla eğitilmiş kontrol noktalarını birleştirmenin, yalnızca sürekli eğitime eşdeğer veya hatta daha iyi performans sağlamakla kalmayıp, aynı zamanda eğitim verimliliğini de önemli ölçüde artırdığını buldu. Bu çalışma, büyük model ön eğitimi için yeni verimlilik optimizasyon fikirleri sunmakta ve model birleştirmenin performansı ve verimliliği artırmadaki potansiyelini doğrulamaktadır. (Kaynak: teortaxesTex)

teortaxesTex

Tongyi Laboratuvarı’ndan yeni araştırma ZeroSearch: LLM, arama motoru rolünü üstleniyor, API olmadan çıkarım yeteneğini artırıyor: Alibaba Tongyi Laboratuvarı, LLM’nin arama motoru davranışını taklit etmesini sağlayarak, pekiştirmeli öğrenme sürecinde gerçek arama motoru API’lerini çağırmaya gerek kalmadan maliyeti düşüren ve eğitim istikrarını artıran ZeroSearch çerçevesini önerdi. Bu yöntem, hafif ince ayar yoluyla LLM’nin yararlı sonuçlar ve gürültü paraziti üretmesini sağlar ve aşamalı olarak modelin karmaşık arama senaryolarında çıkarım ve parazit önleme yeteneğini artıran bir müfredat tabanlı gürültü önleme eğitimi kullanır. Deneyler, arama modülü olarak yalnızca 3B parametreli bir LLM’nin arama yeteneğini etkili bir şekilde artırabildiğini göstermektedir. (Kaynak: QbitAI)

Tongyi Laboratuvarı'ndan yeni araştırma: Büyük model kendi başına "arama motoru" rolünü üstleniyor, arama API'si olmadan çıkarım yeteneğini artırıyor

Hong Kong Çin Üniversitesi’nden yeni algoritma RXTX, matris çarpımı XXt hesaplamasını optimize ediyor: Hong Kong Çin Üniversitesi araştırmacıları, bir matrisin transpozuyla çarpımını (XXt) hesaplamayı hızlandırmak için yeni bir algoritma olan RXTX’i önerdi. Algoritma, 4×4 blok matrislerin özyinelemeli çarpımına dayanıyor ve makine öğrenimi arama ile kombinatoryal optimizasyon tekniklerini birleştirerek keşfedildi. Strassen özyinelemesine dayalı mevcut algoritmalara kıyasla RXTX, asimptotik çarpım sabitini yaklaşık %5 azaltıyor ve n≥256 olduğunda toplam işlem sayısında avantaj gösteriyor; 6144×6144 matris testinde BLAS varsayılan uygulamasından %9 daha hızlı. Bu araştırma, veri analizi, çip tasarımı, LLM eğitimi gibi alanlarda potansiyel etkilere sahip. (Kaynak: QbitAI)

Matris çarpımı daha hızlı hesaplanabilir! Hong Kong Çin Üniversitesi 10 sayfalık makaleyle kanıtladı: Enerji ve zaman tasarrufu sağlanabilir

Makale AdaptThink: Çıkarım modellerine ne zaman “düşüneceklerini” öğretmek: Bu çalışma, çıkarım modellerine sorun zorluğuna göre derinlemesine düşünme (Chain-of-Thought gibi) yapıp yapmamayı uyarlanabilir bir şekilde seçmeyi pekiştirmeli öğrenme yoluyla öğreten AdaptThink’i önermektedir. Temelinde, kısıtlı bir optimizasyon hedefi (performansı korurken düşünmeyi azaltmayı teşvik eder) ve önem örnekleme stratejisi (düşünme ve düşünmeme örneklerini dengeler) bulunur. Deneyler, AdaptThink’in çıkarım maliyetini önemli ölçüde azaltabildiğini ve performansı artırabildiğini göstermektedir; örneğin, matematik veri kümelerinde DeepSeek-R1-Distill-Qwen-1.5B’nin ortalama yanıt uzunluğunu %53 azaltmış ve doğruluğu %2.4 artırmıştır. (Kaynak: HuggingFace Daily Papers)

Makale VisionReasoner: Pekiştirmeli öğrenme yoluyla görsel algı ve çıkarımı birleştirmek: VisionReasoner, çeşitli görsel algı görevlerini paylaşılan bir modelle işlemeyi amaçlayan birleşik bir çerçevedir. Tespit, segmentasyon, sayma gibi on farklı göreve yanıt vermek için görsel girdiyi analiz etme ve yapılandırılmış çıkarım yapma yeteneğini geliştirmek üzere çoklu nesne bilişsel öğrenme stratejisi ve sistematik görev yeniden yapılandırması kullanır. Deneysel sonuçlar, VisionReasoner’ın COCO (tespit), ReasonSeg (segmentasyon) ve CountBench (sayma) gibi kıyaslama ölçütlerinde Qwen2.5VL gibi modellerden daha iyi performans gösterdiğini ortaya koymaktadır. (Kaynak: HuggingFace Daily Papers)

Makale AdaCoT: Pekiştirmeli öğrenme yoluyla Pareto-optimal uyarlanabilir düşünce zinciri tetikleme: Büyük dil modellerinin (LLM) basit sorguları işlerken düşünce zincirinin (CoT) neden olduğu gereksiz hesaplama yükünü çözmek için AdaCoT çerçevesi önerilmiştir. LLM’nin sorgunun örtük karmaşıklığına göre CoT’yi çağırıp çağırmamaya uyarlanabilir bir şekilde karar vermesini sağlamak için pekiştirmeli öğrenmeyi (PPO) kullanır ve model performansı ile CoT çağırma maliyetini dengelemeyi amaçlar. Seçici kayıp maskeleme (SLM) tekniği ile karar sınırlarının çökmesini önleyerek, deneyler AdaCoT’nin gereksiz CoT tetikleme oranını (%3.18’e kadar) ve yanıt token sayısını (%69.06 azaltarak) önemli ölçüde azaltabildiğini ve aynı zamanda karmaşık görevlerde yüksek performansı koruyabildiğini göstermektedir. (Kaynak: HuggingFace Daily Papers)

Makale GIE-Bench: Metin yönlendirmeli görüntü düzenleme için temellendirilmiş değerlendirme kıyaslama ölçütü: Metin yönlendirmeli görüntü düzenleme modellerini daha hassas bir şekilde değerlendirmek için GIE-Bench önerilmiştir. Bu kıyaslama ölçütü, işlevsel doğruluk (otomatik olarak oluşturulan çoktan seçmeli sorularla düzenlemenin başarılı olup olmadığını doğrular) ve görüntü içeriğinin korunması (nesneye duyarlı maskeleme teknikleri ve hedef olmayan bölgelerin tutarlılığını sağlamak için koruma puanları kullanarak) olmak üzere iki boyutta değerlendirme yapar. 20 kategoriyi kapsayan 1000’den fazla yüksek kaliteli düzenleme örneği içerir. GPT-Image-1 gibi modellerin değerlendirilmesi, talimatları izlemede lider olduklarını ancak ilgisiz bölgeleri korumada iyileştirme yapılması gerektiğini göstermektedir. (Kaynak: HuggingFace Daily Papers)

Makale InstanceGen: Örnek düzeyinde talimatlarla görüntü oluşturma: Önceden eğitilmiş metinden görüntüye modellerin, birden fazla nesne ve örnek düzeyinde özellik içeren karmaşık istemleri işlerken anlamı doğru bir şekilde yakalamada zorlanması sorununa karşı InstanceGen yeni bir teknik önermektedir. Bu teknik, çağdaş görüntü oluşturma modelleri tarafından doğrudan sağlanan görüntü tabanlı ince taneli yapılandırılmış başlatmayı ve LLM tabanlı örnek düzeyinde talimatları birleştirir. Bu sayede oluşturulan görüntüler, nesne sayısı, örnek düzeyinde özellikler ve örnekler arası mekansal ilişkiler dahil olmak üzere metin istemlerindeki tüm bölümleri daha iyi takip edebilir. (Kaynak: HuggingFace Daily Papers)

💼 Ticari

Tsinghua kökenli somutlaşmış zeka şirketi “Qianjue Technology” birkaç yüz milyon yuanlık Pre-A+ tur finansmanını tamamladı: Somutlaşmış beyin şirketi “Qianjue Technology” yakın zamanda Junshan Investment, Xiangfeng Investment ve Shixi Capital’den yeni bir Pre-A+ tur finansmanı aldı ve toplam finansman tutarı birkaç yüz milyon yuana ulaştı. Şirket, Tsinghua Üniversitesi Otomasyon Bölümü ve ilgili AI araştırma kurumlarının çekirdek üyeleri tarafından kuluçkalandı ve çok modlu gerçek zamanlı algılama, sürekli görev planlama ve otonom yürütme yeteneklerini vurgulayan genel amaçlı “somutlaşmış beyin” sistemleri geliştirmeye odaklanıyor. Ev hizmetleri, lojistik dağıtım gibi senaryolarda ürün düzeyinde uygulamalar gerçekleştirdi ve birçok önde gelen robot üreticisi ve tüketici elektroniği şirketiyle işbirliği yaptı. (Kaynak: 36Kr)

Tsinghua kökenli somutlaşmış beyin ekibi toplamda yüz milyonlarca finansman sağladı, ABD'nin önde gelen şirketleriyle rekabet ediyor, sektörün önde gelen üreticilerinde uygulamaya geçti|Hardcore氪 İlk Haber

AI Agent, SaaS pazar yapısını yeniden şekillendirebilir: Microsoft CEO’su Satya Nadella’nın SaaS uygulamalarının AI Agent çağında yıkıma uğrayacağı öngörüsü, sektörde AI Agent ve SaaS’ın geleceği hakkında geniş çaplı tartışmalara yol açtı. AI Agent, otonom algılama, karar verme ve eylem yetenekleriyle, geleneksel SaaS’ın kişiselleştirme, veri birlikte çalışabilirliği ve kullanıcı deneyimi alanlarındaki sorunlarını çözme potansiyeline sahip; örneğin, doğal dil etkileşimi yoluyla otomatik olarak iş akışları oluşturma, uygulamalar arası verileri entegre etme, proaktif olarak iş önerileri sunma gibi. Şu anda AI Agent, kurumsal düzeydeki uygulamalarda LLM yetenek sınırlamaları, maliyet, veri güvenliği gibi zorluklarla karşı karşıya olsa da, Salesforce, Microsoft, Yonyou gibi üreticiler AI Agent’ı SaaS ürünlerine entegre etmeye ve SaaS’ı birleştiren veya yıkan yeni modeller keşfetmeye başladı. (Kaynak: 36Kr)

AI Agent, SaaS'ın sonu mu olacak?

AI, ücret yönetimini yeniden şekillendiriyor: Veri analizinden akıllı karar verme ve iletişime: Yapay zeka, ücret yönetimini derinden dönüştürüyor. Korn Ferry raporuna göre, AI’ın ücret iletişimi, harici kıyaslama ve pozisyon beceri yapısı alanlarındaki uygulamaları giderek artıyor. Gelecekte AI’ın, daha büyük ölçekli ve daha çeşitli verileri (sosyal medya platformları, üçüncü taraf araştırmaları dahil) işleyerek veri odaklılıktan akıllı karar vermeye dönüşmesi bekleniyor; örneğin, çalışan yıpranma riskini tahmin etme, teşviklerin etkinliğini değerlendirme, ücret aralıklarını dinamik olarak ayarlama, kişiselleştirilmiş teşvikler gerçekleştirme gibi. Aynı zamanda AI, veri gizliliği, algoritma “kara kutusu”, sonuçların güvenilirliği gibi zorluklarla da karşı karşıya. Etkili ücret iletişimi, dijital zeka çağında daha da önemli hale geliyor ve AI araçları, yöneticilere sistematik, kişiselleştirilmiş iletişimde yardımcı olarak çalışanların adalet duygusunu ve memnuniyetini artırabilir. (Kaynak: 36Kr)

🌟 Topluluk

Sundar Pichai, Google I/O’yu ima eden “derin düşünme” fotoğrafı yayınladı: Google CEO’su Sundar Pichai, sosyal medyada “derin düşünürken” çekilmiş bir fotoğrafını yayınlayarak, yakında düzenlenecek Google I/O konferansına yönelik toplulukta geniş bir beklenti yarattı. Bu fotoğraf, AI alanındaki birçok KOL tarafından paylaşıldı ve yorumlandı; genel olarak Google’ın AI alanında, özellikle Gemini modeli ve uygulamaları konusunda önemli duyurular yapacağı şeklinde yorumlandı. Topluluk üyeleri olası yeni özellikler, yeni modeller veya yeni stratejiler hakkında tahminlerde bulundu. (Kaynak: demishassabis | YiTayML | zacharynado | lmthang | scaling01 | brickroad7 | jack_w_rae | TheTuringPost | shaneguML | op7418)

demishassabis

AI Agent programlama yeteneği hararetli tartışmalara yol açtı, Sama tamamlanmamış projeleri otomatik olarak bitirme potansiyelini görüyor: OpenAI CEO’su Sam Altman, AI programlama aracılarının (Codex gibi) %80’i tamamlanmış ancak bitirilmemiş projeleri tamamlayabilmesi ve otomatik olarak bakımını yapabilmesi konusunda umutlu olduğunu belirtti. Topluluk, farklı AI programlama aracılarının (Codex, Jules, Claude Code gibi) yeteneklerini karşılaştırdı ve tartıştı; görev planlama yeteneği, sanal makine ortamı (ağa bağlı olup olmadığı gibi) ve karmaşık uzun vadeli görevlerdeki performans gibi konulara odaklanıldı. Genel olarak AI Agent’ların yazılım geliştirme alanındaki potansiyelinin büyük olduğu, ancak farklı modellerin somut uygulama ve etkilerinde hala farklılıklar olduğu düşünülüyor. (Kaynak: sama | mathemagic1an)

Üniversitelerin AI tarafından üretilen içerik tespitini kullanması tartışmalara yol açtı, “Tengwang Ge Xu” %100 AI oranıyla değerlendirildi: Çin’deki birçok üniversite, “AI tarafından üretilen içerik tespit oranını” tez değerlendirmesine dahil etti. Bu durum, öğrencilerin tespitten kaçınmak için çeşitli yöntemler kullanmasına ve öğretmenlerin AI kararları ile insan değerlendirmesi arasında gidip gelmesine neden oldu. AI tespit araçları, veritabanı karşılaştırmalarına ve kalıplaşmış önyargılara dayandığı için, klasik eserleri (örneğin, “Tengwang Ge Xu”nun AI oranı %100, Zhu Ziqing’in “Lotus Pond by Moonlight”ı %62.88) ve standart akademik yazıları yanlışlıkla AI tarafından üretilmiş olarak değerlendiriyor. Bu durum, “AI oranını düşürme” amaçlı bir gri pazarın doğmasına yol açarak, AI tespit teknolojisinin sınırlılıkları, akademik değerlendirme standartları ve eğitimin özü hakkında derinlemesine düşüncelere neden oldu. (Kaynak: 36Kr)

"Tengwang Ge Xu"nun AI üretim oranı %100'e ulaştı, üniversitelerin AI tespiti öğretmenleri ve öğrencileri çıldırtıyor

AI çağında yetişen yeni neslin düşünme biçimi tartışılıyor: Reddit topluluğu, AI ortamında yetişen yeni nesil çocukların düşünme biçimlerinin önceki nesillerden önemli ölçüde farklı olacağını hararetle tartışıyor. AI asistanlarıyla etkileşime alışacaklar, öğrenme odakları gerçekleri ezberlemekten soru sormaya ve sistemlerde gezinmeye, deneme yanılma yoluyla öğrenmekten hızlı yinelemeye kayabilir. Makine mantığıyla bu erken kaynaşma, meraklarını, hafızalarını, sezgilerini ve hatta zekanın tanımını derinden yeniden şekillendirebilir; gelecekteki inanç oluşumları, sistem kurma yetenekleri ve kendi düşüncelerine olan güvenleri hakkında düşüncelere yol açabilir. (Kaynak: Reddit r/ArtificialInteligence)

AI’ın yazılım mühendisliği alanındaki hızlı gelişimi, geliştiriciler arasında iş kaygısı yaratıyor: 42 yaşında, eskiden yıllık 150.000 dolar kazanan bir yazılım mühendisi, AI ile ilgili trendler nedeniyle işsiz kaldıktan sonra 800’den fazla iş başvurusunda bulundu ancak çok az mülakat fırsatı yakaladı ve şu anda yemek dağıtarak geçimini sağlıyor. Deneyimi, AI’ın (GitHub Copilot, Claude, ChatGPT gibi) programcıları büyük ölçekte değiştirmeye başlayıp başlamadığına dair tartışmalara yol açtı. Anthropic CEO’su, AI’ın kodun büyük çoğunluğunu üretebileceğini öngörmüştü. Çalışma İstatistikleri Bürosu verileri hala yazılım mühendisliğinin en hızlı büyüyen mesleklerden biri olduğunu gösterse de, teknoloji sektöründeki işten çıkarma dalgası devam ediyor ve şirketler maliyetleri düşürmek ve verimliliği artırmak için AI’ı kullanıyor. Bu durum, toplumun AI’ın getirdiği yapısal işsizlikle ve “insan + AI” işbirliğinin yeni paradigmalarının oluşturulmasıyla nasıl başa çıkması gerektiği konusunda insanları düşünmeye sevk ediyor. (Kaynak: 36Kr)

42 yaşındaki programcı AI tarafından işinden oldu, eskiden yıllık 150.000 dolar kazanıyordu, şimdi 800 özgeçmişi boşa gitti, sadece yemek dağıtarak geçinebiliyor...

AI algoritmalarındaki cinsiyet önyargısı sorunu: “Kadın verilerinin” görünmezliği ve eksikliği: Yapay zeka gelişiminde, algoritmaların cinsiyet önyargısı sorunu giderek daha belirgin hale geliyor. Tarihsel ve sosyal nedenlerden dolayı, veri toplama süreçlerinde kadın verilerinin temsili yetersiz kalıyor (örneğin, klinik deneyler, Wikipedia maddeleri). Bu durum, AI’ın tıbbi teşhis, içerik önerileri gibi alanlarda kadınlara yönelik önyargılar üretmesine neden olabiliyor. Örneğin, görüntü tanıma sistemleri mutfaktaki bir erkeği yanlışlıkla kadın olarak tanımlayabilir, arama motoru görsel sonuçları cinsiyetçi kalıpları pekiştirebilir. AI sektöründeki cinsiyet dengesizliği de nedenlerden biri olarak gösteriliyor. Bu sorunu çözmek için geliştiricilerin farkındalığını artırmak, kadınlara adil mesleki fırsatlar sağlamak, yasal düzenlemeleri iyileştirmek, AI sistemleri için cinsiyet denetim mekanizmaları kurmak ve algoritmaları optimize etmek (veri yeniden örnekleme, nedensel çıkarım uygulamaları gibi) gibi çok yönlü adımlar atılması gerekiyor. (Kaynak: 36Kr)

Yapay zekanın "ayrımcılığı": "Kadın verileri" algoritma çalışmasında görünmez

AI Agent, SaaS sektöründe değişim tartışmalarını tetikliyor: Microsoft CEO’su Satya Nadella, SaaS’ın AI Agent çağında bir dönüşümle karşı karşıya kalacağını öngördü. AI Agent’lar, otonom algılama, karar verme ve eylem yetenekleriyle SaaS’ın kişiselleştirme, veri birlikte çalışabilirliği ve kullanıcı deneyimi konularındaki zorluklarını çözme potansiyeline sahip. Örneğin, AI Agent’lar doğal dil etkileşimi yoluyla otomatik olarak iş akışları oluşturabilir, uygulamalar arası verileri entegre edebilir ve proaktif olarak iş önerileri sunabilir. Şu anda Salesforce, Microsoft ve Yonyou gibi SaaS sağlayıcıları, SaaS’ı birleştiren veya dönüştüren yeni modeller keşfetmek için AI Agent’ları entegre etmeye başladı. AI Agent’ların kurumsal uygulamalarda hala LLM yetenekleri, maliyet ve veri güvenliği gibi zorluklarla karşı karşıya olmasına rağmen, dönüştürücü potansiyeli sektörde geniş çapta ilgi görüyor. (Kaynak: finbarrtimbers)

💡 Diğer

AI ile Çin opera tarzı tarot kartları oluşturuldu: Kullanıcı @op7418, AI aracı Lovart’ı kullanarak Çin opera tarzında bir tarot kartı destesi oluşturdu. Tasarım konsepti, geleneksel opera içeriğini ilgili tarot kartının ifade ettiği anlamla birleştirmek olup, AI’ın yaratıcı tasarım ve kültürel kaynaşma alanlarındaki uygulama potansiyelini göstermektedir. (Kaynak: op7418)

op7418

AI çağında organizasyon yapısının yeniden şekillenmesi: Stratejik Yürütme Ekiplerinin (SET) yükselişi: Makale, AI’ın hızla geliştiği bir çağda geleneksel organizasyon yapılarının AI’ın getirdiği karmaşıklığa uyum sağlamakta zorlandığını tartışıyor. AI’ı ekibin bir parçası haline getirmeyi, makul insan-makine işbirliği mekanizmalarıyla çevik yürütme ve akıllı genişleme sağlamayı amaçlayan “Stratejik Yürütme Ekibi” (SET) merkezli üç katmanlı bir organizasyon modeli öneriyor. SET, stratejiyi departmanlar arası eylemlere dönüştürmekten, organizasyonel entropiyi izlemekten, stratejileri esnek bir şekilde ayarlamaktan ve insanları, süreçleri ve AI Agent’larını koordine etmekten sorumludur; böylece AI potansiyelini açığa çıkarır ve stratejik uygulamayı yönlendirir. (Kaynak: 36Kr)

Yapay zeka çağında gelişen organizasyon yapılarını tasarlamak

Kitle kaynaklı doğruluk kontrolü sosyal medyadaki yanlış bilgileri engelleyebilir mi?: Mohamed bin Zayed Yapay Zeka Üniversitesi profesörü Preslav Nakov, Meta’nın üçüncü taraf doğruluk kontrolörlerini Community Notes ile değiştirmesinin etkilerini tartışıyor. Community Notes’un (X’in Birdwatch’ından türetilmiştir) bu tür kitle kaynaklı modellerin potansiyele sahip olduğunu, ancak içerik denetiminin otomatik filtreleme, kitle kaynak kullanımı ve profesyonel doğruluk kontrolü dahil olmak üzere çeşitli yöntemlerin bir kombinasyonunu gerektirdiğini savunuyor. Spam filtreleme ve LLM’lerin zararlı içerikle başa çıkmasına benzeterek, her yöntemin kendi avantajları ve dezavantajları olduğunu ve birlikte çalışması gerektiğini belirtiyor. Araştırmalar, Community Notes’un profesyonel doğruluk kontrolörlerinin çalışmalarının etkisini artırabildiğini, ikisinin odak noktalarının farklı olmasına rağmen sonuçlarının benzer olduğunu ve birbirini tamamlayabileceğini gösteriyor. (Kaynak: MIT Technology Review)

Can crowdsourced fact-checking curb misinformation on social media?

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir