AI Daily – 2025-04-14(Evening)

Anahtar Kelimeler:AI, Yapay zeka, AI egemenlik ikilemi, HBM ve ileri paketleme, AI destekli bilimsel keşif, Gemini 2.5 Pro programlama yeteneği, AI ile matematik problemlerini çözme

🔥 Odak Noktası

Yapay Zeka Egemenliği İkilemi: Ulusal Güvenlik Söylemi Kamusal Değeri Nasıl Yutuyor?: Rapor, bir ülkenin AI teknoloji yığını (veri, hesaplama gücü, yetenek, enerji) üzerindeki kontrolünü ifade eden ‘yapay zeka egemenliği’ kavramını derinlemesine inceliyor. Mevcut küresel eğilim, müttefiklere dayalı ‘zayıf egemenlikten’, özellikle ABD politikalarının yönlendirmesiyle tamamen yerelleşmeyi hedefleyen ‘güçlü egemenliğe’ doğru kayıyor. Bu dönüşüm, ulusal güvenliği ve askeri üstünlüğü sağlamayı amaçlasa da, aşırı merkezileşme, açık inovasyonun boğulması, uluslararası işbirliğinin engellenmesi ve potansiyel bir AI silahlanma yarışını tetikleme endişelerini de beraberinde getiriyor. Makale, AI’ı aşırı güvenlikleştirmenin, kamu yararına hizmet etme ve küresel zorlukları çözme konusundaki muazzam potansiyelini feda edebileceğini savunuyor ve AI’ın jeopolitik rekabetin kurbanı değil, insanlığın kolektif ilerlemesinin bir aracı olması için egemenlik ihtiyaçları ile açık işbirliği arasında bir denge kurulması çağrısında bulunuyor. (Kaynak: Yapay Zeka Egemenliği İkilemi: Ulusal Güvenlik Söylemi AI’ın Kamusal Değerini Nasıl Yutuyor?)

HBM ve Gelişmiş Paketleme: AI Hesaplama Devriminin Görünmez Yarış Alanı: AI büyük modellerinin üssel hesaplama gücü talebi, geleneksel bilgi işlem mimarilerini ‘bellek duvarı’ darboğazıyla karşı karşıya bırakıyor. Yüksek Bant Genişlikli Bellek (HBM), 3D yığınlama ve TSV teknolojisi aracılığıyla bant genişliğini kat kat artırarak (örneğin HBM3E 1TB/s’nin üzerinde) veri aktarım gecikmesini önemli ölçüde azaltıyor. Aynı zamanda, gelişmiş paketleme teknolojileri (TSMC CoWoS, Intel EMIB gibi) heterojen entegrasyon yoluyla CPU, GPU, HBM gibi çipleri sıkıca bir araya getirerek tek çip sınırlamalarını aşıyor, hesaplama yoğunluğunu ve enerji verimliliğini artırıyor. HBM ve gelişmiş paketleme, AI çipleri (özellikle eğitim tarafında) için kritik bir standart haline geldi ve pazarı SK Hynix, Samsung, Micron (HBM) ve TSMC (paketleme) gibi devler domine ediyor; yatırım muazzam ve kapasite kısıtlı. Bu iki teknolojinin sinerjik gelişimi, yalnızca yarı iletken tedarik zinciri yapısını yeniden şekillendirmekle (paketleme değer payının artması) kalmıyor, aynı zamanda AI hesaplama rekabetini belirleyen kilit bir savaş alanı haline geliyor. (Kaynak: HBM ve Gelişmiş Paketleme: AI Hesaplama Devriminin Görünmez Yarış Alanı)

Nobel Ödüllü İsimden Sarsıcı Açıklama: AI, 1 Milyar Yıllık ‘Doktora Araştırma Süresini’ Bir Yılda Tamamladı: Nobel Ödülü sahibi, Google DeepMind CEO’su Demis Hassabis, ekibinin AI projesi AlphaFold-2’nin, Dünya’da bilinen 200 milyon protein yapısını tahmin ederek, bir yıl içinde geçmişte 1 milyar yıllık doktora araştırma süresine eşdeğer bilimsel keşfi tamamladığını belirtti. AI’ın, özellikle de AlphaFold’un, bilimsel keşiflerin hızını ve ölçeğini kökten değiştirdiğini ve bilgiye erişimi demokratikleştirdiğini vurguladı. Hassabis, Cambridge Üniversitesi’ndeki konuşmasında AI destekli ‘dijital biyoloji’ çağının gelişini daha da detaylandırdı ve AI’ın geleceğinin yalnızca dil işlemeye dayanmak yerine fiziksel dünyayı anlayabilen, akıl yürütme ve planlama yapabilen ‘dünya modelleri’ (JEPA mimarisi gibi) oluşturmakta yattığını savundu. Açık kaynaklı AI’a olan bağlılığını yineleyerek bunun teknolojik ilerlemeyi teşvik etmenin en iyi yolu olduğunu belirtti. (Kaynak: Nobel Ödüllü İsimden Sarsıcı Açıklama: AI, 1 Milyar Yıllık ‘Doktora Araştırma Süresini’ Bir Yılda Tamamladı)

Nobel Ödüllü İsimden Sarsıcı Açıklama: AI, 1 Milyar Yıllık 'Doktora Araştırma Süresini' Bir Yılda Tamamladı

Gemini 2.5 Pro Programlama Yeteneğinde Zirvede, Fiyat/Performans Avantajı Dikkat Çekici: Aider çok dilli programlama kıyaslama testine göre, Google’ın en son yayınladığı Gemini 2.5 Pro modeli, programlama yeteneği açısından Claude 3.7 Sonnet’i geride bırakarak dünya genelinde birinci sırada yer aldı. Sadece performansı lider olmakla kalmıyor, aynı zamanda API çağrı maliyeti de son derece düşük (yaklaşık 6 dolar), bu da benzer veya daha düşük performanslı rakiplerinden (GPT-4o, Claude 3.7 Sonnet gibi) çok daha uygun. Jeff Dean, fiyat/performans avantajını vurguladı. Ayrıca, toplulukta dolaşan yayınlanmamış Google modeli ‘Dragontail’in Web geliştirme testlerinde Gemini 2.5 Pro’dan bile daha iyi performans gösterdiği söyleniyor, bu da Google’ın AI programlama alanında hala kozları olduğunu gösteriyor. Gemini 2.5 Pro, birçok kapsamlı kıyaslama testinde de üst sıralarda yer alıyor ve yüksek performansı, düşük maliyeti, geniş bağlam penceresi ve ücretsiz kullanım hakkı ile OpenAI ve Anthropic’e kapsamlı bir şekilde meydan okuyor. (Kaynak: Gemini 2.5 Programlamada Küresel Zirvede, Google AI Tahtına Geri Döndü, Gizemli Model Ortaya Çıktı, Altman Meydan Okuyor)

Gemini 2.5 Programlamada Küresel Zirvede, Google AI Tahtına Geri Döndü, Gizemli Model Ortaya Çıktı, Altman Meydan Okuyor

AI, 50 Yıldır Çözülemeyen Matematik Probleminin Kanıtlanmasına Başarıyla Yardımcı Oldu: Çinli akademisyen Weiguo Yin (Brookhaven Ulusal Laboratuvarı), OpenAI’nin o3-mini-high modelini kullanarak, tek boyutlu J_1-J_2 q-durum Potts modelinin kesin çözüm araştırmasında bir atılım gerçekleştirdi ve bu alandaki 50 yıllık bir problemi çözdü. AI modeli, q=3 özel durumunu ele alırken simetri analizi yoluyla karmaşık 9×9 transfer matrisini etkili bir 2×2 matrise başarıyla indirgedi. Bu kritik adım, araştırmacılara yöntemi genelleştirme konusunda ilham verdi ve sonunda herhangi bir q değeri için geçerli analitik çözümü bulmalarını sağladı. Bu başarı, yalnızca AI’ın karmaşık matematiksel çıkarımlar ve önemsiz olmayan kanıtlar konusundaki potansiyelini göstermekle kalmıyor, aynı zamanda yoğun madde fiziğindeki faz geçişleri gibi sorunları anlamak için yeni teorik araçlar sunuyor. (Kaynak: Az Önce, AI 50 Yıllık Çözülmemiş Matematik Problemini Çözdü, Nanjing Üniversitesi Mezunu OpenAI Modelini Kullanarak İlk Önemsiz Olmayan Matematiksel Kanıtı Tamamladı)

Az Önce, AI 50 Yıllık Çözülmemiş Matematik Problemini Çözdü, Nanjing Üniversitesi Mezunu OpenAI Modelini Kullanarak İlk Önemsiz Olmayan Matematiksel Kanıtı Tamamladı

🎯 Gelişmeler

Oyun NPC Alanında AI Uygulamaları ve Evrimi: Makale, oyun NPC’lerindeki AI teknolojisinin gelişim sürecini, erken dönem Pac-Man’in sınırlı durum makinelerinden davranış ağaçlarına ve ardından Monte Carlo ağaç araması ile derin sinir ağlarını birleştiren karmaşık AI’lara (AlphaGo gibi) kadar inceliyor. Makale, AI’ın StarCraft 2, Dota 2 gibi oyunlarda en iyi insan oyuncuları yenebilmesine rağmen, sıradan oyuncular için aşırı güçlü bir AI deneyiminin iyi olmadığını belirtiyor. İdeal oyun AI’ı, insan davranışını simüle etmeye daha fazla odaklanmalı, duygusal değer ve uyarlanabilir zorluk sunmalıdır (Middle-earth’ün Nemesis sistemi, Resident Evil 4’ün dinamik zorluğu gibi). Son zamanlarda, miHoYo’nun “Whispers from the Star” oyunundaki Stella örneğinde olduğu gibi, üretken AI, NPC’lerin gerçek zamanlı diyaloglarını, duygusal tepkilerini ve hikaye gelişimini yönlendirmek için kullanılıyor; gecikme, hafıza gibi zorluklarla karşılaşılsa da, AI NPC’lerin daha insancıl, daha derin etkileşimli bir yöne doğru ilerlediğini gösteriyor. (Kaynak: AI, Oyunları Yeniden Harika Yapıyor)

AI, Oyunları Yeniden Harika Yapıyor

OpenAI, API Erişim İzinlerini Sıkılaştırıyor, Kuruluş Doğrulamasını Uyguluyor: OpenAI son zamanlarda yeni bir API kuruluş doğrulama politikası uyguladı; kullanıcıların en gelişmiş modellere ve özelliklere erişmek için desteklenen bir ülke veya bölge tarafından verilmiş geçerli bir resmi kimlik belgesi sunmalarını gerektiriyor. Her kimlik (ID) 90 günde yalnızca bir kuruluşu doğrulayabilir. OpenAI, bu adımın AI’ın güvensiz kullanımını azaltmayı amaçladığını ve yakında piyasaya sürülecek ‘heyecan verici yeni modeller’ (muhtemelen GPT-4.1, o3, o4-mini gibi birden fazla sürümü içerebilir) için hazırlık olduğunu belirtti. Bu politika değişikliği, toplulukta geniş çaplı ilgi ve endişeye yol açtı; özellikle desteklenmeyen ülkelerde/bölgelerde bulunan geliştiriciler ve üçüncü taraf API hizmetlerine bağımlı kullanıcılar için erişim kısıtlamaları veya maliyet artışları söz konusu olabilir ve OpenAI’nin açıklığı hakkında tartışmalara neden oldu. (Kaynak: GitHub Çin IP Erişimi Çöktü ve Geri Geldi, OpenAI API Yeni Politikası GPT-5’i Kilitleyebilir mi?, op7418, Reddit r/artificial)

OpenAI, API Erişim İzinlerini Sıkılaştırıyor, Kuruluş Doğrulamasını Uyguluyor

Apple’ın Girişi ‘AI Doktor’ Gelişimini Hızlandırıyor, Zorluklar ve Düzenlemeler Bir Arada: Apple şirketinin, sağlık App işlevlerini geliştirmek için AI kullanacağı ve ‘AI Sağlık Koçu’ gibi hizmetler sunarak ‘AI doktor’ kavramının küresel bir sıcak nokta haline gelmesini daha da hızlandıracağı söyleniyor. Ancak, gerçek klinik AI uygulamaları birçok zorlukla karşı karşıyadır: yüksek geliştirme maliyetleri, büyük miktarda hassas tıbbi veriye bağımlılık (gizlilik düzenlemelerini içerir), veri etiketleme zorlukları vb. Şu anda AI çoğunlukla yardımcı teşhis aracı olarak kullanılmaktadır. Çin pazarı ayrıca dengesiz tıbbi kaynak dağılımı ve AI destekli kademeli teşhis ve tedaviye yönelik özel ihtiyaçlarla karşı karşıyadır. Baichuan Intelligence gibi şirketler, bu sorunları çözmek için ‘çift doktor modeli’ (AI doktor + AI destekli insan doktor) önermektedir. Makale, AI tıbbının yaygın uygulamasının, teşhis doğruluğunu, veri güvenliğini ve kullanıcı güvenini sağlamak ve potansiyel risklerden kaçınmak için katı düzenlemeler ve sertifikasyon sistemleri üzerine kurulması gerektiğini vurgulamaktadır. (Kaynak: Apple’ın Girişiyle ‘AI Doktor’ Küresel Sıcak Nokta Haline Geldi, Hasta Gizliliğinin Korunması En Büyük Engel mi?)

Apple'ın Girişiyle 'AI Doktor' Küresel Sıcak Nokta Haline Geldi, Hasta Gizliliğinin Korunması En Büyük Engel mi?

Microsoft’un Doğrudan AI ile Oyun Üretme Denemesi Başarısız Oldu: Microsoft kısa süre önce, AI’ın hızlı oyun prototipleri oluşturma yeteneğini sergilemek amacıyla ‘Muse’ AI modelini kullanarak doğrudan Quake 2 oyun görüntüleri üreten bir DEMO gösterdi. Ancak, DEMO’nun performansı kötüydü; düşük çözünürlük, düşük kare hızı, çok sayıda BUG (düşman davranış anormallikleri, fizik kurallarının ihlali, ortam hataları gibi) içeriyordu ve ‘sürekli çöken bir rüya’ olarak değerlendirildi. Makale, bunun mevcut üretken AI teknolojisinin (özellikle ‘halüsinasyon’ sorunuyla birlikte) karmaşık, oynanabilir, etkileşimli oyun deneyimlerini doğrudan ve güvenilir bir şekilde üretmek için henüz yeterli olmadığını gösterdiğini savunuyor. Buna karşılık, AI’ı oyun geliştirme hattının belirli aşamalarına (NPC etkileşimi, varlık oluşturma gibi) uygulamak daha gerçekçi. Doğrudan oyun görselleri veya oynanış mekanikleri üretme yolu şu anda oldukça zorlu görünüyor. (Kaynak: Microsoft’un AI Oyunu Başarısız Oldu, Doğrudan Oyun Üretmek Çıkmaz Sokak Olabilir)

Microsoft'un AI Oyunu Başarısız Oldu, Doğrudan Oyun Üretmek Çıkmaz Sokak Olabilir

Google, Sağlık Alanı İçin Açık Kaynaklı TxGemma Modelini Yayınladı: Google, Gemma ve Gemini model ailelerine dayanan ve özellikle tıp, sağlık ve ilaç geliştirme alanları için optimize edilmiş açık kaynaklı modeller olan TxGemma serisini tanıttı. Bu hamle, biyomedikal araştırma ve tedavi geliştirme için daha uzmanlaşmış AI araçları sağlamayı ve bu alandaki yeniliği teşvik etmeyi amaçlıyor. TxGemma’nın yayınlanması, Google’ın genel ve alana özgü açık kaynaklı modeller sunma stratejisinin bir parçasıdır. (Kaynak: JeffDean)

DeepSeek, Dahili Çıkarım Motorunu Açık Kaynak Yapmayı Planladığını Duyurdu: DeepSeek AI, dahili olarak kullandığı çıkarım motorunu açık kaynak yapacağını belirtti. Açıklamalara göre, bu motor popüler vLLM çerçevesi temel alınarak değiştirilmiş ve optimize edilmiş bir versiyon. DeepSeek’in bu adımı, optimize edilmiş çıkarım teknolojisini açık kaynak topluluğuna geri kazandırmayı ve geliştiricilerin büyük modelleri daha verimli bir şekilde dağıtmasına yardımcı olmayı amaçlıyor. Bu plan, DeepSeek’in açık kaynak topluluğuna katkıda bulunma isteğini yansıtıyor ve kodun GitHub’da yayınlanması bekleniyor. (Kaynak: karminski3)

DeepSeek, Dahili Çıkarım Motorunu Açık Kaynak Yapmayı Planladığını Duyurdu

ChatGPT, Tutarlılığı Artırmak İçin Hafıza Özelliği Ekledi: OpenAI, ChatGPT modeline hafıza (Memory) özelliği ekledi. Bu özellik, ChatGPT’nin birden fazla konuşma boyunca kullanıcının daha önce sağladığı bilgileri, tercihleri veya tartışılan konuları hatırlamasını sağlıyor. Amaç, etkileşimin sürekliliğini ve kişiselleştirilmesini artırmak, kullanıcıların sonraki konuşmalarda aynı arka plan bilgilerini tekrarlamasını önlemek ve böylece kullanıcı deneyimini iyileştirmektir. (Kaynak: Ronald_vanLoon)

ChatGPT, Tutarlılığı Artırmak İçin Hafıza Özelliği Ekledi

Skywork, Açık Kaynaklı Çıkarım Modeli OR1 Serisini Yayınladı: Çinli şirket Skywork (Tiangong-Kunlun Wanwei), yeni açık kaynaklı çıkarım modeli serisi Skywork OR1’i yayınladı. Seri, matematik için optimize edilmiş OR1-Math-7B’yi ve matematik ile kodlamada üstün performans gösteren önizleme sürümleri OR1-7B ve OR1-32B’yi içeriyor; 32B sürümünün matematik yeteneği açısından DeepSeek-R1 ile karşılaştırılabileceği iddia ediliyor. Skywork, açıklık derecesi nedeniyle övgü aldı; model ağırlıklarını, eğitim verilerini ve eksiksiz eğitim kodunu yayınladı. (Kaynak: natolambert)

Skywork, Açık Kaynaklı Çıkarım Modeli OR1 Serisini Yayınladı

AI Destekli Robot Navigasyonu ve Hassas Operasyon Yetenekleri Gelişiyor: Sosyal medya, AI destekli otonom robotların karmaşık ortamlarda hassas bir şekilde gezinme ve görevleri yerine getirme yeteneğini sergiliyor. Bu robotlar muhtemelen bilgisayarlı görü, SLAM (Eş Zamanlı Konum Belirleme ve Haritalama), pekiştirmeli öğrenme gibi AI teknolojilerini kullanarak yapılandırılmamış veya dinamik ortamlarda verimli bir şekilde çalışıyor ve robotik algılama, planlama ve kontrol alanlarındaki ilerlemeleri gösteriyor. (Kaynak: Ronald_vanLoon)

AI Destekli Dış İskelet, Tekerlekli Sandalye Kullanıcılarının Yürümesine Yardımcı Oluyor: AI teknolojisini kullanan, tekerlekli sandalye kullanıcılarının yeniden ayağa kalkmasına ve yürümesine yardımcı olabilen gelişmiş bir dış iskelet cihazı sergilendi. AI, burada kullanıcı niyetini yorumlamak, dengeyi korumak, hareketi koordine etmek ve farklı ortamlara uyum sağlamak için kullanılabilir; bu, AI’ın engelli bireylerin yaşam kalitesini iyileştirme potansiyelini ve yardımcı robotik teknolojisindeki önemli bir ilerlemeyi gösteriyor. (Kaynak: Ronald_vanLoon)

AI Agent’ların Siber Saldırılarda Kullanılabileceği Endişesi: MIT Technology Review makalesi, otonom AI Agent’ların karmaşık siber saldırıları gerçekleştirmek için kullanılabileceğine işaret ediyor. Bu AI Agent’lar, güvenlik açıklarını otomatik olarak keşfetme, saldırı kodu oluşturma ve saldırıları gerçekleştirme potansiyeline sahip ve ölçekleri ile hızları insan hacker’ları çok aşabilir, bu da mevcut siber güvenlik savunma sistemleri için ciddi bir zorluk oluşturuyor. Bu durum, AI’ın silahlaştırılması ve güvenlik riskleri konusundaki endişeleri artırıyor. (Kaynak: Ronald_vanLoon)

AI Agent'ların Siber Saldırılarda Kullanılabileceği Endişesi

OpenAI Canlı Yayın Etkinliğini Duyurdu ve Muhtemelen Yeni Modeller Yayınlayacak: OpenAI, muğlak bir mesajla (geliştiriciler ve süper kütleli kara delik) bir canlı yayın etkinliğini duyurdu; aynı zamanda web sitesinde güncellenen simgeler ve model kartı bilgileri internette dolaşıyor, bu da muhtemelen GPT-4.1 serisi (nano, mini sürümleri dahil), o4-mini ve tam sürüm o3 dahil olmak üzere birçok yeni modelin yakında piyasaya sürüleceğini ima ediyor. Bu, OpenAI’nin artan pazar rekabetine yanıt olarak bir dizi yeni ürün veya model güncellemesi sunmaya hazırlanıyor olabileceğini gösteriyor. (Kaynak: openai, op7418)

OpenAI Canlı Yayın Etkinliğini Duyurdu ve Muhtemelen Yeni Modeller Yayınlayacak

Figure Robotu, Pekiştirmeli Öğrenme ile Simülasyondan Gerçeğe Doğal Yürüyüşü Başardı: Figure AI, pekiştirmeli öğrenmeyi (RL) kullanarak tamamen simülasyon ortamında Figure 02 insansı robotuna doğal yürüme biçimini başarıyla öğretti. Verimli simülatörler aracılığıyla büyük miktarda veri üreterek ve alan rastgeleleştirmesi ile robotun kendi yüksek frekanslı tork geri bildirimini birleştirerek, stratejinin simülasyondan gerçeğe sıfır-örnek (zero-shot) transferini başardı. Bu yöntem yalnızca geliştirme sürecini hızlandırmakla kalmadı, aynı zamanda tek bir sinir ağı stratejisinin birden fazla robotu kontrol etme fizibilitesini de kanıtladı ve gelecekteki robotların ticarileştirilmesi için önemli bir anlam taşıyor. (Kaynak: Bir Algoritma Robot Ordusunu Kontrol Ediyor! Tamamen Simülasyon Ortamında Pekiştirmeli Öğrenme, Figure İnsan Gibi Yürümeyi Öğrendi)

Figure Robotu, Pekiştirmeli Öğrenme ile Simülasyondan Gerçeğe Doğal Yürüyüşü Başardı

🧰 Araçlar

Jì Mèng AI 3.0 ile Stilize Metin Tasarımı Oluşturma ve Prompt Paylaşımı: Kullanıcı, yerli AI çizim aracı ‘Jì Mèng AI 3.0’ kullanarak tasarımlı metin içeren görseller oluşturma deneyimini ve yöntemlerini paylaştı. Doğrudan yazı tipi adını belirtmenin iyi sonuç vermemesi nedeniyle, yazar çeşitli görsel stilleri (endüstriyel, tatlı, teknolojik, mürekkep tarzı vb.) önceden ayarlayan ayrıntılı bir prompt şablonu oluşturdu ve AI’ın girilen metnin anlamına ve duygusuna göre stilleri otomatik olarak eşleştirmesi veya birleştirmesi için kurallar belirledi. Kullanıcının yalnızca hedef metni (örneğin ‘e-spor genci’, ‘şeker yemek istiyorum’) girmesi yeterli; şablon, stil, arka plan, düzen, atmosfer içeren eksiksiz bir çizim prompt’u oluşturarak Jì Mèng AI’da yüksek kaliteli metin-görsel tasarım sonuçları elde etmeyi sağlıyor. Makale, bu prompt şablonunu ve çok sayıda oluşturulmuş örneği sunuyor. (Kaynak: Jì Mèng AI 3.0 ile Yazı Tipi İçeren Kapak Oluşturma, Bu Çözüm Harika [Ek: 16+ Örnek ve Prompt], AI ile Yazı Tipi Tasarımı Oluşturmayı Biraz Anladım, Bu Prompt Seti ile Verimliliği %50 Artırın.)

Jì Mèng AI 3.0 ile Stilize Metin Tasarımı Oluşturma ve Prompt Paylaşımı

Çok Modlu AI Kullanarak Yemek Fotoğraflarını Menü Tarzı Görsellere Dönüştürme: Sosyal medya kullanıcıları, GPT-4o gibi çok modlu AI modellerini kullanarak sıradan yemek fotoğraflarını şık menü resimlerine dönüştürme tekniğini sergiledi. Bu yöntem, AI’a orijinal fotoğrafı sunarak ve betimleyici prompt’lar (örneğin, ‘üst düzey beş yıldızlı otel menü standardı ve stiline referansla’) kullanarak AI’ı görüntüyü stilize etmeye, düzenlemeye ve profesyonel görünümlü yemek sunumları oluşturmaya yönlendiriyor. Bu, çok modlu AI’ın görüntü anlama, düzenleme ve stil aktarımı konularındaki pratik potansiyelini gösteriyor. (Kaynak: karminski3)

Çok Modlu AI Kullanarak Yemek Fotoğraflarını Menü Tarzı Görsellere Dönüştürme

Slideteam.net: Muhtemelen AI Destekli Anında Slayt Oluşturma Aracı: Sosyal medyada Slideteam.net’in ‘anında’ mükemmel slaytlar oluşturabildiğinden bahsediliyor, bu da sunumların tasarımını ve oluşturulmasını otomatikleştirmek için AI teknolojisini kullanıyor olabileceğini ima ediyor. Bu tür araçlar genellikle otomatik düzen, içerik önerileri, stil eşleştirme gibi işlevleri AI aracılığıyla gerçekleştirerek PPT hazırlama verimliliğini artırmayı hedefler. (Kaynak: Ronald_vanLoon)

AI Masaj Robotu Tanıtımı: Video, AI tarafından yönlendirilen bir masaj robotunu gösteriyor. Bu robot, mekanik kolların fiziksel operasyon yeteneklerini ve AI’ın akıllı kontrolünü birleştiriyor. AI, kullanıcı ihtiyaçlarını anlamak, vücut bölgelerini tanımak, masaj yolunu planlamak, gücü ve teknikleri ayarlamak ve hatta sensörler aracılığıyla kullanıcı tepkilerini algılayarak masaj deneyimini optimize etmek için kullanılabilir; bu da AI’ın kişiselleştirilmiş sağlık hizmetleri ve otomatik fizik tedavi alanlarındaki uygulama potansiyelini gösteriyor. (Kaynak: Ronald_vanLoon)

GitHub Copilot, Windows Terminal’e Entegre Edildi: Microsoft, Windows Terminal’in Canary önizleme sürümüne GitHub Copilot özelliğini entegre etti ve buna ‘Terminal Sohbeti’ (Terminal Chat) adını verdi. Copilot abonesi olan kullanıcılar, doğrudan terminal ortamında AI ile etkileşime geçerek komut satırı önerileri, açıklamaları ve yardımı alabilirler. Bu hamle, geliştiricilerin komut yazarken uygulama değiştirme ihtiyacını azaltmayı, bağlam farkındalığı ile akıllı yardım sağlamayı ve özellikle karmaşık veya alışılmadık görevler için komut satırı işlemlerinin verimliliğini ve doğruluğunu artırmayı amaçlıyor. (Kaynak: GitHub Copilot Artık Windows Terminal’de Çalışıyor)

GitHub Copilot, Windows Terminal'e Entegre Edildi

OpenWebUI Dağıtımı İçin Donanım Gereksinimleri Tartışması: Reddit topluluğu kullanıcıları, yaklaşık 30 kişilik bir ekip için OpenWebUI (bir LLM Web arayüzü) dağıtmak üzere gereken Azure sanal makine yapılandırmasını tartıştı. Kullanıcı, yerel olarak Snowflake gömme modelini çalıştırmayı ve OpenAI API’sini kullanmayı planlıyor. Tartışma, kaynak ölçeklendirme, gömme model boyutunun CPU/RAM/depolama üzerindeki etkisi ve veri ön işlemenin önemini içeriyor. Topluluk, API’ye yoğun bir şekilde güvenmenin yerel donanım gereksinimlerini azaltabileceğini, ancak modelleri (özellikle gömme modellerini) yerel olarak çalıştırmanın daha güçlü bir yapılandırma gerektireceğini öneriyor. Sınırlı kaynak durumunda, gömme işlemleri için de API kullanılması öneriliyor. (Kaynak: Reddit r/OpenWebUI)

📚 Öğrenme

Çıkarım Yapan AI Modellerinde Eksik Ön Koşul Durumunda ‘Aşırı Düşünme’ Kusuru Bulunuyor: Maryland Üniversitesi ve diğer kurumların araştırması, mevcut çıkarım modellerinin (DeepSeek-R1, o1 gibi) gerekli bilgilerin eksik olduğu (eksik ön koşul, MiP) sorunlarla karşılaştığında, sorunun kendisindeki kusuru hızla tespit etmek yerine uzun ve geçersiz yanıtlar üretme eğiliminde olduğunu ortaya koydu. Bu ‘MiP aşırı düşünme’ olgusu hesaplama kaynaklarının israfına yol açıyor ve modelin sonunda ön koşul eksikliğini fark edip edememesiyle pek ilişkili değil. Buna karşılık, çıkarım yapmayan modeller daha iyi performans gösteriyor. Araştırma, bunun mevcut çıkarım modellerinin eleştirel düşünme yeteneğinden yoksun olduğunu ortaya çıkardığını ve bunun pekiştirmeli öğrenme eğitim paradigması veya bilgi damıtma sürecindeki sorunlardan kaynaklanabileceğini savunuyor. (Kaynak: Çıkarım Yapan AI ‘Hayal Gücü’ Bağımlısı, Saçmalıklarla Dolu, Maryland’li Çinli Dahi İç Yüzünü Ortaya Çıkarıyor)

Çıkarım Yapan AI 'Hayal Gücü' Bağımlısı, Saçmalıklarla Dolu, Maryland'li Çinli Dahi İç Yüzünü Ortaya Çıkarıyor

CVPR 2025: CADCrafter, Tek Görüntüden Düzenlenebilir CAD Dosyaları Oluşturmayı Başardı: MoreThink Technology, Nanyang Teknoloji Üniversitesi ve diğer kurumların araştırmacıları, tek bir görüntüden (parça render’ı, gerçek nesne fotoğrafı vb.) geleneksel mesh veya nokta bulutu modelleri yerine doğrudan parametrik, düzenlenebilir CAD mühendislik dosyaları (CAD komut dizileriyle temsil edilir) üretebilen CADCrafter çerçevesini önerdi. Bu yöntem, CAD komutlarını kodlamak için VAE kullanıyor ve görüntü koşullu gizli uzay üretimi için Diffusion Transformer ile birleştiriyor; çoklu görünümden tek görünüme damıtma stratejisiyle performansı artırıyor ve üretilen komutların derlenebilirliğini sağlamak için DPO’dan yararlanıyor. Oluşturulan CAD dosyaları doğrudan üretim ve işleme için kullanılabilir ve komutları düzenleyerek modeli değiştirmeyi destekler, bu da AI tarafından üretilen 3D modellerin pratikliğini ve yüzey kalitesini önemli ölçüde artırır. (Kaynak: Tek Görüntüden Doğrudan CAD Mühendislik Dosyası! CVPR 2025 Yeni Araştırması AI Tarafından Üretilen 3D Modellerin ‘Düzenlenemez’ Sorununu Çözüyor | MoreThink Technology, NTU vb. Tarafından)

Tek Görüntüden Doğrudan CAD Mühendislik Dosyası! CVPR 2025 Yeni Araştırması AI Tarafından Üretilen 3D Modellerin 'Düzenlenemez' Sorununu Çözüyor | MoreThink Technology, NTU vb. Tarafından

Zhejiang Üniversitesi, OPPO ve Diğerleri OS Agents Üzerine Bir İnceleme Yayınladı: Bu inceleme makalesi, çok modlu büyük modellere (MLLM) dayalı işletim sistemi ajanlarının (OS Agents) araştırma durumunu sistematik olarak özetlemektedir. OS Agents, işletim sistemi arayüzü (GUI) aracılığıyla bilgisayarlar, cep telefonları gibi cihazlarda görevleri otomatik olarak yerine getirebilen AI’ları ifade eder. Makale, temel unsurlarını (çevre, gözlem alanı, eylem alanı), temel yeteneklerini (anlama, planlama, yürütme) tanımlamakta, oluşturma yöntemlerini (temel model mimarisi ve eğitimi, ajan çerçevesi tasarımı) gözden geçirmekte ve değerlendirme protokollerini, kıyaslama testlerini ve ilgili ticari ürünleri özetlemektedir. Son olarak, güvenlik ve gizlilik, kişiselleştirme ve kendi kendine evrim gibi zorlukları ve gelecekteki yönelimleri tartışarak bu alandaki araştırmalar için kapsamlı bir referans sunmaktadır. (Kaynak: Zhejiang Üniversitesi, OPPO ve Diğerleri En Son İncelemeyi Yayınladı: Çok Modlu Büyük Modellere Dayalı Bilgisayar, Cep Telefonu ve Tarayıcı Akıllı Ajanları Araştırması)

Zhejiang Üniversitesi, OPPO ve Diğerleri En Son İncelemeyi Yayınladı: Çok Modlu Büyük Modellere Dayalı Bilgisayar, Cep Telefonu ve Tarayıcı Akıllı Ajanları Araştırması

ICLR 2025: Nabla-GFlowNet, Difüzyon Modelleri İçin Verimli ve Çeşitliliği Koruyan Ödül İnce Ayarını Gerçekleştiriyor: Difüzyon modeli ödül ince ayarındaki yavaş yakınsama (geleneksel RL) veya çeşitlilik kaybı (doğrudan optimizasyon) sorunlarına yönelik olarak araştırmacılar Nabla-GFlowNet yöntemini önerdi. Bu yöntem, üretken akış ağı (GFlowNet) çerçevesine dayanarak yeni bir akış denge koşulu (Nabla-DB) ve kayıp fonksiyonu türetiyor ve ince ayarı yönlendirmek için ödül gradyan bilgilerini kullanıyor. Belirli parametrelendirme tasarımı sayesinde, üretilen örneklerin çeşitliliğini korurken DDPO gibi yöntemlerden daha hızlı yakınsama hızları elde ediyor ve Stable Diffusion modelinde estetik, talimat takip etme gibi ödül fonksiyonları kullanılarak doğrulanmış olup mevcut yöntemlerden daha iyi performans gösteriyor. (Kaynak: ICLR 2025 | Difüzyon Modeli Ödül İnce Ayarında Yeni Atılım! Nabla-GFlowNet Çeşitlilik ve Verimliliği Bir Araya Getiriyor)

ICLR 2025 | Difüzyon Modeli Ödül İnce Ayarında Yeni Atılım! Nabla-GFlowNet Çeşitlilik ve Verimliliği Bir Araya Getiriyor

DeepSeek-R1 Çıkarım Mekanizması Analizi: McGill Üniversitesi’nin araştırması, DeepSeek-R1 gibi çıkarım modellerinin ‘düşünme’ sürecini derinlemesine analiz etti. Araştırma, çıkarım zinciri uzunluğunun performansla doğru orantılı olmadığını, bir ‘optimum nokta’ bulunduğunu ve aşırı uzun çıkarımların zararlı olabileceğini buldu. Model, uzun bağlamları veya karmaşık sorunları işlerken mevcut ifadeler üzerinde tekrar tekrar duraklayabilir. Ayrıca, çıkarım yapmayan modellere kıyasla DeepSeek-R1’in güvenlik açısından daha belirgin zafiyetleri olabilir. Bu çalışma, mevcut çıkarım modellerinin işleyiş mekanizmalarının bazı özelliklerini ve potansiyel sınırlamalarını ortaya koymaktadır. (Kaynak: LLM Haftalık Hızlı Bakış! | Çok Modlu, MoE Modelleri, Deepseek Çıkarımı, Agent Güvenlik Kontrolü, Model Nicelleştirme vb. İçerir)

MoE Modelleri İçin Test Zamanı Optimizasyonunda Yeni Yöntem: C3PO: Johns Hopkins Üniversitesi, Uzmanlar Karışımı (MoE) büyük modellerinin performansını test zamanında optimize etmek için C3PO (Kritik Katman, Çekirdek Uzman, İşbirlikçi Yol Optimizasyonu) yöntemini önerdi. Bu yöntem, kritik katmanlardaki çekirdek uzmanları yeniden ağırlıklandırarak her test örneği için optimizasyon yapar ve uzman yolu alt optimallik sorununu çözer. Deneyler, C3PO’nun MoE model doğruluğunu önemli ölçüde (%7-15) artırabildiğini ve hatta daha küçük parametreli MoE modellerinin performansının daha büyük parametreli yoğun modelleri geçmesini sağlayarak MoE mimarisinin verimliliğini artırdığını göstermiştir. (Kaynak: LLM Haftalık Hızlı Bakış! | Çok Modlu, MoE Modelleri, Deepseek Çıkarımı, Agent Güvenlik Kontrolü, Model Nicelleştirme vb. İçerir)

Nicelleştirmenin Çıkarım Modeli Performansı Üzerindeki Etkisinin Sistematik İncelenmesi: Tsinghua Üniversitesi ve diğer kurumlar, model nicelleştirmenin çıkarım modelleri (DeepSeek-R1, Qwen serisi gibi) üzerindeki performans etkisini ilk kez sistematik olarak inceledi. Deneyler, farklı bit genişlikleri (ağırlıklar, KV önbelleği, aktivasyon değerleri) ve algoritmalar altındaki nicelleştirme etkilerini değerlendirdi. Araştırma, W8A8 veya W4A16 nicelleştirmenin genellikle kayıpsız veya kayıpsıza yakın performans sağladığını, ancak daha düşük bit genişliklerinin riski önemli ölçüde artırdığını buldu. Model boyutu, kaynağı ve görev zorluğu, nicelleştirme sonrası performansı etkileyen temel faktörlerdir. Araştırma sonuçları ve nicelleştirilmiş modeller açık kaynak olarak yayınlandı. (Kaynak: LLM Haftalık Hızlı Bakış! | Çok Modlu, MoE Modelleri, Deepseek Çıkarımı, Agent Güvenlik Kontrolü, Model Nicelleştirme vb. İçerir)

APIGen-MT: Yüksek Kaliteli Çok Turlu Agent Etkileşim Verisi Üretme Çerçevesi: Salesforce, çok turlu etkileşimli AI Agent’ları eğitmek için gereken yüksek kaliteli veri kıtlığı sorununu çözmeyi amaçlayan APIGen-MT çerçevesini önerdi. Çerçeve iki aşamadan oluşuyor: önce LLM incelemesi ve yinelemeli geri bildirim kullanarak ayrıntılı bir görev planı oluşturuyor, ardından simüle edilmiş insan-makine etkileşimi yoluyla planı eksiksiz yörünge verilerine dönüştürüyor. Bu çerçeveye dayalı olarak eğitilen xLAM-2 model serisi, çok turlu Agent kıyaslama testlerinde üstün performans göstererek GPT-4o gibi modelleri geride bıraktı ve bu veri üretim yönteminin etkinliğini doğruladı. Sentetik veriler ve modeller açık kaynak olarak yayınlandı. (Kaynak: LLM Haftalık Hızlı Bakış! | Çok Modlu, MoE Modelleri, Deepseek Çıkarımı, Agent Güvenlik Kontrolü, Model Nicelleştirme vb. İçerir)

Araştırma Ortaya Koyuyor: Daha Uzun Düşünce Zinciri Daha Güçlü Çıkarım Performansı Anlamına Gelmiyor, Pekiştirmeli Öğrenme Daha Kısa Olabilir: Wand AI’ın araştırması, çıkarım modellerinin (özellikle PPO gibi RL algoritmalarıyla eğitilenlerin) daha uzun yanıtlar üretme eğiliminde olduğunu, bunun doğruluk ihtiyacından değil, RL mekanizmasının kendisinden kaynaklanabileceğini belirtiyor: yanlış cevaplar (negatif ödül) için yanıt uzunluğunu artırmak, her token’ın cezasını ‘seyreltebilir’ ve böylece kaybı azaltabilir. Araştırma, kısa ve öz çıkarımın daha yüksek doğrulukla ilişkili olduğunu kanıtlıyor ve iki aşamalı bir RL eğitim yöntemi öneriyor: önce yeteneği artırmak için zor problemlerle eğitmek (yanıtları uzatabilir), ardından doğruluğu korurken kısalığı teşvik etmek için orta zorlukta problemlerle eğitmek; bu, çok küçük veri kümelerinde bile performansı ve sağlamlığı etkili bir şekilde artırabilir. (Kaynak: Daha Uzun Düşünce Daha Güçlü Çıkarım Performansı Anlamına Gelmez, Pekiştirmeli Öğrenme Çok Kısa Olabilir)

Daha Uzun Düşünce Daha Güçlü Çıkarım Performansı Anlamına Gelmez, Pekiştirmeli Öğrenme Çok Kısa Olabilir

USTC ve ZTE, Curr-ReFT’i Öneriyor: Küçük Boyutlu VLM’ler İçin Yeni Bir Sonrası Eğitim Paradigması: Küçük görsel dil modellerinin (VLM) denetimli ince ayardan sonra karşılaştığı zayıf genelleme yeteneği, sınırlı çıkarım yeteneği ve kararsız eğitim (‘tuğla duvar’ fenomeni) gibi sorunlara yönelik olarak, Çin Bilim ve Teknoloji Üniversitesi (USTC) ve ZTE Corporation, Curr-ReFT sonrası eğitim paradigmasını önerdi. Bu yöntem, müfredat pekiştirmeli öğrenmeyi (Curr-RL) ve reddetme örneklemesine dayalı kendi kendine iyileştirmeyi birleştirir. Curr-RL, zorluk farkındalığı olan bir ödül mekanizması aracılığıyla modelin kolaydan zora doğru kademeli olarak öğrenmesini yönlendirir; reddetme örneklemesi ise modelin temel yeteneklerini korumak için yüksek kaliteli örnekleri kullanır. Qwen2.5-VL-3B/7B modelleri üzerindeki deneyler, Curr-ReFT’in modellerin çıkarım ve genelleme performansını önemli ölçüde artırdığını ve küçük modellerin birçok kıyaslamada büyük modellerden daha iyi performans göstermesini sağladığını gösterdi. Kod, veri ve modeller açık kaynak olarak yayınlandı. (Kaynak: USTC ve ZTE Yeni Sonrası Eğitim Paradigmasını Öneriyor: Küçük Boyutlu Çok Modlu Modeller, R1 Çıkarımını Başarıyla Tekrarlıyor)

USTC ve ZTE Yeni Sonrası Eğitim Paradigmasını Öneriyor: Küçük Boyutlu Çok Modlu Modeller, R1 Çıkarımını Başarıyla Tekrarlıyor

Tsinghua ve Shanghai AI Lab, GenPRM’i Öneriyor: Ölçeklenebilir Üretken Süreç Ödül Modeli: Geleneksel süreç ödül modellerinin (PRM) LLM çıkarımını denetlerken yorumlanabilirlik ve test zamanı ölçeklenebilirlik eksikliği sorununu çözmek için Tsinghua Üniversitesi ve Shanghai AI Lab, GenPRM’i önerdi. Doğal dil düşünce zincirleri (CoT) ve yürütülebilir doğrulama kodu üreterek çıkarım adımlarını değerlendirir ve daha şeffaf geri bildirim sağlar. GenPRM, test zamanı hesaplama genişlemesini destekler; birden fazla değerlendirme yolunu örnekleyerek ve ödülleri ortalamalayarak doğruluğu artırır. Model yalnızca 23K sentetik veri ile eğitildi; 1.5B sürümü test zamanı genişlemesi sayesinde GPT-4o’yu geride bıraktı ve 7B sürümü 72B temel modelini aştı. GenPRM ayrıca cevapların yinelemeli iyileştirilmesi için adım düzeyinde bir eleştirmen olarak da kullanılabilir. (Kaynak: Süreç Ödül Modelleri de Test Zamanında Genişletilebilir mi? Tsinghua ve Shanghai AI Lab 23K Veri ile 1.5B Küçük Modelin GPT-4o’yu Geçmesini Sağladı)

Süreç Ödül Modelleri de Test Zamanında Genişletilebilir mi? Tsinghua ve Shanghai AI Lab 23K Veri ile 1.5B Küçük Modelin GPT-4o'yu Geçmesini Sağladı

Dünyanın En Büyük Açık Kaynaklı Matematik Veri Kümesi MegaMath Yayınlandı (371 Milyar Token): LLM360, 371 milyar token içeren MegaMath veri kümesini tanıttı; bu, şu anda matematiksel akıl yürütmeye odaklanan dünyanın en büyük açık kaynaklı ön eğitim veri kümesidir ve açık kaynak topluluğu ile kapalı kaynak matematik korpusları (DeepSeek-Math gibi) arasındaki ölçek ve kalite farkını kapatmayı amaçlamaktadır. Veri kümesi üç bölümden oluşmaktadır: büyük ölçekli matematikle ilgili web verileri (279B, 15B yüksek kaliteli alt küme dahil), matematik kodu (28B) ve yüksek kaliteli sentetik veriler (64B, soru-cevap, kod üretimi, metin-görsel karışımı dahil). Dikkatli işleme ve çok turlu ön eğitim doğrulaması sonrasında, Llama-3.2 modelinde MegaMath kullanılarak yapılan ön eğitim, GSM8K, MATH gibi kıyaslamalarda %15-20 oranında önemli performans artışı sağlayabilir. (Kaynak: 371 Milyar Matematik Token’ı! Dünyanın En Büyük Açık Kaynaklı Matematik Veri Kümesi MegaMath Sarsıcı Bir Şekilde Yayınlandı, DeepSeek-Math’ı Ezdi Geçti)

Dünyanın En Büyük Açık Kaynaklı Matematik Veri Kümesi MegaMath Sarsıcı Bir Şekilde Yayınlandı, DeepSeek-Math'ı Ezdi Geçti

CVPR 2025: NLPrompt, Gürültülü Etiketler Altında VLM Prompt Öğrenmesinin Sağlamlığını Artırıyor: ShanghaiTech Üniversitesi YesAI Lab, görsel dil modellerinin (VLM) prompt öğrenmesinin etiket gürültüsüyle karşılaştığında performans düşüşü sorununu çözmeyi amaçlayan NLPrompt yöntemini önerdi. Araştırma, prompt öğrenme senaryosunda Ortalama Mutlak Hata (MAE) kaybının (PromptMAE), Çapraz Entropi (CE) kaybından daha sağlam olduğunu buldu. Aynı zamanda, optimal transporta dayalı PromptOT veri temizleme yöntemini önerdi; bu yöntem, prompt tarafından üretilen metin özelliklerini prototip olarak kullanarak veri kümesini temiz ve gürültülü kümelere ayırır. NLPrompt, temiz küme için CE kaybını, gürültülü küme için MAE kaybını kullanarak her ikisinin avantajlarını etkili bir şekilde birleştirir. Deneyler, bu yöntemin hem sentetik hem de gerçek gürültülü veri kümelerinde CoOp gibi prompt öğrenme yöntemlerinin sağlamlığını ve performansını önemli ölçüde artırdığını kanıtladı. (Kaynak: CVPR 2025 | MAE Kaybı + Optimal Transport İkili Gücü! ShanghaiTech Yeni Sağlam Prompt Öğrenme Yöntemini Öneriyor)

CVPR 2025 | MAE Kaybı + Optimal Transport İkili Gücü! ShanghaiTech Yeni Sağlam Prompt Öğrenme Yöntemini Öneriyor

Model Sıkıştırmada Bilgi Damıtma Teknolojisinin Uygulanması ve Tartışılması: Topluluk, büyük bir ‘öğretmen’ modelin küçük bir ‘öğrenci’ modeli eğitmek için kullanıldığı bilgi damıtma tekniğini tartıştı; bu teknik, öğrenci modelin belirli bir görevde öğretmen modeline yakın performans göstermesini sağlarken maliyeti önemli ölçüde düşürür. Bir kullanıcı, GPT-4o’nun duygu analizi görevindeki yeteneğini (%92 doğruluk) küçük bir modele başarıyla damıtarak maliyeti 14 kat azalttığını paylaştı. Yorumlar, damıtma etkisinin dikkate değer olmasına rağmen, genellikle belirli alanlarla sınırlı olduğunu ve öğrenci modelin öğretmen modelin genelleme yeteneğinden yoksun olduğunu belirtiyor. Aynı zamanda, sürekli veri değişimine uyum sağlaması gereken profesyonel senaryolar için kendi kendine eğitilen bir modeli sürdürmenin maliyetinin, doğrudan büyük bir API kullanmaktan daha yüksek olabileceği belirtiliyor. (Kaynak: Reddit r/MachineLearning)

Model Sıkıştırmada Bilgi Damıtma Teknolojisinin Uygulanması ve Tartışılması

AI Agent Tanımı İlgi Çekiyor: McKinsey gibi danışmanlık şirketleri, AI Agent kavramını tanımlamaya ve tartışmaya başladı; bu durum, hedefleri tamamlamak için otonom olarak algılayabilen, karar verebilen ve hareket edebilen akıllı varlıklar olarak AI Agent’ların iş ve teknoloji alanlarındaki artan önemini yansıtıyor. AI Agent’ların tanımını, yeteneklerini ve uygulama senaryolarını anlamak sektörün odak noktası haline geliyor. (Kaynak: Ronald_vanLoon)

AI Agent Tanımı İlgi Çekiyor

💼 İş Dünyası

Alibaba’nın AI Stratejisinin Şifreleri Çözülüyor: AGI Odaklı, Altyapıya Büyük Yatırım ile Dönüşümü Hızlandırma: Analizler, Alibaba’nın resmi olarak bir AI stratejisi yayınlamamış olmasına rağmen, eylemlerinin net bir tablo ortaya koyduğunu gösteriyor: rekabette yeniden inisiyatif kazanmak amacıyla AGI arayışını birincil hedef olarak belirlemek. Önümüzdeki üç yıl içinde, özellikle artan çıkarım talebini karşılamak üzere AI ve bulut bilişim altyapısı inşasına 380 milyar RMB’den fazla yatırım yapmayı planlıyor. Stratejik yol haritası şunları içeriyor: DingTalk aracılığıyla AI Agent yeteneklerini tanıtmak; Alibaba Cloud büyümesini desteklemek için Qwen serisi açık kaynaklı modellerden yararlanmak; Tongyi API’nin MaaS modelini geliştirmek. Aynı zamanda, Alibaba mevcut işlerini AI ile derinlemesine dönüştürecek; örneğin Taobao kullanıcı deneyimini iyileştirmek, Quark’ı amiral gemisi bir AI uygulaması (arama + Agent) haline getirmek ve Amap’in (Gaode Map) yaşam hizmetlerindeki AI uygulamalarını keşfetmek. Alibaba, AI alanındaki konumunu hızlandırmak için yatırım ve satın almalar da yapabilir. (Kaynak: Alibaba AI Stratejisinin Sırları: Hiç Yayınlanmadı, Ama Şimdiden Hızla Koşuyor)

AI Yetenek Pazarında Yeni Trendler: Akademik Geçmişten Çok Pratik Deneyim, Hibrit Yetenekler Tercih Ediliyor: Çin’in büyük şehirlerindeki yaklaşık 3000 yüksek maaşlı AI pozisyonunun analizine dayanan rapor, AI yetenek talebindeki üç ana eğilimi ortaya koyuyor: 1) Algoritma mühendislerine olan talep yüksek, maaşlar cazip ve otomotiv sektörü işe alımda ana güç haline geliyor; 2) Şirketler (DeepSeek gibi yıldız şirketler dahil) akademik yeterlilik konusundaki katı gereksinimleri giderek azaltıyor, bunun yerine pratik mühendislik yeteneğine ve karmaşık sorunları çözme deneyimine daha fazla önem veriyor; 3) Hibrit yeteneklere olan talep artıyor; örneğin, AI ürün yöneticilerinin aynı anda kullanıcıları, modelleri ve prompt mühendisliğini anlaması gerekiyor, çünkü AI giderek daha fazla uzmanlık gerektiren görevi üstleniyor ve insanların daha üst düzeyde entegrasyon ve denetim yapması gerekiyor. (Kaynak: Yaklaşık 3000 İşe Alım Verisinden, AI Yeteneklerini Keşfetmek İçin Üç Altın Kural Buldum)

AI Yetenek Pazarında Yeni Trendler: Akademik Geçmişten Çok Pratik Deneyim, Hibrit Yetenekler Tercih Ediliyor

UBTECH Sürekli Zarar Ediyor, İnsansı Robotların Ticarileşmesindeki Zorluklar Ciddi: İnsansı robot şirketi UBTECH’in 2024 mali raporları, gelir %23.7 artarak 1.3 milyar RMB’ye ulaşmasına rağmen hala 1.16 milyar RMB zarar ettiğini gösteriyor. Temel insansı robot işinin ticarileşmesi yavaş ilerliyor; yıl boyunca sadece 10 adet teslim edildi ve birim fiyatı 3.5 milyon RMB’ye kadar çıkarak pazar beklentilerini ve rakipleri (örneğin Unitree Robotics G1 sadece 99,000 RMB) aştı. Ayrıca, sektördeki bir diğer lider şirket olan CloudMinds’ın finansman sorunları yaşadığına dair söylentiler, insansı robot endüstrisinin ticarileşme fizibilitesi hakkında soru işaretleri doğurdu ve daha önce yatırımcı Zhu Xiaohu’nun temkinli görüşlerini doğruladı. Yüksek maliyetler, sınırlı uygulama senaryoları ve güvenlik ile güvenilirlik, şu anda insansı robotların büyük ölçekli ticarileşmesinin önündeki ana engellerdir. (Kaynak: UBTECH Bir Yılda Yaklaşık 1.2 Milyar Zarar Etti, Zhu Xiaohu’nun Şimdi Söyleyecek Daha Çok Şeyi Var)

UBTECH Bir Yılda Yaklaşık 1.2 Milyar Zarar Etti, Zhu Xiaohu'nun Şimdi Söyleyecek Daha Çok Şeyi Var

AI; Telekom, Yüksek Teknoloji ve Medya Sektörlerinde Büyümeyi Destekliyor: Tartışmalar, yapay zekanın (üretken AI dahil) telekomünikasyon, yüksek teknoloji ve medya sektörlerindeki büyümeyi yönlendiren kilit bir güç haline geldiğini gösteriyor. AI teknolojisi, müşteri deneyimini iyileştirmek, ağ operasyonlarını optimize etmek, içerik oluşturmayı otomatikleştirmek, operasyonel verimliliği artırmak ve yenilikçi hizmetler geliştirmek gibi alanlarda yaygın olarak kullanılıyor ve bu sektörlerdeki şirketlerin hızla değişen pazarda rekabet avantajı elde etmelerine yardımcı oluyor. (Kaynak: Ronald_vanLoon)

Hugging Face, Açık Kaynaklı Robotik Şirketi Pollen Robotics’i Satın Aldı: Tanınmış AI model ve araç platformu Hugging Face, açık kaynaklı insansı robotu Reachy ile bilinen startup Pollen Robotics’i satın aldı. Bu satın alma, Hugging Face’in başarılı açık kaynak modelini AI robotik alanına genişletme niyetini gösteriyor; açık donanım ve yazılım çözümleri aracılığıyla bu alanda işbirliğini ve yeniliği teşvik etmeyi ve robotik teknolojisinin demokratikleşme sürecini hızlandırmayı amaçlıyor. (Kaynak: huggingface, huggingface, huggingface, huggingface)

Hugging Face, Açık Kaynaklı Robotik Şirketi Pollen Robotics'i Satın Aldı

🌟 Topluluk

AI Çağı Sosyal Bilimcilerin Gelişimi İçin Daha Avantajlı Olabilir: Silikon Vadisi AI+ topluluğu kurucusu Lynn Duan, AI araçlarının (Cursor gibi) programlama engelini düşürmesiyle mühendislik yeteneklerinin göreceli öneminin azaldığını, ticarileştirme, pazarlama, iletişim gibi beşeri ve sosyal bilimler becerilerinin ise daha kritik hale geldiğini savunuyor. AI, bazı giriş seviyesi teknik pozisyonların yerini alırken, teknoloji ile pazarı birleştirebilen hibrit yeteneklere olan talebi artırdı. Mezunlara hızlı büyüme için startup’ları düşünmelerini ve sadece akademik geçmişe dayanmak yerine pratik projelerle (model dağıtma, uygulama geliştirme gibi) yeteneklerini sergilemelerini öneriyor. Ayrıca, kurucu özelliklerinin (inanç, sektör anlayışı gibi) saf teknik geçmişten daha önemli olduğunu belirtiyor ve ABD SaaS ile Çin akıllı donanım alanlarındaki AI girişimcilik fırsatlarına olumlu bakıyor. (Kaynak: AI Aslında Sosyal Bilimciler İçin İyi Bir Dönem | Silikon Vadisi AI+ Kurucusu Lynn Duan ile Söyleşi)

AI Aslında Sosyal Bilimciler İçin İyi Bir Dönem | Silikon Vadisi AI+ Kurucusu Lynn Duan ile Söyleşi

GitHub’ın Çin IP’lerini Kısa Süreli ‘Engellemesi’ Endişe Yarattı, Yetkililer Hatalı İşlem Olduğunu Söyledi: Son zamanlarda, bazı Çinli kullanıcılar giriş yapmadan GitHub’a erişemediklerini ve IP kısıtlaması uyarısı aldıklarını fark etti, bu da toplulukta olası bir ‘engelleme’ endişesine yol açtı. GitHub yetkilileri hızla bunun bir yapılandırma hatasından kaynaklandığını ve düzeltildiğini belirtse de, olay hala tartışmalara neden oluyor. GitHub’ın geçmişte ABD yaptırım politikalarına dayanarak İran, Rusya gibi bölgelere erişimi kısıtladığı göz önüne alındığında, bu olay bazıları tarafından potansiyel kısıtlama önlemlerinin bir ‘provasi’ olarak yorumlandı. Makale, GitHub’ın Çinli geliştiriciler ve açık kaynak ekosistemi (birçok AI projesi dahil) için önemini ve bu tür kısıtlamaların olası olumsuz etkilerini vurguluyor ve Gitee, CODING gibi yerel kod barındırma platformlarını alternatif olarak listeliyor. (Kaynak: ‘Bug’ mı ‘Prova’ mı? GitHub Aniden Tüm Çin IP’lerini ‘Engelledi’, Yetkililer: Sadece ‘El Kayması’ Teknik Hata Oldu)

GitHub'ın Çin IP'lerini Kısa Süreli 'Engellemesi' Endişe Yarattı, Yetkililer Hatalı İşlem Olduğunu Söyledi

Claude AI Performansı ve Hizmeti Kullanıcı Tartışmalarına Neden Oluyor: Reddit’teki tartışmalar, bazı kullanıcıların Anthropic’in Claude modelinden memnuniyetsizliklerini dile getirdiğini gösteriyor; performans düşüşü, kodlama sırasında gereksiz değişiklikler yapması ve ücretli katmanlar ile hız sınırlamalarından duyulan hayal kırıklığı belirtiliyor, hatta tanınmış geliştiricilerin başka modellere (Gemini 2.5 Pro gibi) yöneleceğini ifade ettiği görülüyor. Ancak, bazı kullanıcılar Claude’un (özellikle eski Sonnet 3.5 sürümünün) belirli görevlerde (kodlama gibi) hala avantajlı olduğunu veya hız sınırlamalarıyla sık karşılaşmadıklarını belirtiyor. Bu tartışma, kullanıcıların Claude deneyimlerinde farklılıklar olduğunu ve yoğun rekabet ortamında kullanıcıların AI model performansı ve hizmetlerine yönelik yüksek beklentilerini yansıtıyor. (Kaynak: Reddit r/ClaudeAI)

Claude AI Performansı ve Hizmeti Kullanıcı Tartışmalarına Neden Oluyor

Gemini Deep Research Özelliğinin Ölçeği Tartışma Yaratıyor: Kullanıcılar, Google Gemini Advanced’in Deep Research özelliğini kullanırken, AI’ın bir soruyu yanıtlamak için yaklaşık 700 web sitesini ziyaret ettiğini ve uzun raporlar (örneğin 37 sayfa) oluşturduğunu paylaştı. Bu ölçek kullanıcıları etkiledi, ancak aynı zamanda bilgi kalitesi hakkında tartışmalara da yol açtı. Yorumcular, bu kadar büyük miktarda web bilgisini işlemenin doğruluğu ve derinliği garanti edip etmediğini veya yalnızca potansiyel olarak hatalı web arama sonuçlarını daha geniş bir ölçekte özetleyip özetlemediğini sorguluyor. Bu, topluluğun AI araştırma araçlarının bilgi işleme yeteneklerine (derinlik vs. genişlik) olan ilgisini ve incelemesini yansıtıyor. (Kaynak: Reddit r/artificial)

Gemini Deep Research Özelliğinin Ölçeği Tartışma Yaratıyor

Gemini 2.5 Pro Programlama Yeteneği Topluluktan Olumlu Yorumlar Aldı: Birçok kullanıcı, toplulukta Google Gemini 2.5 Pro ile programlama konusundaki olumlu deneyimlerini paylaştı; akıllı seviyesinin yüksek olduğunu, kullanıcı niyetini iyi anladığını, 1 milyon token’lık uzun bağlam işleme yeteneğine (büyük kod tabanlarını analiz etmeye yeterli) sahip olduğunu ve ücretsiz olduğunu belirterek, genel performansının Claude gibi rakiplerden daha iyi olduğunu düşünüyor. Bazı küçük kusurlar (ara sıra var olmayan kütüphane fonksiyonlarını halüsinasyon görmesi gibi) olmasına rağmen, genel değerlendirme çok yüksek; şu anda en popüler kodlama modellerinden biri olarak kabul ediliyor ve Google’ın gelecekte çıkarabileceği daha güçlü modellere (Dragontail gibi) yönelik beklentiler ifade ediliyor. (Kaynak: Reddit r/ArtificialInteligence)

Küçük Açık Kaynaklı Modeller Hızla Gelişiyor, Kullanıcı Algısının Güncellenmesi Gerekiyor: Topluluk tartışmaları, açık kaynaklı LLM’lerin baş döndürücü ilerlemesine dikkat çekiyor. QwQ-32B, Gemma-3-27B gibi şu anda iyi görünen modellerin, bir iki yıl önce (GPT-4 yeni çıktığında) devrim niteliğinde olacağı belirtiliyor. Bu, herkesin mevcut küçük açık kaynaklı modellerin gerçek yeteneklerini göz ardı etmemesi gerektiğini hatırlatıyor; oldukça yüksek bir seviyeye ulaştılar. Yorumlarda, bu modellerin en üst düzey kapalı kaynaklı modellerle karşılaştırıldığında hala eksiklikleri (kararlılık, hız, bağlam işleme gibi) olduğu kabul ediliyor, ancak ilerleme hızları ve potansiyelleri vurgulanıyor; gelecekte sadece parametre yığmak yerine mimari yeniliklerle daha büyük atılımlar yapılabileceği düşünülüyor. (Kaynak: Reddit r/LocalLLaMA)

Topluluk Üyesi, AI Projeleri İçin Ücretsiz A100 Hesaplama Gücü Sunuyor: 4 adet Nvidia A100 GPU’ya sahip bir kullanıcı, Reddit topluluğunda yenilikçi, olumlu etki yaratmayı hedefleyen ve hesaplama kaynakları kısıtlı olan AI meraklılarının projeleri için ücretsiz hesaplama gücü (yaklaşık 100 A100 saati) sunmaya istekli olduğunu belirten bir gönderi paylaştı. Bu girişim olumlu tepkiler aldı; birçok araştırmacı ve geliştirici, yeni model mimarilerinin eğitimi, model yorumlanabilirliği, modüler öğrenme, insan-makine etkileşimi uygulamaları gibi çeşitli alanları kapsayan somut proje planları sundu; bu durum AI araştırma topluluğunun hesaplama kaynaklarına olan talebini ve yardımlaşma ruhunu gösteriyor. (Kaynak: Reddit r/deeplearning)

Claude AI Hız Sınırlaması Sorunu Toplulukta Tartışma Yaratıyor: Claude AI modelini kullanırken sık sık hız sınırlamalarının tetiklendiğine (örneğin sadece 5 mesajdan sonra) dair şikayetler toplulukta tartışmalara yol açtı. Bazı kullanıcılar bu tür şikayetlere şiddetle karşı çıkarak bunların abartılı olduğunu veya kullanıcı hatasından (örneğin her seferinde çok uzun bağlam yüklemek gibi) kaynaklandığını düşünüyor ve kanıt talep ediyor. Ancak bazı kullanıcılar da kendi deneyimlerini paylaşarak, yüksek yoğunluklu görevler (büyük kod düzenlemeleri gibi) sırasında gerçekten sık sık sınırlamalara ulaştıklarını ve bunun iş akışlarını etkilediğini doğruluyor. Tartışma, kullanıcıların hız sınırlamaları konusundaki deneyimlerinin büyük ölçüde farklılık gösterdiğini, bunun muhtemelen belirli kullanım şekilleri ve görev karmaşıklığıyla ilgili olduğunu ve aynı zamanda kullanıcıların ücretli hizmetlerdeki sınırlamalara karşı hassasiyetini gösteriyor. (Kaynak: Reddit r/ClaudeAI)

💡 Diğer

AIGC ve Agent Ekosistem Konferansı Haziran’da Şanghay’da Düzenlenecek: İkinci AIGC ve Yapay Zeka Agent Ekosistem Konferansı, 12 Haziran 2025’te Şanghay’da ‘Akıllı Zincir Her Şeyi Bağlar · Sınırsız Birlikte Yaşam’ temasıyla gerçekleştirilecek. Konferans, üretken AI (AIGC) ve akıllı ajanların (AI Agent) işbirlikçi yeniliklerine ve ekosistem entegrasyonuna odaklanacak; içerik AI altyapısı, büyük dil modelleri, AIGC pazarlama ve senaryo uygulamaları (medya, e-ticaret, endüstri, tıp vb.), çok modlu teknoloji, otonom karar verme çerçeveleri gibi konuları kapsayacak. AI’ın tekil araçlardan ekosistem işbirliğine doğru gelişimini teşvik etmeyi ve teknoloji sağlayıcılarını, talep edenleri, sermayeyi ve politika yapıcıları bir araya getirmeyi amaçlıyor. (Kaynak: Haziran Şanghay | ‘Akıllı Zincir Her Şeyi Bağlar’ Şanghay Zirvesi: AIGC + Agent Ekosistem Entegrasyonu)

AIGC ve Agent Ekosistem Konferansı Haziran'da Şanghay'da Düzenlenecek

36Kr AI Partner Konferansı Super APP’lere Odaklanıyor: 36Kr, 18 Nisan 2025’te Şanghay Model Hız Alanı’nda (MoSu Kongjian) ‘Super APP Geliyor · 2025 AI Partner Konferansı’nı düzenleyecek. Konferans, AI uygulamalarının iş dünyasını nasıl yeniden şekillendirdiğini ve yıkıcı ‘süper uygulamaları’ nasıl ortaya çıkardığını tartışmayı amaçlıyor. Konferans, AMD, Baidu, 360, Qualcomm gibi şirketlerin yöneticilerini ve yatırımcıları bir araya getirerek endüstriyel AI dönüşümü, AI hesaplama gücü, AI arama, AI eğitimi gibi sıcak konuları tartışacak ve AI yerel uygulama inovasyon örnekleri ile AI Partner İnovasyon Ödüllerini açıklayacak. Aynı zamanda AI Kapsayıcılık Salonu ve AI Yurtdışı Kapalı Çalıştayı da düzenlenecek. (Kaynak: Super App Geliyor! AI Uygulamalarının İş Dünyasını Nasıl ‘Yeniden Yazdığını’ Görün | 2025 AI Partner Konferansı Ana Noktaları)

36Kr AI Partner Konferansı Super APP'lere Odaklanıyor

Horizon Robotics, 3D Yeniden Yapılandırma/Üretim Algoritma Stajyeri Arıyor: Horizon Robotics şirketinin Cisimleşmiş Zeka ekibi, Şanghay ve Pekin’de 3D yeniden yapılandırma/üretim alanında algoritma stajyerleri arıyor. Bu pozisyon, robot veri toplama maliyetini düşürmek ve simülatör performansını optimize etmek için 3D Gaussian Splatting, ileri beslemeli yeniden yapılandırma, 3D/video üretimi gibi teknolojileri kullanarak Real2Sim algoritmalarının tasarlanması ve geliştirilmesine katılacaktır. Yüksek lisans veya üzeri derece, ilgili deneyim ve beceriler gereklidir. Tam zamanlı pozisyona geçme fırsatı, GPU kaynakları ve profesyonel rehberlik sunulmaktadır. (Kaynak: Şanghay/Pekin İç Referans | Horizon Robotics Cisimleşmiş Zeka Ekibi 3D Yeniden Yapılandırma/Üretim Alanında Algoritma Stajyeri Arıyor)

Horizon Robotics, 3D Yeniden Yapılandırma/Üretim Algoritma Stajyeri Arıyor

OceanBase İlk AI Hackathon Yarışmasını Düzenliyor: Veritabanı üreticisi OceanBase, Ant Open Source, Jiqizhixin (MachineHeart) gibi kuruluşlarla işbirliği yaparak ‘DB+AI’ temalı ilk AI Hackathon’unu düzenliyor ve 100.000 RMB ödül havuzu sunuyor. Yarışma, geliştiricileri OceanBase ile AI teknolojilerinin birleşimini keşfetmeye teşvik ediyor; yönelimler arasında OceanBase’i AI uygulamaları için veri temeli olarak kullanmak veya OceanBase ekosisteminde (CAMEL AI, FastGPT vb. ile entegre) AI uygulamaları (soru-cevap, teşhis sistemleri gibi) oluşturmak yer alıyor. Başvurular 10 Nisan – 7 Mayıs tarihleri arasında bireylere ve takımlara açıktır. (Kaynak: 100 Bin Ödül × Bilişsel Yükseltme! OceanBase İlk AI Hackathon’u Kahramanları Çağırıyor, Cesaretin Var mı?)

OceanBase İlk AI Hackathon Yarışmasını Düzenliyor

Meituan Otel & Seyahat, L7-L8 Seviyesinde Büyük Model Algoritma Mühendisi Arıyor: Meituan Otel & Seyahat Tedarik Algoritma ekibi, Pekin’de L7-L8 seviyesinde Büyük Model Algoritma Mühendisi (deneyimli) arıyor. Sorumluluklar arasında NLP ve büyük model teknolojilerini kullanarak otel ve seyahat tedarik anlama sistemi (etiketler, popüler konular, benzerlik analizi) oluşturmak, ürün sunum materyallerini (başlıklar, görseller, metinler) optimize etmek, tatil paketi kombinasyonları oluşturmak ve tedarik tarafı algoritmalarında en son büyük model teknolojilerini keşfetmek yer alıyor. Yüksek lisans veya üzeri derece, 2 yıldan fazla deneyim, sağlam algoritma ve programlama becerileri gereklidir. (Kaynak: Pekin İç Referans | Meituan Otel & Seyahat Tedarik Algoritma Ekibi L7-L8 Büyük Model Algoritma Mühendisi Arıyor)

Meituan Otel & Seyahat Tedarik Algoritma Ekibi L7-L8 Büyük Model Algoritma Mühendisi Arıyor

Quantum Bit (QbitAI), AI Alanında Editör/Yazar Arıyor: AI teknoloji medyası Quantum Bit (QbitAI), Pekin Zhongguancun’da tam zamanlı editör/yazar arıyor; hem deneyimli adaylar hem de yeni mezunlar başvurabilir, staj sonrası tam zamanlı pozisyona geçme imkanı sunulmaktadır. İşe alım alanları arasında AI büyük modelleri, cisimleşmiş akıllı robotlar, uç cihaz donanımları ve AI yeni medya editörlüğü (Weibo/Xiaohongshu) bulunmaktadır. AI alanına tutkuyla bağlı olmak, iyi yazılı ifade ve bilgi toplama becerilerine sahip olmak gereklidir. Artı puan kazandıran özellikler arasında AI araçlarına aşinalık, makale yorumlama yeteneği, programlama becerileri vb. yer almaktadır. Rekabetçi maaş ve yan haklar ile profesyonel gelişim fırsatları sunulmaktadır. (Kaynak: Quantum Bit İşe Alım | DeepSeek’in Düzenlememize Yardımcı Olduğu İşe Alım İlanı)

Quantum Bit İşe Alım | DeepSeek'in Düzenlememize Yardımcı Olduğu İşe Alım İlanı

Turing Ödüllü LeCun AI Gelişimini Değerlendiriyor: İnsan Zekası Genel Değil, Yeni Nesil AI Üretken Olmayabilir: Bir podcast röportajında Yann LeCun, mevcut AGI (Genel Yapay Zeka) arayışında bir yanlış anlaşılma olduğunu, çünkü insan zekasının kendisinin genel değil, oldukça uzmanlaşmış olduğunu savunuyor. Yeni nesil AI atılımının, önerdiği JEPA mimarisi gibi üretken olmayan modellere dayanabileceğini öngörüyor; burada odak noktasının yalnızca dili işlemek yerine AI’ın fiziksel dünyayı anlamasını, akıl yürütme ve planlama yeteneği (dünya modeli) kazanmasını sağlamak olduğunu belirtiyor. Mevcut LLM’lerin gerçek akıl yürütme yeteneğinden yoksun olduğunu düşünüyor. LeCun ayrıca açık kaynağın (Meta’nın LLaMA’sı gibi) AI gelişimini teşvik etmedeki önemini vurguluyor ve akıllı gözlükler gibi cihazların AI teknolojisinin uygulanması için önemli bir yön olduğunu düşünüyor. (Kaynak: Turing Ödüllü LeCun: İnsan Zekası Genel Zeka Değil, Yeni Nesil AI Üretken Olmayabilir)

Turing Ödüllü LeCun: İnsan Zekası Genel Zeka Değil, Yeni Nesil AI Üretken Olmayabilir

Çin AIGC Endüstri Zirvesi Yakında Düzenleniyor (16 Nisan, Pekin): Üçüncü Çin AIGC Endüstri Zirvesi 16 Nisan’da Pekin’de gerçekleştirilecek. Zirve, Baidu, Huawei, AWS, Microsoft Research Asia, Mianbi Intelligence, Shengshu Technology, Fenbi, NetEase Youdao, Quwan Technology, Qingsong Health gibi şirket ve kurumlardan 20’den fazla sektör liderini bir araya getirerek AI teknolojisindeki en son gelişmeleri, binlerce sektördeki uygulamalarını, hesaplama altyapısını, güvenlik ve kontrol edilebilirlik gibi temel konuları tartışacak. Zirve, AI’ın endüstriyel dönüşümü nasıl güçlendirdiğini sergilemeyi ve ilgili ödülleri ve ‘Çin AIGC Uygulama Panoraması’nı yayınlamayı amaçlıyor. (Kaynak: Geri Sayım 2 Gün! 20’den Fazla Sektör Lideri AI’ı Tartışıyor, Çin AIGC Endüstri Zirvesi En Kapsamlı Rehberi Burada)

Çin AIGC Endüstri Zirvesi Yakında Düzenleniyor (16 Nisan, Pekin)

Düşük Maliyetli Ekran Kartlarıyla Yüz Milyarlarca Parametrelik Büyük Modelleri Çalıştırma Çözümü İncelemesi: Makale, Intel Arc™ ekran kartları (A770 gibi) ve Xeon® W işlemciler kullanarak maliyeti kontrol edilebilir (100.000 RMB seviyesinde) bir AI hepsi-bir-arada (AIO) çözümü oluşturmayı tartışıyor. Bu çözüm, yazılım ve donanım işbirliği (IPEX-LLM, OpenVINO™, oneAPI) optimizasyonu sayesinde tek bir makinede QwQ-32B (32 token/s hıza kadar) ve hatta 671B DeepSeek R1 (FlashMoE optimizasyonu ile yaklaşık 10 token/s hızda) gibi büyük modelleri çalıştırabiliyor. Bu, işletmelerin yerel veya uç ortamlarda büyük modelleri dağıtması için yüksek fiyat/performans oranı sunan bir seçenek sağlıyor ve çevrimdışı çıkarım, veri güvenliği gibi ihtiyaçları karşılıyor. Intel ayrıca, kurumsal AI uygulamalarının standardizasyonunu ve yaygınlaşmasını teşvik etmek için ekosistem ortaklarıyla birlikte OPEA platformunu başlattı. (Kaynak: 3000 Yuan’lık Ekran Kartını Sonuna Kadar Kullanıp Yüz Milyarlarca Parametrelik Büyük Modeli Çalıştırmanın Sırrı Geldi)

Düşük Maliyetli Ekran Kartlarıyla Yüz Milyarlarca Parametrelik Büyük Modelleri Çalıştırma Çözümü İncelemesi

Cerrahi Robot Yüksek Hassasiyetli Operasyon Sergiliyor: Video, cerrahi bir robotun çiğ bıldırcın yumurtası kabuğunu iç zarından hassas bir şekilde ayırabildiğini gösteriyor; bu, modern robotların ince motor becerileri ve kontrol konusundaki ileri seviyesini ortaya koyuyor. (Kaynak: Ronald_vanLoon)

Yarı İletken Litografi Teknolojisindeki Gelişmelere Genel Bakış: SPIE Gelişmiş Litografi ve Desenleme konferansının içeriği hakkında bir makaleye işaret ediyor; High-NA EUV, EUV maliyeti, desen şekillendirme, yeni fotorezistler (metal oksit, kuru tip) ve Hyper-NA gibi yeni nesil çip üretim teknolojilerindeki en son gelişmeleri tartışıyor. Bu teknolojiler, gelecekteki AI çiplerinin gelişimini desteklemek için kritik öneme sahiptir. (Kaynak: dylan522p)

Tekerlekli Robot Hassas Beceri Gösterisi: Video, bir tekerlekli robotun yüksek hassasiyetli hareket veya operasyon becerilerini sergiliyor; kontrol ve algılama için muhtemelen AI ve makine öğrenimi teknolojilerini içeriyor. (Kaynak: Ronald_vanLoon)