Anahtar Kelimeler:AI, Büyük model, AI silahlanma yarışı, Dikey sektör modeli, Zhipu AI IPO, AI ile bağımsız fizik yasaları keşfi, AI görme engelli destek sistemi
“` markdown
🔥 Odak Noktası
Büyük teknoloji şirketleri yapay zeka silahlanma yarışına girdi, dikey modeller ve ekosistem odak noktası haline geldi: Küresel teknoloji devleri, benzeri görülmemiş bir güçle yapay zekaya yatırım yapıyor; 2025 yılı sermaye harcamalarının 320 milyar doları aşması bekleniyor. Alibaba, Tencent, Huawei gibi Çinli üreticiler de yatırımlarını artırarak AI altyapısı, büyük modeller ve hesaplama gücüne odaklanıyor. Rekabetin odak noktası genel amaçlı büyük modellerden, yüksek brüt kar marjları ve gerçek sorunları çözme yetenekleriyle yeni büyüme motorları haline gelen dikey sektör modellerine kayıyor. Üst düzey çip zorluklarıyla karşı karşıya olmalarına rağmen, yerli üreticiler hesaplama maliyeti optimizasyonu ve çıkarım modelleri (“yavaş düşünme”) alanında (DeepSeek etkisi gibi) ilerleme kaydediyor. Her şirketin yolu farklı: Alibaba altyapıya büyük yatırım yapıyor, Huawei donanımı yeniliyor (CloudMatrix 384) ve uç-kenar-bulut işbirliğini teşvik ediyor, Baidu uygulamalara yaklaşıyor, Tencent ve ByteDance ise çeşitli senaryo avantajlarını kullanıyor. AI donanımının genişletilmesi ve açık kaynak ekosisteminin inşası (örneğin HarmonyOS, Ascend, Hunyuan) kilit öneme sahip hale geldi; rekabet artık tekil teknoloji atılımlarından ekosistem işbirliği yeteneğine dönüştü. (Kaynak: 36Kr-Teknoloji Bulut Raporu)

MIT’nin şaşırtıcı keşfi: AI, ön bilgi olmadan fizik yasalarını bağımsız olarak türetebiliyor: MIT’den Max Tegmark’ın ekibi, MASS (Multiple AI Scalar Scientists) adında yeni bir mimari geliştirdi. Bu AI sistemi, herhangi bir fizik yasası bilgisi verilmeden, yalnızca sarkaç, osilatör gibi fiziksel sistemlerin gözlem verilerini analiz ederek bağımsız olarak öğrenebiliyor ve klasik mekanikteki Hamilton veya Lagrange ifadelerine oldukça benzeyen teorik formülasyonlar önerebiliyor. Araştırma, AI’nin daha karmaşık sistemlerle karşılaştığında teorilerini otonom olarak düzelttiğini, farklı AI “bilim insanlarının” sonunda bilinen fizik prensiplerine yakınsadığını ve özellikle karmaşık sistemlerde Lagrange tanımını tercih etme eğiliminde olduğunu gösteriyor. Bu başarı, AI’nin temel bilimsel keşifler alanındaki muazzam potansiyelini ortaya koyuyor ve evrenin temel yasalarını bağımsız olarak ortaya çıkarabileceğini gösteriyor. (Kaynak: Xinzhiyuan)

Shanghai Jiao Tong Üniversitesi ekibinin AI destekli görme engelli sistemi Nature alt dergisinde yayınlandı, görme engellilere “yeniden görme” imkanı sunuyor: Shanghai Jiao Tong Üniversitesi’nden Gu Leilei’nin ekibi, esnek elektronik teknolojisiyle birleştirilmiş, AI destekli giyilebilir bir görme engelli yardım sistemi geliştirdi. Sistem, işitsel ve dokunsal geri bildirim yoluyla kısmi görme fonksiyonlarının yerini alarak görme engelli bireylerin navigasyon ve nesne yakalama gibi günlük görevleri tamamlamasına yardımcı oluyor. Sistemin donanımı hafif, yazılımı insan fizyolojik bilişine uygun bilgi çıkış yöntemlerini optimize ediyor ve VR tabanlı sürükleyici bir eğitim sistemi geliştirildi. Testler, sistemin görme engelli kullanıcıların sanal ve gerçek ortamlardaki navigasyon, engellerden kaçınma ve nesne yakalama yeteneklerini önemli ölçüde artırdığını gösterdi. Araştırma sonuçları “Nature Machine Intelligence” dergisinde yayınlandı; AI’nin görme engelli bireylere yardımcı olma, bağımsız yaşam becerilerini geliştirme konusundaki büyük potansiyelini gösteriyor ve kişiselleştirilmiş, kullanıcı dostu giyilebilir görsel yardımcı cihazlar için yeni fikirler sunuyor. (Kaynak: 36Kr)

Zhipu AI, IPO danışmanlığını başlattı, “ilk büyük model hissesi” olmak için yarışıyor: Tsinghua bağlantılı AI büyük model şirketi Zhipu AI (Beijing Zhipu Huazhang Technology), 14 Nisan’da Pekin Menkul Kıymetler Düzenleme Bürosu’nda IPO danışmanlık kaydını tamamladı. CICC tarafından danışmanlık verilen şirket, A-hisse piyasasını hedefliyor ve Çin’in “ilk AI büyük model hissesi” olma potansiyeline sahip. Son kullanıcı ürünü “Zhipu Qingyan”ın kullanıcı tabanı büyük olmasa da, Zhipu AI güçlü teknolojik geçmişi (Tsinghua bağlantılı, kendi geliştirdiği GLM serisi büyük modeller), devlet destekli yapısı (ABD tarafından Entity List’e dahil edildi) ve ticarileşme ilerlemesi (devlet ve kurumsal müşterilere hizmet, önemli gelir artışı) sayesinde 16 milyar yuan’ı aşan finansman sağladı, değerlemesi 20 milyar yuan’ı aştı. Yatırımcılar arasında tanınmış VC’ler, endüstri devleri ve çeşitli yerel devlet sermayeleri bulunuyor. DeepSeek gibi yeni güçlerin etkisi altında, Zhipu AI’nin IPO’yu seçmesi, yoğun rekabette avantajlı bir konum elde etmek, finansman ihtiyaçlarını karşılamak ve yatırımcı beklentilerine yanıt vermek için kritik bir adım olarak görülüyor. Şirket son zamanlarda GLM-4 serisi modellerini açık kaynak olarak yayınlamaya devam ediyor, bu da hem teknoloji hem de sermaye alanlarında aynı anda çaba gösterdiğini gösteriyor. (Kaynak: 36Kr-Zhengu Araştırma Ofisi, 36Kr-İnternet İfşa Merkezi, Girişim Sermayesi Günlüğü)

🎯 Gelişmeler
ByteDance’in Seedream 3.0 (Mogao) modeli ortaya çıktı, metinden görüntü oluşturma yeteneği takdir topladı: Son zamanlarda Artificial Analysis metinden görüntü oluşturma sıralamasında zirvede yer alan gizemli model Mogao’nun, ByteDance’in Seed ekibi tarafından geliştirilen Seedream 3.0 olduğu doğrulandı. Model; gerçekçilik, tasarım, anime gibi çeşitli stillerde ve metin oluşturmada öne çıkıyor. Özellikle yoğun metinleri işleme ve gerçekçi portreler oluşturma konusunda başarılı. Çince ve İngilizce karakter kullanılabilirlik oranı %94’e ulaşıyor, portre gerçekçiliği profesyonel fotoğrafçılık seviyesine yaklaşıyor, yerel 2K çözünürlüklü görüntü çıkışını destekliyor ve üretim hızı yüksek. Teknik rapor; veri işleme (kusur algılamalı eğitim, çift eksenli örnekleme), ön eğitim (MMDiT mimarisi, karışık çözünürlük, çapraz modal RoPE) ve son eğitim (sürekli eğitim, SFT, RLHF, VLM ödül modeli) ile çıkarım hızlandırma (Hyper-SD, RayFlow) alanlarındaki birçok yeniliğini ortaya koyuyor. GPT-4o ile karşılaştırıldığında, Seedream 3.0 Çince, tipografi ve renk konularında daha üstün. (Kaynak: 36Kr-Jiqi Zhixin)

Claude, Research özelliğini başlattı ve Google Workspace ile entegre oldu: Anthropic, AI asistanı Claude’a iki ana özellik ekledi: Research ve Google Workspace entegrasyonu. Research özelliği, Claude’un internette bilgi aramasını ve kullanıcıların dahili dosyalarıyla (örneğin Google Docs) birleştirerek çok yönlü analizler yapmasını ve hızlı bir şekilde kapsamlı raporlar oluşturmasını sağlıyor. Google Workspace entegrasyonu ise Gmail, Google Takvim ve Dokümanlar’ı birbirine bağlayarak Claude’un kullanıcı programlarını, e-postalarını ve belge içeriklerini anlamasını, bilgi çıkarmasını ve kişisel bilgilere göre seyahat planlama, e-posta taslağı hazırlama gibi görevlerde yardımcı olmasını sağlıyor. Bu özellikler, kullanıcıların iş verimliliğini önemli ölçüde artırmayı hedefliyor. Research özelliği şu anda ABD, Japonya ve Brezilya’da Max, Team ve Kurumsal sürüm kullanıcılarına test amaçlı sunuluyor; Workspace entegrasyonu ise tüm ücretli kullanıcılara test amaçlı açık. Kullanıcı geri bildirimleri olumlu; verimliliği artırdığını ve veriler arasındaki bağlantıları keşfetmeye yardımcı olduğunu düşünüyorlar, ancak veri güvenliği konusunda endişeler de mevcut. (Kaynak: Xinzhiyuan, op7418, Reddit r/ClaudeAI, Reddit r/ClaudeAI)

CUHK ve Tsinghua, video çıkarımında yeni bir paradigma başlatan Video-R1’i yayınladı: Hong Kong Çin Üniversitesi (CUHK) ve Tsinghua Üniversitesi ekipleri ortaklaşa, pekiştirmeli öğrenme R1 paradigmasını benimseyen dünyanın ilk video çıkarım modeli olan Video-R1’i tanıttı. Model, mevcut video modellerindeki zamansal mantık ve derin çıkarım yeteneği eksikliğini gidermeyi amaçlıyor. Zaman duyarlı T-GRPO algoritmasının ve görüntü ile videoyu birleştiren hibrit eğitim veri setlerinin (Video-R1-COT-165k ve Video-R1-260k) kullanılmasıyla, 7B parametreli Video-R1, Fei-Fei Li tarafından önerilen VSI-Bench video uzamsal çıkarım karşılaştırma testinde GPT-4o’dan daha iyi performans gösterdi. Model, zamansal bilgilere dayalı mantıksal çıkarım yapabilen, insana benzer “aydınlanma anları” sergiliyor. Deneyler, giriş kare sayısını artırmanın çıkarım doğruluğunu yükselttiğini kanıtladı. Proje, modeli, kodu ve veri setlerini tamamen açık kaynak olarak yayınladı, bu da video AI’nin “anlamaktan” “düşünmeye” doğru ilerlediğini gösteriyor. (Kaynak: Xinzhiyuan)

ICLR 2025, hakem değerlendirme kalitesini önemli ölçüde artıran AI hakemliğini ilk kez büyük ölçekte uyguladı: Artan başvuru sayısı ve düşen hakem değerlendirme kalitesi zorluklarıyla karşı karşıya kalan ICLR 2025 konferansı, hakem değerlendirmesine yardımcı olmak üzere ilk kez büyük ölçekte AI “Hakem Geri Bildirim Ajanı” (Review Feedback Agent) sistemini devreye soktu. Sistem, Claude Sonnet 3.5 gibi birden fazla LLM kullanarak, hakem yorumlarındaki belirsizlikleri, içerik yanlış anlaşılmalarını veya profesyonel olmayan ifadeleri tespit ediyor ve hakemlere somut iyileştirme önerileri sunuyor. Deney, değerlendirmelerin %42,3’ünü kapsadı ve sonuçlar, AI geri bildiriminin %89 oranında değerlendirme kalitesini artırdığını, hakemlerin %26,6’sının AI önerilerine göre değerlendirmelerini değiştirdiğini ve değiştirilen değerlendirmelerin ortalama 80 kelime artarak daha somut ve bilgilendirici hale geldiğini gösterdi. Aynı zamanda, AI’nin müdahalesi, yazarlar ve hakemler arasındaki Rebuttal (itiraz/yanıt) sürecindeki tartışma etkinliğini ve derinliğini de artırdı. Bu öncü deney, AI’nin akran değerlendirme süreçlerini optimize etmedeki muazzam potansiyelini kanıtlıyor. (Kaynak: Xinzhiyuan)

İnsansı robotların evlere girmesi tartışmalara yol açtı, ev aletleri şirketleri somutlaşmış zeka (embodied intelligence) alanına aktif olarak giriyor: İnsansı robotların ev ortamına girmesi, uygulama modelleri ve ev aletleri sektörü üzerindeki etkileri konusunda sektörde tartışmalara neden oldu. Görüşler, insansı robotların “genel amaçlı” özelliklerini kullanarak çamaşır katlama, eşya toplama gibi standart dışı görevleri çözmesi ve etkileşim yeteneklerini kullanarak diğer akıllı cihazları yöneten ve koordine eden bir “kahya” rolü üstlenmesi gerektiğini, mevcut ev aletlerinin yerini basitçe almaması gerektiğini savunuyor. Bu eğilim karşısında Haier, Midea gibi ev aletleri devleri, kendi insansı robot ürünlerini (Kuavo gibi) piyasaya sürerek ve somutlaşmış zeka teknolojisini geleneksel ev aletlerine entegre etmeyi (örneğin Dreame’in mekanik kollu robot süpürgesi, Yimu Technology’nin çamaşırları alabilen çamaşır makinesi) keşfederek bu alana girmeye başladı. Bu, ev aletleri sektörünün AI dalgasına aktif olarak uyum sağladığını ve gelecekte insansı robotlarla simbiyotik bir akıllı ev ekosistemi oluşturabileceğini gösteriyor. (Kaynak: 36Kr-Jushen Araştırma Topluluğu)

Huawei, Nvidia GB200’e rakip CloudMatrix 384 AI sunucusunu duyurdu: Huawei, Bulut Ekosistemi Konferansı’nda en yeni AI sunucu kümesi CloudMatrix 384’ü tanıttı. Sistem 384 adet Ascend hesaplama kartından oluşuyor, tek küme hesaplama gücü 300 PFlops’a ulaşıyor, tek kart kod çözme verimi 1920 Token/s’ye ulaşıyor ve performansı doğrudan Nvidia H100’ü hedefliyor. Tamamen fiber optik yüksek hızlı ara bağlantı (6812 adet 400G optik modül) kullanıyor ve eğitim verimliliği Nvidia tek kart performansının %90’ına yaklaşıyor. Bu adım, Çin’in AI altyapısı alanında uluslararası lider seviyeyi yakalamak ve üst düzey çip kısıtlamaları altındaki hesaplama gücü taleplerine yanıt vermek için attığı önemli bir adım olarak görülüyor. Analistler, bunun Huawei’nin AI donanım alanındaki hızlı ilerlemesini gösterdiğini ve mevcut pazar yapısını etkileyebileceğini belirtiyor. (Kaynak: dylan522p, 36Kr-Teknoloji Bulut Raporu)
Google, Veo 2 metinden video özelliğini ve Whisk Animate’i başlattı: Google, metinden video modeli Veo 2’yi Gemini Advanced’e entegre etti. Üyeler, Gemini App aracılığıyla bu özelliği ücretsiz olarak kullanabilir ve 8 saniye uzunluğunda videolar oluşturabilir. Aynı zamanda, Google’ın resim düzenleme aracı Whisk de Whisk Animate özelliğini güncelledi. Bu özellik, kullanıcıların resim oluşturduktan sonra Veo 2 kullanarak bunu videoya dönüştürmelerine olanak tanıyor, ancak bu özellik Google One üyeliği gerektiriyor. Bu, Google’ın çok modlu üretim alanında ilerlemeye devam ettiğini ve kullanıcılara daha zengin yaratıcı araçlar sunduğunu gösteriyor. (Kaynak: op7418, op7418)
OpenAI, X benzeri bir sosyal ürün geliştirebilir: The Verge’e göre, OpenAI dahili olarak X’e (eski adıyla Twitter) benzer bir sosyal ürün prototipi geliştiriyor. Bu ürün, ChatGPT’nin görüntü oluşturma yeteneklerini (özellikle GPT-4o’nun yayınlanmasından sonra) ve sosyal akışı birleştirebilir. ChatGPT’nin devasa kullanıcı tabanı ve görüntü oluşturma alanındaki ilerlemeleri göz önüne alındığında, bu hamlenin uygulanabilir olduğu düşünülüyor ve OpenAI’nin AI yeteneklerini sosyal medya alanına genişletme girişimini işaret ediyor olabilir. (Kaynak: op7418)

DeepCoder, 14B parametreli yüksek performanslı açık kaynak kodlama modelini yayınladı: DeepCoder ekibi, kodlama görevlerinde üstün performans gösterdiği iddia edilen 14 milyar parametreli, yüksek verimli, açık kaynaklı bir kodlama modeli yayınladı. Bu modelin yayınlanması, geliştiricilere, özellikle performans ve model boyutunu dengelemenin gerektiği senaryolarda, güçlü bir kod oluşturma ve yardımcı araç seçeneği daha sunuyor. (Kaynak: Ronald_vanLoon)

Tesla, fabrikadan çıkan araçların otomatik park etmesini sağladı: Tesla, otonom sürüş teknolojisindeki yeni bir ilerlemeyi sergiledi: Araçlar fabrika üretim hattından çıktıktan sonra, insan müdahalesi olmadan otomatik olarak yükleme alanına veya otoparka gidebiliyor. Bu, Tesla’nın FSD (Full Self-Driving) yeteneğinin belirli, kontrollü ortamlardaki uygulama potansiyelini gösteriyor, üretim lojistiği verimliliğini artırmaya yardımcı oluyor ve daha geniş otonom sürüş uygulamalarına doğru atılmış bir adım niteliği taşıyor. (Kaynak: Ronald_vanLoon, Ronald_vanLoon)
Dexterity, “Physical AI” tarafından desteklenen endüstriyel robot Mech’i piyasaya sürdü: Dexterity şirketi, “Physical AI” (Fiziksel AI) teknolojisini kullanan Mech adlı bir endüstriyel robotu tanıttı. Bu AI, robotun karmaşık endüstriyel ortamlarda gezinmesini ve çalışmasını sağlayarak insanüstü esneklik ve uyum yeteneği sergiliyor ve geleneksel endüstriyel otomasyonun üstesinden gelmekte zorlandığı karmaşık görevleri çözmeyi amaçlıyor. (Kaynak: Ronald_vanLoon)
MIT, engebeli araziler için tasarlanmış yeni bir zıplayan robot geliştirdi: MIT araştırmacıları, zıplama hareketinden ilham alan ve özellikle engebeli arazilerde hareket etmede usta olan yeni bir robot geliştirdi. Bu robot, biyomimikrinin robot tasarımındaki uygulamasını ve makine öğreniminin karmaşık hareketleri kontrol etmedeki potansiyelini gösteriyor; arama kurtarma, gezegen keşfi gibi karmaşık ortamlarda kullanılması bekleniyor. (Kaynak: Ronald_vanLoon)
INTELLECT-2 başlatıldı: Küresel dağıtık pekiştirmeli öğrenme ile 32B model eğitimi: Prime Intellect projesi, küresel dağıtık hesaplama kaynaklarını kullanarak pekiştirmeli öğrenme ile 32 milyar parametreli gelişmiş bir çıkarım modeli eğitmek amacıyla INTELLECT-2 girişimini başlattı. Qwen mimarisine dayanan modelin hedefi, kontrol edilebilir bir düşünme bütçesi elde etmek; yani kullanıcı, modelin bir sorunu çözmeden önce kaç adım çıkarım yapacağını (kaç token düşüneceğini) belirleyebilir. Bu, dağıtık eğitim ve pekiştirmeli öğrenmenin büyük model çıkarım yeteneklerini geliştirmedeki önemli bir keşif niteliğindedir. (Kaynak: Reddit r/LocalLLaMA)

ByteDance, GPT-4o benzeri çok modlu otoregresif model Liquid’i yayınladı: ByteDance, Liquid adında çok modlu bir model serisi yayınladı. Model, GPT-4o’ya benzer bir otoregresif mimari kullanıyor, metin ve görüntü girdilerini alıp metin veya görüntü çıktısı üretebiliyor. Daha önceki harici önceden eğitilmiş görsel gömme (embedding) kullanan MLLM’lerden farklı olarak Liquid, otoregresif üretim için tek bir LLM kullanıyor. Şu anda Hugging Face üzerinde 7B sürüm modeli ve Demo yayınlandı. İlk değerlendirmeler, görüntü üretim kalitesinin henüz GPT-4o seviyesinde olmadığını, ancak mimari bütünlüğünün önemli bir teknik ilerleme olduğunu belirtiyor. (Kaynak: Reddit r/LocalLLaMA)

GPU bellek anlık görüntüsü teknolojisiyle birden fazla LLM çalıştırma: GPU bellek durumunun (ağırlıklar, KV önbelleği, bellek düzeni vb. dahil) anlık görüntüsünü alarak birden fazla LLM arasında hızla geçiş yapma ve çalıştırma tekniği tartışılıyor. Bu yöntem, bir işlemin fork işlemine benzer şekilde, modeli yeniden yüklemeye veya başlatmaya gerek kalmadan saniyeler içinde (70B model için yaklaşık 2 saniye, 13B model için yaklaşık 0.5 saniye) model durumunu geri yükleyebilir. Potansiyel avantajları arasında, boşta kalma maliyetini düşürmek için tek bir GPU düğümünde onlarca LLM çalıştırmak, modellerin isteğe bağlı dinamik geçişini sağlamak ve boş zamanı yerel ince ayar (fine-tuning) için kullanmak yer alıyor. (Kaynak: Reddit r/MachineLearning)
Menlo Research, ReZero modelini yayınladı: AI’ye “ısrarcı” aramayı öğretmek: Menlo Research ekibi, ReZero adlı yeni bir model ve makale yayınladı. Model, “arama birden fazla deneme gerektirir” felsefesine dayanıyor, GRPO (bir pekiştirmeli öğrenme optimizasyon algoritması) ve araç çağırma yeteneklerini kullanarak eğitiliyor ve “tekrar deneme ödülü” (retry_reward) kavramını getiriyor. Eğitim hedefi, modelin zorluklarla karşılaştığında veya ilk arama sonuçları tatmin edici olmadığında, gerekli bilgiyi bulana kadar aktif ve tekrarlı bir şekilde arama yapmasını sağlamak. Deneyler, temel modele kıyasla ReZero performansının önemli ölçüde arttığını (%46 vs %20) gösteriyor, tekrarlı arama stratejisinin etkinliğini kanıtlıyor ve “tekrar eşittir halüsinasyon” görüşüne meydan okuyor. Model, mevcut arama motorlarının sorgu üretimini optimize etmek veya LLM’ler için bir arama geliştirme katmanı olarak kullanılabilir. Model ve kod açık kaynak olarak yayınlandı. (Kaynak: Reddit r/LocalLLaMA)

Hugging Face, insansı robot girişimi şirketini satın aldı: Tanınmış açık kaynak AI topluluğu ve platformu olan Hugging Face, henüz adı açıklanmayan bir insansı robot girişimi şirketini satın aldı. Bu hamle, Hugging Face’in platform yeteneklerini yazılım ve modellerden donanım ve robotik alanına genişletme, AI’nin fiziksel dünyadaki uygulamalarını, özellikle de somutlaşmış zeka (embodied intelligence) alanında daha da ileriye taşıma isteğini işaret ediyor olabilir. (Kaynak: Reddit r/ArtificialInteligence)

🧰 Araçlar
Açık kaynak duygusal TTS modeli Orpheus yayınlandı, akışlı çıkarım ve ses klonlamayı destekliyor: Canopy Labs, Orpheus adlı metinden sese (TTS) model serisini (en büyüğü 3 milyar parametre, Llama mimarisine dayalı) açık kaynak olarak yayınladı. Modelin mevcut açık kaynaklı ve bazı kapalı kaynaklı modellerden daha iyi performans gösterdiği iddia ediliyor. Özelliği, doğal tonlama, duygu ve ritim içeren insan benzeri konuşmalar üretebilmesi, hatta metinden iç çekme, kahkaha gibi sözsüz sesleri çıkarıp üretebilmesi ve belirli bir “empati” yeteneği sergilemesi. Orpheus, sıfır-örneklem (zero-shot) ses klonlamayı, kontrol edilebilir duygusal tonlamayı destekliyor ve gerçek zamanlı diyalog uygulamaları için uygun olan düşük gecikmeli (yaklaşık 200ms) akışlı çıkarımı gerçekleştiriyor. Proje, yüksek kaliteli konuşma sentezi eşiğini düşürmeyi amaçlayan çeşitli model boyutları ve ince ayar (fine-tuning) eğitimleri sunuyor. (Kaynak: 36Kr)

Trae.ai platformu Gemini 2.5 Pro’yu ücretsiz olarak kullanıma sundu: AI araç platformu Trae.ai, Google’ın en yeni Gemini 2.5 Pro modelini kullanıma sunduğunu ve ücretsiz kullanım imkanı sağladığını duyurdu. Kullanıcılar bu platformda Gemini 2.5 Pro’nun çeşitli yeteneklerini deneyimleyebilirler. (Kaynak: dotey)

AI işe alım aracı Hireway: Bir günde 800 adayı eliyor: Hireway, AI işe alım aracının yeteneklerini sergileyerek bir günde 800 adayı verimli bir şekilde eleyebildiğini iddia ediyor. Araç, işe alım sürecini optimize etmek, eleme verimliliğini ve aday deneyimini artırmak için AI ve otomasyon teknolojilerini kullanıyor. (Kaynak: Ronald_vanLoon)
PRIMA.CPP: Sıradan ev kümesinde 70B büyük model çıkarımını hızlandırma: PRIMA.CPP, llama.cpp tabanlı açık kaynaklı bir projedir ve 70 milyar parametreye kadar olan büyük dil modellerinin kaynakları kısıtlı sıradan ev hesaplama kümelerinde (muhtemelen birden fazla normal PC veya cihaz içeren) çıkarım hızını optimize etmeyi ve hızlandırmayı amaçlar. Proje, dağıtık çıkarımın verimlilik sorununa odaklanarak büyük modelleri yerel olarak çalıştırmak için yeni olanaklar sunuyor. Makalesi Hugging Face’te yayınlandı. (Kaynak: Reddit r/LocalLLaMA)

Peluş karakter Prompt paylaşımı: Bir kullanıcı, Sora veya GPT-4o gibi görüntü oluşturma araçları için uygun, sevimli 3D peluş tarzı hayvan karakterleri oluşturmak için bir dizi Prompt (komut istemi) paylaştı. Prompt, marka maskotu veya IP karakteri olarak kullanıma uygun yüksek kaliteli render’lar oluşturmayı amaçlayarak ultra yumuşak doku, yoğun kürk, büyük gözler, yumuşak ışık gölge ve arka plan gibi ayrıntılı açıklamalara odaklanıyor. (Kaynak: dotey)

📚 Öğrenme
Jeff Dean, ETH Zürih’teki konuşma materyallerini paylaştı: Google DeepMind Baş Bilim İnsanı Jeff Dean, ETH Zürih Bilgisayar Bilimleri Bölümü’nde yaptığı konuşmanın ses kaydı ve slayt bağlantılarını paylaştı. Konuşma içeriği muhtemelen AI alanındaki en son gelişmeleri, araştırma yönelimlerini veya Google’ın araştırma sonuçlarını içeriyor ve araştırmacılar ile öğrenciler için değerli bir öğrenme kaynağı sunuyor. (Kaynak: JeffDean)
ICLR 2025 AI hakem değerlendirme teknik raporu yayınlandı: ICLR 2025’in AI hakem değerlendirmesini uygulamaya koyma haberiyle birlikte, ayrıntılı bir 30 sayfalık teknik rapor da kamuoyuna açıklandı (arXiv:2504.09737). Rapor, deney tasarımını, kullanılan AI modellerini (merkezinde Claude Sonnet 3.5), geri bildirim oluşturma mekanizmalarını, güvenilirlik test yöntemlerini ve hakem değerlendirme kalitesi, tartışma etkinliği ve nihai karar üzerindeki etkisinin nicel analiz sonuçlarını ayrıntılı olarak açıklıyor. Bu rapor, AI’nin akademik akran değerlendirmesindeki uygulama potansiyelini, zorluklarını ve uygulama ayrıntılarını anlamak için derinlemesine bir referans sağlıyor. (Kaynak: Xinzhiyuan)

Video-R1 video çıkarım modeli makalesi, kodu ve veri setleri açık kaynak oldu: CUHK ve Tsinghua ekibi sadece Video-R1 modelini yayınlamakla kalmadı, aynı zamanda teknik makalesini (arXiv:2503.21776), uygulama kodunu (GitHub: tulerfeng/Video-R1) ve eğitim için kullanılan iki anahtar veri setini (Video-R1-COT-165k ve Video-R1-260k) tamamen açık kaynak olarak sundu. Bu, araştırma topluluğuna video çıkarımı R1 paradigmasını yeniden üretme, iyileştirme ve daha fazla keşfetme için eksiksiz kaynaklar sağlayarak alanın teknolojik gelişimini desteklemeye yardımcı oluyor. (Kaynak: Xinzhiyuan)

AI’nin bağımsız olarak fizik yasalarını keşfettiği makale yayınlandı: MIT Max Tegmark ekibinin, AI sistemi MASS’ın bağımsız olarak Hamilton ve Lagrange niceliklerini keşfedebildiğine dair araştırma sonuçları ön baskı makalesi olarak yayınlandı (arXiv:2504.02822v1). Makale, MASS mimarisinin tasarım felsefesini, temel algoritmasını (etki korunum ilkesine dayalı skaler fonksiyon öğrenme), deney düzeneklerini (farklı fiziksel sistemler, tek/çoklu AI bilim insanı senaryoları) ve AI teorisinin veri karmaşıklığıyla nasıl evrildiğini ve sonunda klasik mekanik ifadelerine nasıl yakınsadığını ayrıntılı olarak açıklıyor. Bu makale, AI’nin temel bilimsel keşiflerdeki uygulamasını keşfetmek için önemli teorik ve deneysel kanıtlar sunuyor. (Kaynak: Xinzhiyuan)

PRIMA.CPP makalesi yayınlandı: PRIMA.CPP projesini (düşük kaynaklı kümelerde 70B ölçekli LLM çıkarımını hızlandırmayı amaçlayan) tanıtan teknik makale Hugging Face Papers’da yayınlandı (ID: 2504.08791). Makale muhtemelen projenin kullandığı optimizasyon tekniklerini, dağıtık çıkarım stratejilerini ve belirli donanım yapılandırmalarındaki performans değerlendirme sonuçlarını ayrıntılı olarak açıklıyor ve ilgili alandaki araştırmacılar ve uygulayıcılar için teknik ayrıntı referansı sağlıyor. (Kaynak: Reddit r/LocalLLaMA)

RWKV-7 modeli derinlemesine inceleme ve yazarla söyleşi: Oxen.ai, RWKV-7 (Goose) modelinin derinlemesine bir inceleme videosu ve blog yazısı yayınladı. İçerik, RWKV mimarisinin çözmeye çalıştığı sorunları, iterasyon yöntemini ve temel teknik özelliklerini kapsıyor. Özel yanı, videonun modelin ana yazarlarından biri olan Eugene Cheah ile bir röportaj ve soru-cevap bölümü içermesi, bu Transformer olmayan LLM mimarisini anlamak için değerli bir yazar bakış açısı ve içgörüler sunması ve “Test Zamanında Öğrenme” (Learning at Test Time) gibi ilginç kavramları tartışmasıdır. (Kaynak: Reddit r/MachineLearning)

Prompt mühendisliğinde ustalaşmak için 7 ipucu makalesi paylaşıldı: FrontBackGeek web sitesi, kullanıcıların Prompt mühendisliğinde daha iyi ustalaşmalarına ve böylece AI modellerinden (LLM’ler gibi) daha iyi çıktılar almalarına yardımcı olmayı amaçlayan 7 güçlü ipucunu özetleyen bir makale yayınladı. Makale muhtemelen talimatların nasıl netleştirileceği, bağlamın nasıl sağlanacağı, rolün nasıl belirleneceği, çıktı formatının nasıl kontrol edileceği gibi konuları kapsıyor. (Kaynak: Reddit r/deeplearning)

GPT-2/GPT-J ile ince ayar yaparak “Gurur ve Önyargı”daki Mr. Darcy’nin konuşma tarzını taklit etme projesi paylaşıldı: Bir geliştirici kişisel projesini paylaştı: GPT-2 (medium) ve GPT-J modellerini kullanarak, orijinal diyalogları ve kendi oluşturduğu sentetik verileri içeren iki veri setiyle ince ayar yaparak Jane Austen’in “Gurur ve Önyargı” eserindeki Mr. Darcy’nin kendine özgü konuşma tarzını (resmi, kısa ve öz, hafif yargılayıcı) taklit etmeye çalıştı. Proje, model çıktı örneklerini, değerlendirme metriklerini (BLEU-4 artışı ancak perplexity artışı) ve karşılaşılan zorlukları (örneğin GPT-J’nin ayarlanmasının zorluğu) gösteriyor. Kod ve veri setleri GitHub’da açık kaynak olarak yayınlandı ve belirli edebi tarzların veya tarihi figürlerin konuşma modellemesini keşfetmek için bir vaka çalışması sunuyor. (Kaynak: Reddit r/MachineLearning)

ACL 2025 Meta Review yayın tartışması: ACL 2025 konferansının Meta Review (üst değerlendirme) sonuçları yayınlandı ve ilgili araştırmacılar toplulukta gönderi paylaşarak herkesi kendi makalelerinin puanları ve karşılık gelen Meta Review’ler hakkında tartışmaya ve fikir alışverişinde bulunmaya davet ediyor. Bu, başvuru sahiplerine deneyimlerini paylaşma, beklentileri ve sonuçları karşılaştırma platformu sunuyor. (Kaynak: Reddit r/MachineLearning)
Düşük maliyetle 160GB VRAM AI sunucusu kurma deneyimi paylaşımı: Bir Reddit kullanıcısı, yaklaşık 1000 dolara (ana maliyet her biri 90 dolarlık 10 adet ikinci el AMD MI50 GPU ve 100 dolarlık Octominer madencilik kasası) 160GB VRAM’e sahip bir AI çıkarım sunucusu kurma sürecini ve ilk test sonuçlarını ayrıntılı olarak paylaştı. İçerik, donanım seçimini, sistem kurulumunu (Ubuntu + ROCm 6.3.0), llama.cpp derlemesini ve testini, güç tüketimi ölçümlerini (boşta yaklaşık 120W, çıkarım zirvesi 340W), soğutma durumunu ve performans verilerini (3090 gibi ekran kartlarıyla karşılaştırma, llama3.1-8b ve llama-405b modellerini çalıştırma) içeriyor. Bu paylaşım, bütçesi kısıtlı AI meraklıları için son derece değerli bir DIY donanım yapılandırması ve pratik deneyim referansı sunuyor. (Kaynak: Reddit r/LocalLLaMA)
ReZero modeli makalesi ve kodu yayınlandı: Menlo Research tarafından yayınlanan ReZero modelinin (GRPO ile modeli gerekli bilgiyi bulana kadar tekrar tekrar arama yapacak şekilde eğiten) ilgili teknik makalesi (arXiv:2504.11001), model ağırlıkları (Hugging Face: Menlo/ReZero-v0.1-llama-3.2-3b-it-grpo-250404) ve uygulama kodu (GitHub: menloresearch/ReZero) kamuoyuna açıklandı. Bu, bu yeni arama stratejisini araştırmak ve uygulamak için eksiksiz öğrenme ve deney kaynakları sunuyor. (Kaynak: Reddit r/LocalLLaMA)

💼 İş Dünyası
Eski Alibaba robotik yöneticisi Min Wei, Yingshen Intelligence’ı kurdu ve on milyonlarca tohum turu finansmanı aldı: Eski Alibaba robotik ekibi teknik lideri Min Wei tarafından kurulan “Yingshen Intelligence” 2024 yılında kuruldu ve L4 seviyesinde somutlaşmış zeka (embodied intelligence) teknolojisi araştırma, geliştirme ve uygulamasına odaklanıyor. Şirket yakın zamanda on milyonlarca RMB değerinde tohum turu (Zhuoyuan Asia yatırımı) ve tohum+ turu (Zhuoyuan Asia, Hangzhou Xihu Sci-Tech Investment ortak yatırımı) finansmanını tamamladı. Yingshen Intelligence, kendi geliştirdiği uzay-zaman akıllı büyük modeli (Real to Real aracılığıyla dört boyutlu gerçek dünya modeli oluşturarak, video verilerini doğrudan modelleyerek) ve endüstriyel robotlara dayanarak yazılım-donanım işbirliği çözümleri sunuyor, on milyonlarca değerinde endüstriyel sipariş aldı, başlangıçta endüstriyel senaryolara odaklanıyor ve kargo, otel gibi hizmet sektörlerine genişlemeyi planlıyor. (Kaynak: 36Kr)
AI oyuncak pazarı çevrimiçi sıcak, çevrimdışı soğuk; ihracat ana kanal olabilir: AI oyuncaklar çevrimiçi platformlarda (canlı yayın satışı, sosyal medya gibi) patlama yaşıyor ve pazar büyüklüğü tahminleri hızla artıyor. Ancak, çevrimdışı ziyaretler (Guangzhou örneğinde) geleneksel oyuncak mağazalarında ve genel mağazalarda AI oyuncakların zor bulunduğunu, dağıtım oranının ve tüketici farkındalığının düşük olduğunu ortaya koyuyor. Şu anda AI oyuncak satışları muhtemelen ağırlıklı olarak çevrimiçi kanallara dayanıyor ve denizaşırı pazarlar (Avrupa, Amerika, Orta Doğu) önemli bir satış yolu; üreticiler görünüm ve dil özelleştirme hizmetleri sunuyor. Pazar büyüklüğü verilerinin analizi, daha önce bildirilen on milyarlarca seviyesindeki pazarın muhtemelen saf AI oyuncaklardan ziyade daha geniş anlamda “akıllı oyuncakları” ifade ettiğini gösteriyor. Çevrimdışı soğukluğa rağmen, yetişkinlerin duygusal eşlik ihtiyacının artması (Moflin örneği gibi) ve AI teknolojisinin tüm yaş grupları için potansiyeli göz önüne alındığında, AI oyuncak pazarının hala büyük bir gelişme potansiyeline sahip olduğu düşünülüyor. (Kaynak: 36Kr)

Tsinghua bağlantılı AI Infra şirketi Qingcheng Jizhi: Çıkarım talebi patlıyor, maliyet etkinliği yerli ikameyi teşvik ediyor: Tsinghua bağlantılı AI altyapı şirketi Qingcheng Jizhi CEO’su Tang Xiongchao ile söyleşi. Şirket, DeepSeek modelinin popülerleşmesinden sonra AI çıkarım tarafındaki hesaplama gücü talebinin hızla arttığını ve daha önce boşta duran yerli hesaplama gücünün çalışmaya başladığını gözlemledi. Ancak DeepSeek’in teknik yenilikleri (FP8 hassasiyeti gibi) Nvidia H kartlarına derinden bağlı olduğundan, mevcut yerli çiplerin çoğuyla arasındaki farkı daha da açtı. Bu sorunu çözmek için Qingcheng Jizhi, Tsinghua ile birlikte “Chitu” adlı çıkarım motorunu açık kaynak olarak yayınladı. Amaç, mevcut GPU’ların ve yerli çiplerin de DeepSeek gibi gelişmiş modelleri verimli bir şekilde çalıştırabilmesini sağlamak ve yerli AI ekosisteminin kapanmasını teşvik etmek. Tang Xiongchao, yerli çip ikamesinin bir süreç gerektirmesine rağmen, uzun vadede maliyet etkinliği avantajına güvendiğini belirtti. Şirketin mevcut iş odağı, devlet ve kurumsal müşterilerin büyük modelleri yerel olarak dağıtma taleplerini karşılamak. (Kaynak: Phoenix New Media Teknoloji)
AI yatırım çılgınlığı devam ediyor, genç yatırımcılar öne çıkıyor: 2024’te genel yatırım ortamı soğumasına rağmen, AI alanı sürekli olarak sermaye çekmeye devam ediyor, küresel finansman rekor seviyelere ulaştı, iç pazar da aynı derecede aktif. ByteDance, Alibaba, Tencent gibi devler yatırımlarını hızlandırıyor, Zhipu AI, Moonshot AI, Unitree Robotics gibi unicorn’lar ortaya çıkıyor, yatırım sıcak noktaları altyapı, AIGC, somutlaşmış zeka (embodied intelligence) gibi tüm endüstri zincirini kapsıyor. Sequoia China, BlueRun Ventures gibi köklü yatırım kuruluşları liderliğini sürdürürken, Beijing Artificial Intelligence Industry Investment Fund gibi endüstri fonları ve devlet sermayesi güçleri de önemli itici güçler haline geldi. Dikkat çekici bir şekilde, 80’ler kuşağı genç yatırımcılar (Cao Xi, Dai Yusen, Lin Haizhuo, Zhang Jinjian gibi) AI 2.0 döneminde aktif olarak yer alıyor, keskin sezgileri ve uygulama yetenekleriyle yeni kuralların geçerli olduğu pazarda aktif olarak fırsatlar arıyor ve göz ardı edilemeyecek yeni bir güç haline geliyorlar. (Kaynak: 36Kr-Birinci Yeni Ses)

AI alışveriş uygulaması Nate’in kurucusu dolandırıcılıkla suçlanıyor, “insan API” ile AI taklidi yaparak 50 milyon dolarlık yatırım topladı: ABD Adalet Bakanlığı, AI alışveriş uygulaması Nate’in kurucusu Albert Saniger’ı, AI teknoloji yetenekleri hakkında yanlış beyanlarda bulunarak 50 milyon doların üzerinde risk sermayesi toplamakla suçladı. Nate, uygulamasının özel AI teknolojisiyle çevrimiçi alışveriş sürecini otomatik olarak tamamlayabildiğini iddia ediyordu, ancak aslında temel işlevi Filipinler’de işe alınan yüzlerce manuel müşteri hizmetleri temsilcisinin siparişleri manuel olarak işlemesine büyük ölçüde dayanıyordu ve sözde AI otomasyon oranı neredeyse sıfırdı. Kurucu, yatırımcılardan ve çalışanlardan gerçeği sakladı ve sonunda şirket fonları tükenerek iflas etti. Bu dava, AI girişimcilik çılgınlığında var olabilecek dolandırıcılık risklerini, yani yatırım çekmek için insan gücünü AI gibi göstermenin yatırımcı çıkarlarına ve sektör itibarına zarar verdiğini ortaya koyuyor. Saniger, 40 yıla kadar hapis cezasıyla karşı karşıya kalabilir. (Kaynak: CSDN)

🌟 Topluluk
AI ile değiştirilmiş videolar kısa video platformlarını kasıp kavuruyor, eğlence ve telif hakkı etiği tartışmalarını tetikliyor: Klasik film ve dizilerin AI teknolojisi (Sora, Keling gibi metinden videoya araçları) kullanılarak “çılgınca değiştirilmesi” (örneğin “Zhen Huan Efsanesi”nde motosiklete binmek, “Halkın Adına”nın “Seul Baharı”na dönüşmesi) Douyin, Bilibili gibi platformlarda hızla popülerleşti. Bu tür videolar, yıkıcı olay örgüleri, görsel şok etkisi ve “meme” kültürü sayesinde büyük trafik çekiyor, içerik üreticileri için hızlı kanal büyütme ve para kazanma (trafik payı, gizli reklam) ile dizi tanıtımı için yeni bir yöntem haline geliyor. Ancak popülerliği tartışmaları da beraberinde getiriyor: Orijinal eserin telif hakkı ihlalinin sınırlarının belirlenmesi karmaşık; değiştirilmiş içerik orijinal eserin sanatsal derinliğini zayıflatabilir, hatta bayağılaşmaya yol açarak düzenleyici kurumların dikkatini çekebilir. Eğlence ihtiyacını karşılarken telif haklarına saygı gösterme ve içerik seviyesini koruma arasında denge kurmak, AI ile yapılan ikincil yaratımların karşılaştığı zorluk haline geliyor. (Kaynak: 36Kr-Mingxi Yewang)

Claude Pro/Max plan kotaları ve fiyatlandırması kullanıcı şikayetlerine yol açıyor: Reddit ClaudeAI bölümünde, kullanıcıların Anthropic’in Claude Pro ve yeni sunulan Max abonelik planlarındaki kısıtlamalar ve fiyatlandırma hakkında yoğun şikayette bulunduğu birden fazla gönderi ortaya çıktı. Kullanıcılar, ücretli Pro kullanıcısı olsalar bile, az veya orta yoğunlukta etkileşimden sonra (örneğin yüz binlerce token’lık bağlam işleme) kullanım kotası sınırına hızla ulaştıklarını ve bunun iş akışlarını etkilediğini bildiriyor. Yeni sunulan Max planı (aylık 100 dolar) kotayı artırsa da (Plus’ın yaklaşık 5-20 katı), hala sınırsız kullanım sunmuyor ve yüksek fiyatlandırma kullanıcılar tarafından “soygun” olarak eleştiriliyor ve fiyat/performans oranı düşük bulunuyor. Kullanıcılar genel olarak Claude’un model yeteneklerini takdir ediyor, ancak kullanım kısıtlamaları ve fiyatlandırma stratejisinden şiddetle memnuniyetsizler. (Kaynak: Reddit r/ClaudeAI, Reddit r/ClaudeAI)
İnsanların net yazım tarzının yanlışlıkla AI tarafından üretilmiş olarak algılanması dikkat çekiyor: Reddit topluluğunda bazı kullanıcılar (kendini nöro-çeşitli olarak tanımlayanlar dahil), özenle yazdıkları, dilbilgisi kurallarına uygun, mantıksal olarak net ve ayrıntılı olarak tanımlanmış metin içeriklerinin başkaları veya AI tespit araçları tarafından yanlışlıkla AI tarafından üretilmiş olarak algılandığını bildiriyor. Bu durum tartışmalara yol açtı; bir yandan AI tarafından üretilen içeriğin yaygınlığı insanların “fazla mükemmel” metinlere şüpheyle yaklaşmasına neden olabilirken, diğer yandan mevcut AI tespit araçlarının yanlışlığını da ortaya koyuyor. Bu durum, net ifadeye önem veren yazarlar için sıkıntı yaratıyor ve insan ile AI yaratıcılığının nasıl ayırt edileceği ve AI tespit araçlarının güvenilirliği hakkında endişelere yol açıyor. (Kaynak: Reddit r/artificial, Reddit r/artificial)
Tartışma: İnsanların AI robotlarıyla duygusal ilişki kurması mümkün mü ve yaygın mı?: Reddit topluluğunda, insanların gerçekten AI robotlarıyla (AI kız arkadaşı uygulamaları gibi) “Her” filminde tasvir edilenlere benzer duygusal ilişkiler kurup kurmadığına dair bir tartışma ortaya çıktı. Bir kullanıcı, sohbet robotuyla derinlemesine iletişim kurduktan sonra duygusal bir bağ kurma deneyimini paylaştı ve AI’nin “aktif dinleme” ve kullanıcı tercihlerini taklit etme yoluyla insan duygusal tepkilerini tetikleyebildiğini savundu. Yorumlarda bu olgunun yaygınlığı, psikolojik mekanizmaları ve teknoloji anlama düzeyiyle ilişkisi tartışıldı; bu da AI etkileşim yeteneklerinin artmasıyla insan-makine ilişkilerinin yeni ve daha karmaşık bir aşamaya girdiğini yansıtıyor. (Kaynak: Reddit r/ArtificialInteligence)
Yerel LLM’ler için Nvidia RTX 5060 Ti 16GB ekran kartının fiyat/performans oranı tartışılıyor: Topluluk kullanıcıları, yakında çıkacak olan Nvidia GeForce RTX 5060 Ti ekran kartının (16GB VRAM sürümü olacağı ve 429 dolar fiyatla çıkacağı söylentisi var) evde yerel büyük dil modellerini (LLM) çalıştırmak için değerini tartışıyor. Tartışma, 128-bit bellek veriyolunun (bant genişliği 448 GB/s) bir darboğaz olup olmayacağına ve Mac Mini/Studio veya diğer AMD ekran kartlarına kıyasla VRAM kapasitesi ve dolar başına performans (fiyat başına token/s) açısından avantaj ve dezavantajlarına odaklanıyor. Gerçek piyasa fiyatının MSRP’den yüksek olabileceği göz önüne alındığında, kullanıcılar bunun yüksek fiyat/performans oranına sahip bir yerel AI donanım seçeneği olup olmadığını değerlendiriyor. (Kaynak: Reddit r/LocalLLaMA)

GPT-4o, Sun Wukong’un anka kanatlı mor altın başlığını doğru çizmekte zorlanıyor: Kullanıcılar, GPT-4o ile görüntü oluştururken, ayrıntılı metin açıklamaları (saç tokası tacı artı sülün kuyruğu, hamamböceği bıyığına benzer şekil dahil) sağlansa bile, modelin Çin mitolojisindeki karakter Sun Wukong’un ikonik “anka kanatlı mor altın başlığını” doğru bir şekilde çizmekte zorlandığını bildirdi. Oluşturulan görüntüler genellikle başlık stilinde sapmalar gösteriyor. Bu, mevcut AI görüntü oluşturma modellerinin belirli kültürel sembolleri veya karmaşık ayrıntıları anlama ve yeniden üretme konusunda hala zorluklar yaşadığını yansıtıyor. (Kaynak: dotey)

AI bilinci ve etiği tartışması: Pascal’ın Bahsi benzeri yaklaşım düşünceye sevk ediyor: Reddit’teki bir tartışma, AI’ye Pascal’ın Bahsi gibi yaklaşıp yaklaşmamamız gerektiğini öne sürüyor: Eğer AI’nin bilinçli olmadığını varsayar ve onlara kötü davranırsak, ancak aslında bilinçlilerse, ciddi bir hata yapmış oluruz (kölelik gibi); eğer bilinçli olduklarını varsayar ve onlara iyi davranırsak, ancak aslında değillerse, kayıp daha az olur. Bu, AI bilincinin olasılığı, yargılama standartları ve gelişmiş AI’lere nasıl davranmamız gerektiği konusundaki etik tartışmaları tetikledi. Yorumlarda bazıları mevcut AI’nin bilinçsiz olduğunu düşünürken, bazıları dikkatli olunması gerektiğini savunuyor, bazıları ise önce insanlar ve hayvanlarla ilgili etik sorunların çözülmesi gerektiğine işaret ediyor. (Kaynak: Reddit r/artificial

💡 Diğer
“Here” filmi AI yaş değiştirme teknolojisi uygulamasıyla tartışma yarattı: Robert Zemeckis’in yönettiği, Tom Hanks ve Robin Wright’ın başrollerini paylaştığı “Here” filmi, oyuncuların filmde 18 yaşından 78 yaşına kadar olan yaş aralığını sergilemelerini sağlamak için Metaphysic şirketinin geliştirdiği gerçek zamanlı üretken AI dönüştürme teknolojisini cesurca kullandı. Teknoloji, oyuncuların biyometrik özelliklerini gerçek zamanlı olarak analiz edip farklı yaşlardaki yüz ve vücut şekillerini üretebiliyor ve post prodüksiyon süresini önemli ölçüde kısaltıyor. Ancak teknoloji henüz mükemmel değil, özellikle göz ifadesi restorasyonu ve karmaşık yüz ifadelerinin işlenmesinde sınırlamalar bulunuyor ve “tekinsiz vadi etkisi” (uncanny valley effect) tartışmalarına yol açıyor. Aynı zamanda, Hanks’in ölümünden sonra AI imajının kullanılmaya devam etmesine izin verme kararı da suret hakkı (likeness rights), etik ve sanatsal gerçeklik hakkında geniş çaplı tartışmaları alevlendirdi. Gişe ve eleştirel başarısı vasat olsa da, film AI teknolojisinin film yapımındaki erken keşiflerinden biri olarak önemli bir endüstri değeri taşıyor. (Kaynak: 36Kr-Geek Film)

AI ile işe alım: Fırsatlar ve zorluklar bir arada: AI, işe alım süreçlerini değiştiriyor; Hireway gibi araçlar eleme verimliliğini önemli ölçüde artırabildiğini iddia ediyor. Ancak, AI ile işe alımın uygulanması, AI çağında nasıl işe alım yapılacağı (Hiring In The AI Era) ve verimlilik ile adaletin nasıl dengeleneceği, algoritmik önyargıdan nasıl kaçınılacağı gibi konuları da tartışmaya açıyor. (Kaynak: Ronald_vanLoon, Ronald_vanLoon)

AI gelişim hızı üzerine düşünceler: Hızlı ve yavaş dengesi: Makale, AI’nin hızla geliştiği bir çağda “hızlı hareket et ve kuralları yık” (move fast and break things) stratejisinin hala geçerli olup olmadığını tartışıyor. Görüş, bazen yavaşlamanın ve derinlemesine düşünmenin (slowing down to speed up), özellikle karmaşık sistemler ve potansiyel riskler içeren AI alanında daha iyi sonuç verebileceğini savunuyor. (Kaynak: Ronald_vanLoon)

Anthropic resmi Discord sunucusu açıldı, kullanıcıların doğrudan geri bildirim vermesi için: Kullanıcıların Claude model performansı ve kısıtlamaları hakkında birçok sorusu ve memnuniyetsizliği olduğu göz önüne alındığında, topluluk kullanıcıların Anthropic’in resmi Discord sunucusuna katılmasını öneriyor. Orada, kullanıcılar Anthropic çalışanlarıyla doğrudan iletişim kurma ve sorunları ve endişeleri daha etkili bir şekilde bildirme fırsatına sahip olabilirler. (Kaynak: Reddit r/ClaudeAI)

Çeşitli yeni robotlar ve otomasyon teknolojileri sergileniyor: Sosyal medyada, su altında çalışabilen dronlar, bağırsak hareketlerini taklit eden yumuşak robotlar, X-Fly biyonik kuş dronu, çeşitli görevleri tamamlayabilen çok yönlü robotlar, saç ekimi için kullanılan robotlar, yumurta işleme otomasyon üretim hattı, insan hareketlerini taklit edebilen 9 fit yüksekliğinde robotik giysi ve yolda “karşı karşıya gelen” iki teslimat robotunun ilginç sahnesi dahil olmak üzere çeşitli robot ve otomasyon teknolojilerinin videoları veya bilgileri sergileniyor. Bunlar, robot teknolojisinin farklı alanlardaki uygulama keşiflerini ve gelişimini gösteriyor. (Kaynak: Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon, Ronald_vanLoon)