Google DeepMind CEO’su Demis Hassabis, yapay zeka alanında yeni bir dönemi işaret eden önemli açıklamalarda bulundu. Hassabis, LinkedIn kurucu ortağı Reid Hoffman’ın sunduğu “Possible” adlı podcast programına katılarak, Google’ın yapay zeka teknolojileriyle ilgili gelecekteki planlarını ve stratejilerini paylaştı. Hassabis’in açıklamalarına göre Google, mevcut yapay zeka modelleri olan Gemini ile video oluşturma aracı Veo’yu entegre etmeyi planlıyor.
“Çok Modlu” Yapay Zeka Vizyonu
Hassabis’in ifadelerine göre, Google’ın Gemini modeli başından itibaren çok modlu bir yapıda tasarlandı. Bu, modelin sadece metin, görsel ve ses gibi farklı medya türlerini değil, aynı zamanda video verilerini de işleyebilmesi anlamına geliyor. Google’ın hedefi, yapay zekanın daha geniş bir medya yelpazesinde çalışabilen ve farklı türdeki verileri bir arada anlayıp sentezleyebilen bir yapıya kavuşması. Hassabis, bu hedefin altında yatan düşünceyi şu şekilde dile getirdi: “Amacımız, evrensel bir dijital asistan yaratmak; gerçek dünyada insanların ihtiyaçlarına yönelik yardımcı olabilecek bir yapay zeka.”
Bunun yanı sıra, son yıllarda yapay zeka endüstrisi “omni modelleri” olarak adlandırılan, çok sayıda medya türünü birleştirebilen yapay zeka sistemlerine doğru bir yönelim gösteriyor. OpenAI’nin ChatGPT’sinin son güncellemeleriyle görsel üretme kapasitesine kavuşması, Amazon’un ise yıl içinde benzer bir “her şeyden her şeye” dönüştürebilen bir yapay zeka modeli piyasaya sürmeyi planlaması, bu alandaki gelişmelerin göstergelerinden sadece birkaçı.
YouTube Verileriyle Eğitim
Google’ın yeni yapay zeka stratejisinin temelini oluşturan veri kaynağı ise, dünya çapında milyarlarca videoyu barındıran YouTube platformu. Hassabis, Gemini ve Veo entegrasyonunu açıklarken, video verilerinin çoğunun YouTube’dan sağlandığını belirtti. Özellikle, “Veo 2” modelinin video verilerini analiz ederek dünyanın fiziksel yasalarını daha iyi anlayabildiğine dikkat çekti. Hassabis’in açıklamasına göre, “Veo 2, YouTube videolarını izleyerek çok sayıda video aracılığıyla fiziksel dünyayı çözebiliyor.”
Bununla birlikte, Google, YouTube içerik oluşturucularıyla yaptığı anlaşmalar kapsamında, içeriklerin bazılarına yönelik eğitim süreçlerini de genişletti. Geçtiğimiz yıl yapılan değişiklikler doğrultusunda, bu içeriklerle yapay zeka modellerinin eğitilmesi sağlanarak, daha geniş veri yığınları oluşturulması hedeflendi. Hassabis’in vurguladığına göre, video verileri, yapay zekanın fiziksel dünyayı anlamasında önemli bir rol oynuyor.
Yeni Nesil Yapay Zeka: Sentezleme ve Anlayış
Google’ın Gemini modelinin bu çoklu veri türlerini işleme kapasitesi, yapay zekanın sadece daha verimli hale gelmesini sağlamakla kalmıyor, aynı zamanda daha derinlemesine bir anlayış geliştirmesine de olanak tanıyor. Hassabis, yapay zekanın “sentezleme” yeteneği üzerinde de durarak, “Bu çoklu modlu yapılar, yalnızca tek bir medya türüne odaklanmak yerine, birden fazla kaynaktan gelen bilgileri bir araya getirebiliyor” dedi.
Bu yaklaşım, Google’ın yapay zeka alanındaki hedeflerinden birini gerçekleştirmeyi amaçlıyor: daha geniş ve kapsamlı bir dijital asistan yaratmak. Yani, Gemini’nin sadece metin tabanlı sorulara cevap vermekle kalmaması, aynı zamanda kullanıcıların görsel, sesli ve video temelli taleplerine de yanıt verebilecek bir yapıya dönüşmesi bekleniyor. Bu, dijital asistanların sadece bilgi sağlamakla kalmayıp, aynı zamanda daha doğal, daha anlamlı ve etkili bir etkileşim deneyimi sunmasını sağlayacak.
Rekabetin Hızla Artması
Google, yapay zeka alanındaki bu yenilikçi adımlarla, sektördeki rekabeti hızlandırmaya devam ediyor. OpenAI, ChatGPT’nin yeni sürümleriyle görsel üretim yeteneği eklerken, Amazon’un da benzer bir model geliştirmesi bekleniyor. Google’ın bu hamlesi, sadece rakiplerinden öne geçmek değil, aynı zamanda endüstrinin evriminde önemli bir rol oynamak için kritik bir adım olarak görülüyor.
Sonuç olarak, Google’ın yapay zeka alanındaki yenilikçi vizyonu, kullanıcı deneyimini dönüştürme ve dijital asistanları çok daha kapsamlı hale getirme amacını taşıyor. Gemini ve Veo’nun entegrasyonu, yapay zekanın gelecekte nasıl daha güçlü, daha çok yönlü ve kullanıcı dostu olacağını gösteriyor. Bu gelişmeler, sadece teknoloji dünyasını değil, günlük hayatımıza entegre olacak yapay zeka uygulamalarını da derinden etkileyebilir.