Yeni bir yapay zeka lideri doğdu: Ai2’nin Tulu 3 405B modeli, DeepSeek V3 ve GPT-4o’yu geride bıraktı

Microsoft’un kurucu ortağı Paul Allen tarafından kurulan Allen Yapay Zeka Enstitüsü (Allen Institute for AI, kısa adıyla Ai2), yapay zeka dünyasında dengeleri değiştirecek yeni modelini duyurdu. Tulu 3 405B adlı model, yalnızca Çinli DeepSeek’in önde gelen yapay zeka sistemlerinden biri olan DeepSeek V3’ü değil, aynı zamanda OpenAI’nin güçlü modeli GPT-4o’yu da belirli kıyaslamalarda geride bıraktı. Dahası, rakiplerinin aksine tamamen açık kaynaklı olmasıyla dikkat çekiyor.

Yapay Zeka Yarışında Yeni Bir Dönüm Noktası

Günümüzde yapay zeka geliştirme alanında en büyük rekabet, daha güçlü, daha verimli ve daha erişilebilir modeller üretmek üzerine kurulu. 2014 yılında kurulan Seattle merkezli Ai2, Tulu 3 405B modelini tanıtarak bu rekabette önemli bir adım attı. Yapay zeka dünyasında önemli bir oyuncu olan DeepSeek’in en gelişmiş modeli olan DeepSeek V3’ü geride bıraktığını açıklayan Ai2, Tulu 3 405B’nin, GPT-4o dahil birçok lider modelden daha iyi performans gösterdiğini iddia ediyor.

Ancak bu modeli farklı kılan sadece performansı değil. Ai2, Tulu 3 405B’yi tamamen açık kaynaklı olarak sundu. Bu, modelin sıfırdan yeniden üretilebilmesi için tüm bileşenlerinin özgürce erişilebilir ve izin verici bir lisans altında yayınlandığı anlamına geliyor. Açık kaynaklı yapay zeka modelleri, araştırmacılar ve geliştiriciler için büyük bir avantaj sağlarken, kapalı sistemler üzerinde çalışan büyük teknoloji devlerine karşı da güçlü bir alternatif oluşturuyor.

Tulu 3 405B’nin Gücü Nereden Geliyor?

Tulu 3 405B, 405 milyar parametreye sahip devasa bir model. Parametre sayısı, bir yapay zeka modelinin karmaşıklığını ve öğrenme kapasitesini belirleyen en kritik faktörlerden biri. Daha fazla parametre, genellikle daha güçlü bir model anlamına gelir. Ai2, bu modeli eğitmek için 256 paralel GPU (grafik işlem birimi) kullanıldığını belirtiyor.

Başarısının ardındaki en büyük faktörlerden biri ise “Doğrulanabilir Ödüllerle Takviyeli Öğrenme” (Reinforcement Learning on Verifiable Rewards, RLVR) adlı gelişmiş bir eğitim yöntemi. Bu teknik, modelin yalnızca doğru yanıtları öğrenmesini sağlamakla kalmıyor, aynı zamanda matematik problemlerini çözme ve karmaşık talimatları anlama yeteneğini de artırıyor.

Benchmark Testlerinde Zirveye Ulaşan Model

Tulu 3 405B’nin gücü, somut test sonuçlarıyla da kanıtlanıyor. Model, yapay zeka kıyaslamalarında çarpıcı bir performans sergiledi:

  • PopQA Testi: Wikipedia tabanlı 14.000 uzmanlık sorusundan oluşan bu testte, Tulu 3 405B yalnızca DeepSeek V3 ve GPT-4o’yu değil, aynı zamanda Meta’nın Llama 3.1 405B modelini de geçti.
  • GSM8K Testi: İlkokul düzeyinde matematik problemlerinden oluşan bu testte, Tulu 3 405B sınıfındaki tüm modeller arasında en yüksek skoru elde etti.

Bu sonuçlar, Tulu 3 405B’nin sadece güçlü bir dil modeli olmanın ötesinde, karmaşık problem çözme yeteneklerinde de öne çıktığını gösteriyor.

ABD’nin Açık Kaynaklı Yapay Zeka Liderliği Güçleniyor

Ai2’ye göre bu modelin piyasaya sürülmesi, ABD’nin rekabetçi ve açık kaynaklı yapay zeka geliştirmede küresel liderlik iddiasını güçlendiren önemli bir adım. Ai2 yetkilileri, “Bu dönüm noktası, ABD’nin büyük teknoloji devlerinden bağımsız bir şekilde, açık kaynaklı ve güçlü yapay zeka modelleri geliştirebileceğini gösteriyor” açıklamasında bulundu.

Özellikle Çin merkezli DeepSeek gibi firmaların giderek güçlendiği bir dönemde, Ai2’nin hamlesi ABD’nin yapay zeka yarışındaki konumunu yeniden şekillendirebilir. Açık kaynaklı yapay zeka modellerinin daha fazla benimsenmesi, rekabetin ve inovasyonun önünü açarken, büyük teknoloji şirketlerinin tekeline karşı bir denge unsuru oluşturabilir.

Tulu 3 405B’yi Test Etmek Mümkün

Ai2, Tulu 3 405B’yi bir chatbot web uygulaması aracılığıyla herkesin test edebileceğini duyurdu. Ayrıca, modelin eğitiminde kullanılan tüm kodlar GitHub ve Hugging Face platformlarında araştırmacıların erişimine sunuldu.

Teknoloji dünyasında her an yeni rekorlar kırılabilir, ancak şu an itibarıyla yapay zeka dünyasının yeni şampiyonu Tulu 3 405B gibi görünüyor.