Çinli DeepSeek, OpenAI’nin ChatGPT’sine Rakip Oluyor: Yapay Zeka Savaşında Yeni Dönem

Çinli yapay zeka laboratuvarı DeepSeek, kendi adını taşıyan büyük dil modeli (LLM) ile, ‘li OpenAI’nin ‘sine güçlü bir rakip olarak öne çıkmayı başardı. Bu ay yayınlanan DeepSeek, hem kullanıcılar hem de profesyonellerinin dikkatini çekti.

OpenAI ve gibi önde gelen şirketlerin yapay zeka modellerine verisi sağlayan ScaleAI’nin CEO’su Alexandr Wang, geçtiğimiz Perşembe günü İsviçre’nin Davos şehrinde düzenlenen ‘nda (), DeepSeek’i “dünyayı sarsacak bir model” olarak nitelendirdi.

DeepSeek, ilk modelinin ardından güçlü muhakeme yeteneğine odaklanan DeepSeek-R1 adlı bir model daha piyasaya sürdü. Bu model, OpenAI’nin yakın zamanda tanıttığı GPT-4 tabanlı o1 ile rekabet ediyor. Wang, “DeepSeek’in en iyi performans gösteren modellerinin, ABD’nin en iyi yapay zeka modelleriyle aynı seviyeye ulaştığını gördük,” dedi. Wang ayrıca, ABD ile Çin arasındaki rekabetin bir “yapay zeka savaşı”na dönüştüğünü belirterek, Çin’in yapay zeka çip devi Nvidia’dan daha fazla kaynağa sahip olduğuna inandığını ifade etti.

Wang, yapay zeka sektörünün büyüklüğünün 1 trilyon dolara ulaşacağına inandığını vurguladı. “ABD’nin büyük miktarda hesaplama gücüne ve altyapıya ihtiyacı olacak. Bu yapay zeka patlamasını mümkün kılmak için Amerika’nın enerjisini serbest bırakması gerekiyor,” dedi.

DeepSeek ve Öne Çıkan Çalışmaları

DeepSeek, Çin merkezli bir yapay zeka araştırma şirketidir ve özellikle dil modelleri geliştirme konusunda uzmanlaşmıştır. Şirket, 2023 yılında Liang Wenfeng tarafından kuruldu ve o zamandan beri yapay genel zeka (AGI) alanında önemli adımlar ıştır.

OpenAI’nin ChatGPT’sine rakip olarak öne çıkan DeepSeek, güçlü dil işleme ve muhakeme yetenekleri ile dikkat çekmektedir. Şirket, ilk modelini piyasaya sürdükten sonra, daha gelişmiş bir model olan DeepSeek-R1’i tanıtarak sektördeki rekabeti kızıştırmıştır.

DeepSeek, büyük veriler ve derin öğrenme tekniklerini kullanarak, insan benzeri metin üretimi, anlam çıkarımı ve çeşitli görevlerde yüksek performans sergileyen yapay zeka modelleri geliştirmektedir. Şirketin modelleri, özellikle güçlü muhakeme yetenekleri ve dil anlama kapasitesi ile öne çıkmaktadır.

Çinli devi, yapay zeka araştırmaları alanındaki hızlı gelişimleriyle dikkat çekmekte ve küresel ölçekte, özellikle ABD ile yapay zeka alanında büyük bir rekabetin içine girmektedir. DeepSeek’in geliştirdiği modeller, dünyanın önde gelen yapay zeka platformları ve endüstri uzmanları tarafından oldukça ilgi görmektedir.

DeepSeek’in en dikkat çekici projelerinden biri, 671 milyar parametreye sahip olan ve yalnızca 2.048 Nvidia H800 GPU kullanarak iki ayda eğitilen DeepSeek-V3 modelidir. Bu model, rakiplerine kıyasla 11 kat daha az GPU hesaplama gücüyle eğitilerek, açısından önemli bir başarıya imza atmıştır.

Şirket, DeepSeek-V3 modelini açık kaynak olarak sunarak, kodlama, çeviri ve metin yazma gibi görevlerde yüksek performans sergilemektedir. Bu model, 14.8 trilyon jetondan oluşan bir veri kümesi üzerinde eğitilmiş ve 685 milyar parametreye sahiptir.

DeepSeek, araştırma odaklı bir yaklaşım benimsemekte olup, henüz ticari faaliyetlere yönelik belirgin bir planı bulunmamaktadır. Şirket, yapay zeka alanında daha fazla yenilik ve gelişim için çalışmalarını sürdürmektedir.