Dünya’nın En Ciddi A/B Testi

Tarih

GPT-3.5 ile değişen hayatımız Aralık 2024’te DeepSeek V3 ile ve Ocak 2025’te DeepSeek R1 ile tekrar değişti. GPT-4 ve Claude 3.5 ile yarışan bu modeller hem çok daha düşük bir maliyet ile eğitilmiş hem de açık kaynaklıydı. DeepSeek uygulaması App Store’da hızla bir numaraya yükseldi ve 27 Ocak günü NVIDIA %17 (589 milyar dolar) değer kaybetti. Diğer teknoloji şirketlerinin kayıplarıyla birlikte bu neredeyse 1 trilyon dolarlık bir düşüş oldu.
Ama değişim bununla sınırlı kalmadı, hem DeepSeek’in yayınladığı araştırmalar hem de elde ettikleri başarı diğer Çin şirketlerini de ciddi rakipler olarak yarışa kattı. Alibaba’nın şu an 100’ün üstünde açık kaynaklı yapay zeka modeli var. Ocak 2026 itibariyle Qwen modellerinin HuggingFace platformunda indirilme sayısı Meta’nın Llama modellerinin indirilme sayısını geçti. Hatta şu anda HuggingFace’e eklenen sonradan eğitilmiş modellerin %40’ı Qwen temelli, ancak sadece %15’i Llama kullanıyor. Bunda son açık kaynaklı model geliştirmeye çalışan Meta’nın da bu yoldan dönmüş olması ve son çıkardıkları Llama modellerinin yerel cihazlarda çalışamayacak kadar büyük olmasının da şüphesiz etkisi var.
ByteDance ise sadece Çin’de en çok kullanılan chatbot olan Doubao’yu çıkarmadı, dünyanın en iyi video yaratma modellerinden biri olan Seedance 2.0’ı da ortaya koydular. Kimi K2 ile meşhur olan Moonshot AI ise “Ajan Sürüsü” kavramını sektöre kazandırdı. 100 taneye kadar ajan büyük bir görev için paralel çalışarak görev süresini neredeyse beşte bire indirmeyi başardı. ERNIE modelinin başarısıyla bilinen Baidu da bu akımdan nasibini aldı ve 2025 ortasında modellerini dünya ile paylaşarak açık kaynak yaptı. ERNIE 5.0 otuz bin Kunlun P800 çipi kullanılarak eğitildi ve sadece Çin menşeili çipler kullanılarak eğitilen ilk büyük Çin modeli oldu.
Çip ithalat bariyerleri sebebiyle çip sıkıntısı yaşayan şirketler için de bu önemli bir örnek arz etmiştir. Çok büyük bir hevesle beklenen DeepSeek R2 modeli de çipler ile ilgili problemlerden dolayı aylarca gecikti. İlk başta sadece Çin çipleri ile yapılması planlanan eğitim sekteye uğrayınca şirket planlarında revizyona gitti ve eğitim için NVIDIA çiplerini kullanmaya devam etti, ancak çıktı oluştururken Huawei çiplerini kullanmaya başladı.
Bu da Çin-Amerika ithalat ve kullanım politikalarının bir neticesidir. İlk başta çip ithalat kısıtlamaları ile başlayan bu yerel alternatif arayışı sonradan yumuşayan sınırlarla yok olmadı. Aksine Çin hükümetinin teşviki ile hız kazandı. Yakın zamanda SMIC, 5 nanometrelik işlemcileri toplu olarak üretme kapasitesine ulaştı. Şimdi ise 3 nanometrelik işlemcileri bu yıl içerisinde piyasaya sürebilmeye çalışıyor. Huawei ise önümüzdeki yıllarda bu işlemcileri ile katlanarak artan işlem gücüne sahip çipler üretmeyi planlıyor.
DeepSeek, mevcut Huawei Ascend 910 çiplerin NVIDIA H100 çiplerin performansının %60’ına ulaştığını tespit etti. Huawei’nin sağladığı yazılımlar da çeşitli operasyonel zorluklara yol açmakta. Ama bu çip sektörüne olan ilgiyi azaltmıyor, aksine art arda halka arz edilen Çin çip sektörünün büyüklüğü 186 milyar doları aştı.
Yapay Zeka, Çin hükümetinin öncelikli meselelerinden biri. 15. Beş Yıllık Plan’da yapay zeka terimi tam 52 kere kullanılmış ve “Yapay Zeka+ Aksiyon Planı” isimli bir bölüm sadece bu konuya ayrılmış. Bütçe planlamasında da bilim ve teknolojiye ayrılan dilim %10 büyüyerek 62 milyar dolara çıkmıştır. Önemli sektörlerde yapay zeka nüfuzunu 2027 yılına kadar %70’e ve 2030’a kadar da %90’a çıkarmayı hedefi belirlenmiştir.
Amerika ve Çin, yapay zeka yarışında neredeyse taban tabana zıt bir yaklaşım belirlemiş bulunuyorlar. Tabii ki bu yaklaşımların da her iki taraf için sonuçları oluyor. Anthropic ve OpenAI gibi şirketler gelirlerinin önemli bir kısmını kurumsal müşterilerinden sağlıyorlar, Çin şirketleri ve onların modelleri ise bu arenada onlarla kolay kolay rekabet edemiyorlar. Çin şirketleri ise modellerinin bireysel kullanımından önemli derecede kazanç sağlıyorlar. Alibaba açık kaynak model kullanımının sağladığı bulut kullanımından da ayrı bir gelir kapısına kavuştu. Qwen 3.5 201 tane dilde çalışabiliyor, Amerika şirketlerinin geliştirdiği modeller yaklaşık 140 tane dilde çalışıyor. Bu 60 dilde konuşan insanlar, bir sonraki gündem olan model dillerini eklese bile ilk Qwen’in onları dahil ettiğini kolay kolay unutmayacaklardır. Çünkü teknoloji çağında insanlar için belki de en önemli olan şey görülmek.

CEVAP VER

Lütfen yorumunuzu giriniz!
Lütfen isminizi buraya giriniz

Sosyal Medyada Paylaş

Popüler Yazılar

Bunları da sevebilirsiniz
Bunları da sevebilirsiniz

Zorbalar neden hızlı yükselir?

Bunu birçok beyaz yaka bilir ama yüksek sesle söylemez....

Akan suda durup hayata dokunmayı bilebilmek

Lucius Annaeus Seneca derki "Nehir üzerinde akıp giden saman...

Yeni dünya düzeninde ayakta kalmanın sırrı: Çınar gibi değil, bambu gibi olabilmek

Son aylarda haberleri açtığında hissettiğin o sıkışmayı biliyorsun. Bir...

Üretimin temel taşı insan: Krizde ilk feda edilen mi, ilk korunan mı olmalı?

Günümüzde yapay zeka, robotik teknolojiler ve dijital dönüşüm baş...