DeepSeek'in yapay zeka maliyetinin 5,5 milyon doları aştığı iddia ediliyor, 50.000 Nvidia GPU ile 1,6 milyar dolara ulaşmış olabilir.
Çin'in DeepSeek'i, 2.048 Nvidia H800'de katkısıyla ve 5.500 milyon dolara mal olmasına rağmen OpenAI'nin o1'iyle rekabet ettiği söylenen R1 modelinin piyasaya sürülmesiyle milyarlarca dolarlık AI sektörünü kaosa sürükledi. Ancak yeni bir rapor, firmanın katlandığı gerçek maliyetlerin 1,6 milyar dolar olduğunu ve DeepSeek'in yaklaşık 50.000 Hopper GPU'ya erişebildiğini iddia ediyor.
DeepSeek'in yapay zekaya yatırım yapan büyük teknoloji şirketlerinin ihtiyaç duyduğu kaynakların çok daha azını kullanarak R1'i eğitebildiği iddiası, Nvidia'nın hisse senedi fiyatından bir günde rekor kıran 600 milyar doları sildi. Çinli girişim, Team Green'in en güçlü yapay zeka GPU'larına milyarlar harcamadan bu kadar güçlü bir model üretebildiyse, diğer herkesi bunu yapmaktan alıkoyan ne olurdu?
Peki DeepSeek, Apple App Store listelerinde hala zirvede olan Uzman Karışımı modelini gerçekten de bu kadar düşük bir maliyetle mi yarattı? Semi Analysis, bunun doğru olmadığını iddia ediyor.
Piyasa istihbarat firması, DeepSeek'in 10.000 H800 ve 10.000 H100 dahil olmak üzere yaklaşık 50.000 Hopper GPU'ya erişimi olduğunu yazıyor. Ayrıca Çin'e özgü çok daha fazla H20 siparişi var. GPU'lar, DeepSeek'in arkasındaki niceliksel hedge fonu High-Flyer ve startup arasında paylaşılıyor. Birkaç coğrafi konuma dağıtılmış durumdalar ve ticaret, çıkarım, eğitim ve araştırma için kullanılıyorlar.
Örnek olarak Anthropic'in Claude 3.5 Sonnet'inin eğitimi onlarca milyon dolara mal oldu, ancak şirketin yine de Google ve Amazon'dan milyarlarca dolarlık yatırım alması gerekiyordu. DeepSeek'in tüm yeteneklerini yalnızca Çin'den sağladığı belirtiliyor. Bu, Huawei gibi diğer Çinli teknoloji şirketlerinin , TSMC'nin Tayvanlı çalışanlarının çok aranan hedefler olduğu denizaşırı ülkelerden işçi almaya çalıştığına dair raporlarla çelişiyor. DeepSeek'in gelecek vaat eden adaylara 1,3 milyon doların üzerinde maaş teklif ettiği iddia ediliyor, bu rakip Çinli AI şirketlerinin ödediğinden çok daha fazla.
DeepSeek ayrıca, harici bulut sağlayıcılarına güvenmek yerine çoğunlukla kendi veri merkezlerini çalıştırma avantajına sahiptir. Bu, AI ürün yığınında daha fazla deney ve inovasyona olanak tanır. Semi Analysis, Meta'nın Lama çabası, Mistral ve diğerlerini geride bırakarak bugünün en iyi laboratuvarı olduğunu yazıyor.