Site icon TechInside

DeepSeek eğitim maliyeti söylendiği gibi değilmiş!

DeepSeek eğitim

Araştırma DeepSeek’in yapay zeka eğitim maliyetinin 6 milyon dolar değil, 1.3 milyar dolar olduğunu ortaya koyuyor. Dolaşımda olan en önemli iddialardan biri, DeepSeek V3’ün yaklaşık 6 milyon dolarlık bir eğitim maliyetine neden olduğudur. Bağımsız bir araştırma şirketi olan SemiAnalysis, son raporunda yapay zeka dünyasının yükselen oyuncularından DeepSeek’i mercek altına aldı.

DeepSeek eğitim maliyetinde hangi giderler var?

SemiAnalysis, DeepSeek’in maliyetlerini çevreleyen bazı yaygın anlatılara meydan okuyor ve bunları pazardaki rakip teknolojilerle karşılaştırıyor. Dolaşımda olan en önemli iddialardan biri, DeepSeek V3’ün yaklaşık 6 milyon dolarlık bir eğitim maliyetine neden olduğudur. Ancak SemiAnalysis raporu, bu rakamı yapısöküme uğratmakta ve birkaç kritik faktörü hesaba katmadığını belirtmektedir.

6 milyon dolarlık tahmin öncelikle GPU’nun eğitim öncesi masraflarını dikkate almakta, araştırma ve geliştirme, altyapı ve şirkete tahakkuk eden diğer temel maliyetlere yapılan önemli yatırımları göz ardı etmektedir. Rapor, DeepSeek’in toplam sunucu sermaye harcamalarının (CapEx) 1,3 milyar dolar gibi şaşırtıcı bir rakama ulaştığını vurguluyor.

Bu mali taahhüdün büyük bir kısmı, hesaplama gücünün bel kemiği olan kapsamlı GPU kümelerinin işletilmesine ve bakımına yöneliktir. DeepSeek’in yaklaşık 50.000 Hopper GPU’ya erişimi olduğu bildiriliyor ve bu da sektörde bazı yanlış anlamalara yol açıyor. SemiAnalysis, bazılarının daha önce çıkardığı gibi bunun 50.000 H100’e sahip olmak anlamına gelmediğini açıklığa kavuşturuyor.

Bunun yerine, GPU envanteri H800’ler, H100’ler ve NVIDIA tarafından ABD ihracat kısıtlamalarına yanıt olarak üretilen ülkeye özgü H20’ler dahil olmak üzere çeşitli modellerden oluşmaktadır. Donanım envanterine ilişkin bu incelikli anlayış, DeepSeek’teki kaynak bulma ve operasyonel verimlilik konusundaki stratejik kararların altını çiziyor. Raporun dikkate değer bir yönü de DeepSeek’in organizasyon yapısını yansıtmasıdır. Bazı büyük YZ laboratuvarlarının aksine, DeepSeek veri merkezlerini işletiyor ve çeviklik ve verimliliğine yardımcı olan modern bir model kullanıyor. YZ ortamı giderek daha rekabetçi hale geldikçe, bu hızlı uyum sağlama yeteneği hayati bir varlık haline geliyor.

Exit mobile version