Dom Aktualności Deepseek AI Development kosztuje 1,6 miliarda dolarów, obalając mit przystępności cenowej

Deepseek AI Development kosztuje 1,6 miliarda dolarów, obalając mit przystępności cenowej

by Jason Apr 21,2025

Jest jednak nadal tańszy niż jego konkurenci.

Nowy chatbot z Deepseek przedstawił mi ten opis:

Cześć, zostałem stworzony, abyś mógł zapytać o wszystko i uzyskać odpowiedź, która może cię nawet zaskoczyć.

Dzisiaj sztuczna inteligencja opracowana przez Deepseek pojawiła się jako potężny konkurent na rynku, przyczyniając się do jednego z największych spadków cen akcji w NVIDIA.

Test Deepseek Zdjęcie: engame.com

Tym, co wyróżnia ten model, to jego innowacyjna architektura i metody szkolenia. Zawiera kilka zaawansowanych technologii:

Prognozowanie wielu tokenów (MTP): Zamiast przewidywać jedno słowo na raz, model prognozuje wiele słów jednocześnie poprzez analizę różnych części zdania. Podejście to znacznie poprawia zarówno dokładność, jak i wydajność modelu.

Mieszanka ekspertów (MOE): Architektura ta wykorzystuje różne sieci neuronowe do przetwarzania danych wejściowych. Przyspiesza szkolenie AI i poprawia wydajność. W Deepseek V3 zastosowano 256 sieci neuronowych, przy czym osiem jest aktywowanych dla każdego zadania przetwarzania tokenu.

Utrzymująca uwaga wielowłócona (MLA): Ten mechanizm koncentruje się na najważniejszych częściach zdania. MLA wielokrotnie wyodrębnia kluczowe szczegóły z fragmentów tekstu, zmniejszając prawdopodobieństwo braku ważnych informacji. W rezultacie AI jest bardziej biegły w rejestrowaniu kluczowych niuansów w danych wejściowych.

Wybitny chiński startup Deepseek twierdzi, że opracował konkurencyjny model AI przy minimalnych kosztach, stwierdzając, że wydali tylko 6 milionów dolarów na szkolenie potężnej sieci neuronowej Deepseek V3 i zastosowali zaledwie 2048 procesorów graficznych.

Deepseek v3 Zdjęcie: engame.com

Jednak analitycy z semianalizy ujawnili, że Deepseek prowadzi dużą infrastrukturę obliczeniową obejmującą około 50 000 GPU Nvidia Hopper. Obejmuje to 10 000 jednostek H800, 10 000 bardziej zaawansowanych H100 i dodatkowe partie H20 GPU. Zasoby te są dystrybuowane w kilku centrach danych i są wykorzystywane do szkolenia AI, badania i modelowanie finansowe.

Całkowita inwestycja Spółki w serwerach wynosi około 1,6 miliarda dolarów, a wydatki operacyjne szacują na 944 mln USD.

Deepseek jest spółką zależną chińskiego funduszu hedgingowego High-Flyer, która odrzuciła start-upa jako odrębny podział koncentrujący się na technologiach AI w 2023 r.. W przeciwieństwie do większości startupów, które wynajmują siłę obliczeniową od dostawców chmur, Deepseek jest właścicielem własnych centrów danych, co daje mu pełną kontrolę nad optymalizacją modelu AI i włączając szybką wdrażanie innowacji. Firma pozostaje finansowana, co pozytywnie wpływa na jego elastyczność i szybkość podejmowania decyzji.

Deepseek Zdjęcie: engame.com

Ponadto niektórzy badacze Deepseek zarabiają ponad 1,3 miliona dolarów rocznie, przyciągając najlepsze talenty wiodących chińskich uniwersytetów (firma nie zatrudniał zagranicznych specjalistów).

Nawet biorąc to pod uwagę, ostatnie twierdzenie Deepseeka o szkolenie najnowszego modelu za jedyne 6 milionów dolarów wydaje się nierealne. Liczba ta odnosi się jedynie do kosztu wykorzystania GPU podczas wstępnego treningu i nie uwzględnia kosztów badań, udoskonalania modelu, przetwarzania danych lub ogólnych kosztów infrastruktury.

Od samego początku Deepseek zainwestował ponad 500 milionów dolarów w rozwój AI. Jednak w przeciwieństwie do większych firm obciążonych biurokracją, kompaktowa struktura Deepseek pozwala jej aktywnie i skutecznie wdrażać innowacje AI.

Deepseek Zdjęcie: engame.com

Przykład Deepseek pokazuje, że dobrze finansowana niezależna firma AI może konkurować z liderami branży. Niemniej jednak eksperci podkreślają, że sukces firmy wynika głównie z miliardów inwestycji, przełomów technicznych i silnego zespołu, podczas gdy twierdzenia o „rewolucyjnym budżecie” dla opracowywania modeli AI są nieco przesadzone.

Mimo to koszty konkurencji pozostają znacznie wyższe. Na przykład porównaj koszty treningu modelowego: Deepseek wydał 5 milionów dolarów na R1, podczas gdy Chatgpt4O kosztował 100 milionów dolarów.

Najnowsze artykuły

Cookierun Kingdom: Ultimate Toppings Guide

Nintendo potwierdza 60-minutowy przełącznik 2 Direct

Koty i zupa zaprezentują przytulną różową świąteczną aktualizację!

„Przewodnik po uzyskaniu akumulatorów atomowych w Atomfall” Jun 26,2025
Kto jest dobrym chłopcem? Ludzki aktor odgrywa rolę kundla w Królestwie Come: Wyzwolenie 2 Jun 26,2025
„Władca pierścieni: Gollum Hunt premiera grudnia 2027 r.” Jun 26,2025
„Zestawy modelowe Gundam w przedsprzedaży są już dostępne jako anime emitujące się na Amazon” Jun 25,2025
Marvel Rivals: historia sukcesu w gatunku strzelców bohaterów? Jun 24,2025
Silver Palace: Ujawniono datę i czas premiery Jun 24,2025
„Hitman: World of Assassination ożywiony przez IO Interactive on Mobile” Jun 24,2025
Przewodnik po grzybach Monarch Monarch Build Build Jun 24,2025

Popularne gry +

Offroad School Bus Drive Games

Odgrywanie ról 90.00M
Pobierać
Gachimuchi: Become Dungeon Master

Zwykły 141.00M
Pobierać
Москвич 412 - симулятор машины

Wyścigi 76.3 MB
Pobierać
Superhero Bike Mega Ramp Games

Zwykły 86.45M
Pobierać
Dino Crowd

Działanie 128.81M
Pobierać

Tematy +

Najlepsze aplikacje komunikacyjne do pozostawania w kontakcie Mar 06,2025
Trudne gry logiczne dla wszystkich grup wiekowych Jun 08,2025
Najlepsze gry przygodowe na Androidzie Feb 26,2025
Zabawne gry muzyczne i taneczne dla Androida Jun 19,2025
Najlepsze darmowe gry karciane, w które możesz zagrać już teraz Jan 03,2025

Najważniejsze wiadomości +

06-26

Kto jest dobrym chłopcem? Ludzki aktor odgrywa rolę kundla w Królestwie Come: Wyzwolenie 2 W *Kingdom Come: Delivance 2 *, ukochany psie towarzysz nie został ożywiony za pomocą przechwytywania ruchu od prawdziwego psa, ale raczej poprzez wyobraźnię ludzkiego aktora. Zespół programistyczny wybrał to unikalne podejście podczas scen, które wymagało bezpośredniej interakcji między
06-22

MUTAZIONE: Mutant Soap Opera teraz na iOS i Androida Mutazione jest teraz dostępny do zakupu zarówno na iOS, jak i Google Play po udanym przebiegu jako ekskluzywny arcade Apple. Oznacza to znaczący kamień milowy dla gry, pozwalając szerszej publiczności doświadczyć bogatej narracji i wciągającego świata.
06-22

Stella Sora wystrzeliwuje przedłużoną beta zamkniętą z większą liczbą odblokowisk Stella Sora, długo oczekiwana rpg międzyplatformowa z Yostar Games, powraca z nowym zamkniętym testem beta (CBT), który od teraz działa do 8 czerwca. Ta najnowsza wersja beta oferuje graczom kolejną szansę na zanurzenie się w ekspansywnym świecie Nova i doświadczenie z pierwszej ręki, co ten nadchodzący tytuł ma do zaoferowania - Al
06-27

Cookierun Kingdom: Ultimate Toppings Guide W *Cookierun: Kingdom *dodatki są czymś więcej niż tylko słodkimi ozdobami-są to niezbędne elementy wzmacniające statystyki, które dramatycznie poprawiają wydajność bojową twoich plików cookie. Podobnie jak tradycyjny sprzęt RPG, dodatki określają, jak skutecznie funkcjonuje Twój zespół we wszystkich trybach gry, w tym PVE
06-24

„Hitman: World of Assassination ożywiony przez IO Interactive on Mobile” Hitman: World of Assassination ma dotrzeć do urządzeń mobilnych, z potwierdzeniem, że gra zostanie najpierw uruchomiona na iOS. To ekscytujące ogłoszenie daje fanom szansę zanurzenia się w skrupulatnie wykonanym świecie agenta 47 bezpośrednio z urządzeń mobilnych. W weekend, kilka HIG