Dom Aktualności Tanie modele Deepseek Ai podejrzewane do korzystania z danych OpenAI, wywołując ironię online

Tanie modele Deepseek Ai podejrzewane do korzystania z danych OpenAI, wywołując ironię online

by Aria Apr 08,2025

Pojawienie się Deepseek AI, modelu opracowanego chińskiego, wywołało znaczące kontrowersje i obawy w amerykańskim branży technologicznej. Podejrzenie, że Deepseek mógł wykorzystać dane Openai do szkolenia własnych modeli, doprowadziło do ostrej reakcji zarówno liderów branży, jak i postaci politycznych. Donald Trump określił Deepseek jako „budzenie” dla amerykańskiego sektora technologii, szczególnie po tym, jak Nvidia doświadczyła oszałamiającego spadku rynkowej o wartości 600 miliardów dolarów po 16,86% spadku ceny akcji-największej jednodniowej straty w historii Wall Street. Inni giganci technologiczni, tacy jak Microsoft, Meta Platforms i firma macierzysta Google Alphabet również odnotowały spadki od 2,1%do 4,2%, podczas gdy Dell Technologies, kluczowy gracz w produkcji serwerów AI, spadł o 8,7%.

Model R1 Deepseek, zbudowany na open source Deepseek-V3, twierdzi, że jest opłacalną alternatywą dla modeli Western AI, takich jak Chatgpt, podobno wymaga znacznie mniejszej mocy obliczeniowej i jest przeszkolony za zaledwie 6 milionów dolarów. Roszczenie to, choć niektórym kwestionowane przez niektórych, zadało pytania dotyczące masowych inwestycji, które firmy technologiczne złożone przez USA w sztucznej inteligencji, powodując niepokój inwestora. Szybki wzrost Deepseek na szczyt amerykańskich bezpłatnych wykresów pobierania aplikacji podkreśla jej rosnący wpływ i zainteresowanie opinii publicznej jego możliwościami.

W odpowiedzi na te zmiany OpenAI i Microsoft badają, czy Deepseek użył interfejsu API Openai do zintegrowania modeli Openai z własnymi, praktyką znaną jako destylacja. Ta technika obejmuje wyodrębnienie danych z większych, bardziej zdolnych modeli do szkolenia nowych, które naruszają warunki usług Openai. Openai podkreślił swoje zaangażowanie w ochronę własności intelektualnej i współpracuje z rządem USA w celu ochrony zaawansowanych modeli przed takimi praktykami przez konkurentów i przeciwników.

David Sacks, AI CZAR prezydenta Trumpa, podkreślił dowody sugerujące, że Deepseek destyliła wiedzę z modeli Openai, wskazując, że wiodące amerykańskie firmy AI prawdopodobnie podejmą kroki w celu zapobiegania takiej destylacji w przyszłości.

Ironia sytuacji Openai nie pozostała niezauważona, a krytycy wskazują, że sam Openai został oskarżony o używanie materiałów chronionych z Internetu w celu szkolenia Chatgpt. W styczniu 2024 r. Openai przyznał, że szkolenie dużych modeli językowych bez materiałów chronionych prawem autorskim było „niemożliwe”, argumentując, że ograniczenie danych szkoleniowych do dzieł domeny publicznej nie spełniłoby współczesnych potrzeb. Ta postawa podsyciła trwające debaty na temat wykorzystania materiałów chronionych prawem autorskim w szkoleniu AI, podkreślone przez pozwy z New York Times i grupy 17 autorów, w tym George RR Martin, przeciwko Openai i Microsoftowi za domniemane „bezprawne użycie” ich dzieł. Openai bronił swoich praktyk jako „dozwolonego użytku”, stwierdzając, że takie szkolenie jest niezbędne do opracowywania systemów AI, które spełniają współczesne potrzeby.

Krajobraz prawny otaczający sztuczną inteligencję i prawa autorskie wciąż ewoluują, z godnym uwagi orzeczeniem w sierpniu 2023 r. Przez sędziego okręgowego Beryl Howell potwierdzającą stanowisko amerykańskiego biura praw autorskich, że sztuki generowanej przez AI nie może być chronione prawem autorskim, podkreślając konieczność ludzkiej kreatywności w ochronie praw autorskich.

Deepseek jest oskarżany o użycie modelu Openai do szkolenia konkurenta za pomocą destylacji. Zdjęcie: Andrey Rudakov/Bloomberg za pośrednictwem Getty Images.