Bahay Balita Ang mga modelo ng mababang gastos sa Deepseek AI ay pinaghihinalaang gumamit ng data ng openai, na nag-spark ng online na kabalintunaan

Ang mga modelo ng mababang gastos sa Deepseek AI ay pinaghihinalaang gumamit ng data ng openai, na nag-spark ng online na kabalintunaan

by Aria Apr 08,2025

Ang paglitaw ng Deepseek AI, isang modelo na binuo ng Tsino, ay nagdulot ng makabuluhang kontrobersya at pag-aalala sa loob ng industriya ng tech ng US. Ang hinala na maaaring ginamit ng Deepseek ang data ng OpenAi upang sanayin ang sariling mga modelo ay humantong sa isang matalim na reaksyon mula sa mga pinuno ng industriya at mga pigura sa politika. Si Donald Trump ay may label na Deepseek bilang isang "wake-up call" para sa sektor ng US tech, lalo na matapos na makaranas ng Nvidia ang isang nakakapangingilabot na $ 600 bilyon na pagbagsak sa halaga ng merkado kasunod ng isang 16.86% na plummet sa presyo ng stock nito-ang pinakamalaking pagkawala ng solong araw sa kasaysayan ng Wall Street. Ang iba pang mga higanteng tech tulad ng Microsoft, Meta Platform, at ang magulang na kumpanya ng Alpabe ng Google ay nakakita rin ng pagtanggi mula sa 2.1%hanggang 4.2%, habang ang Dell Technologies, isang pangunahing manlalaro sa pagmamanupaktura ng server ng AI, ay bumaba ng 8.7%.

Ang modelo ng R1 ng Deepseek, na itinayo sa open-source deepseek-v3, ay sinasabing isang alternatibong alternatibo sa mga modelo ng Western AI tulad ng CHATGPT, na naiulat na nangangailangan ng mas kaunting kapangyarihan sa pag-compute at sinanay lamang sa halagang $ 6 milyon. Ang pag -angkin na ito, habang pinagtatalunan ng ilan, ay nagtaas ng mga katanungan tungkol sa napakalaking pamumuhunan ng mga kumpanya ng tech tech na ginagawa sa AI, na nagiging sanhi ng hindi mabagal ang mamumuhunan. Ang mabilis na pagtaas ng Deepseek sa tuktok ng mga tsart ng pag -download ng libreng app ng US ay binibigyang diin ang lumalagong impluwensya at interes ng publiko sa mga kakayahan nito.

Bilang tugon sa mga pagpapaunlad na ito, sinisiyasat ng OpenAi at Microsoft kung ginamit ng Deepseek ang API ng OpenAi upang isama ang mga modelo ng OpenAi sa sarili nitong, isang kasanayan na kilala bilang distillation. Ang pamamaraan na ito ay nagsasangkot ng pagkuha ng data mula sa mas malaki, mas may kakayahang mga modelo upang sanayin ang mga bago, na lumalabag sa mga tuntunin ng serbisyo ng OpenAi. Binigyang diin ng OpenAI ang pangako nito na protektahan ang intelektuwal na pag -aari nito at nakikipagtulungan sa gobyerno ng US upang mapangalagaan ang mga advanced na modelo mula sa mga naturang kasanayan ng mga kakumpitensya at kalaban.

Si David Sacks, ang Ai Czar ni Pangulong Trump, ay naka -highlight ng katibayan na nagmumungkahi ng malalim na kaalaman ng malalim mula sa mga modelo ng OpenAi, na nagpapahiwatig na ang nangunguna sa amin ng mga kumpanya ng AI ay malamang na gumawa ng mga hakbang upang maiwasan ang gayong pag -distill sa hinaharap.

Ang kabalintunaan ng sitwasyon ni Openai ay hindi napansin, kasama ang mga kritiko na itinuturo na ang OpenAi mismo ay inakusahan ng paggamit ng copyrighted material mula sa internet upang sanayin ang chatgpt. Noong Enero 2024, inamin ni Openai na ang pagsasanay sa mga malalaking modelo ng wika na walang copyright na materyal ay "imposible," na pinagtutuunan na ang paglilimita ng data ng pagsasanay sa mga pampublikong domain na gawa ay hindi matugunan ang mga modernong pangangailangan. Ang tindig na ito ay nag -gasolina ng patuloy na mga debate tungkol sa paggamit ng mga copyright na materyales sa pagsasanay sa AI, na na -highlight ng mga demanda mula sa New York Times at isang pangkat ng 17 na may -akda, kasama na si George RR Martin, laban sa OpenAi at Microsoft dahil sa sinasabing "labag sa batas na paggamit" ng kanilang mga gawa. Ipinagtanggol ng OpenAI ang mga kasanayan nito bilang "patas na paggamit," iginiit na ang naturang pagsasanay ay mahalaga para sa pagbuo ng mga sistema ng AI na nagsisilbi sa mga pangangailangan ng kontemporaryong.

Ang ligal na tanawin na nakapalibot sa AI at copyright ay patuloy na nagbabago, na may isang kilalang pagpapasya noong Agosto 2023 ni Hukom ng Distrito na si Beryl Howell na nagpapatunay sa paninindigan ng US Copyright Office na ang ai-generated art ay hindi maaaring maging copyrighted, na binibigyang diin ang pangangailangan ng pagkamalikhain ng tao sa proteksyon ng copyright.

Inakusahan ang Deepseek na gumagamit ng modelo ng OpenAi upang sanayin ang katunggali nito gamit ang distillation. Credit ng imahe: Andrey Rudakov/Bloomberg sa pamamagitan ng mga imahe ng Getty.