Trang chủ Tin tức Các mô hình chi phí thấp của Deepseek AI nghi ngờ sử dụng dữ liệu Openai, làm sáng tỏ sự mỉa mai trực tuyến

Các mô hình chi phí thấp của Deepseek AI nghi ngờ sử dụng dữ liệu Openai, làm sáng tỏ sự mỉa mai trực tuyến

by Aria Apr 08,2025

Sự xuất hiện của Deepseek AI, một mô hình do Trung Quốc phát triển, đã gây ra những tranh cãi và mối quan tâm đáng kể trong ngành công nghệ Hoa Kỳ. Sự nghi ngờ rằng Deepseek có thể đã sử dụng dữ liệu của Openai để đào tạo các mô hình của riêng mình đã dẫn đến một phản ứng mạnh mẽ từ các nhà lãnh đạo ngành công nghiệp và các nhân vật chính trị. Donald Trump đã coi Deepseek là một "cuộc gọi đánh thức" cho lĩnh vực công nghệ Hoa Kỳ, đặc biệt là sau khi NVIDIA trải qua giá trị thị trường giảm đáng kinh ngạc 600 tỷ đô la sau khi giảm giá 16,86% về giá cổ phiếu lớn nhất trong lịch sử Phố Wall. Các gã khổng lồ công nghệ khác như Microsoft, nền tảng meta và bảng chữ cái mẹ của Google cũng thấy sự sụt giảm từ 2,1%xuống 4,2%, trong khi Dell Technologies, một người chơi chính trong sản xuất máy chủ AI, giảm 8,7%.

Mô hình R1 của Deepseek, được xây dựng trên DeepSeek-V3 nguồn mở, tuyên bố là một giải pháp thay thế hiệu quả về chi phí cho các mẫu AI của phương Tây như TATGPT, được cho là cần có sức mạnh tính toán ít hơn đáng kể và được đào tạo chỉ với 6 triệu đô la. Yêu cầu này, trong khi bị tranh chấp bởi một số người, đã đặt ra các câu hỏi về các khoản đầu tư lớn mà các công ty công nghệ Mỹ đang thực hiện trong AI, khiến nhà đầu tư khó chịu. Sự gia tăng nhanh chóng của Deepseek lên đến đỉnh của các biểu đồ tải xuống ứng dụng miễn phí của Hoa Kỳ nhấn mạnh ảnh hưởng ngày càng tăng của nó và sự quan tâm của công chúng đối với các khả năng của nó.

Để đối phó với những phát triển này, Openai và Microsoft đang điều tra xem liệu Deepseek đã sử dụng API của Openai để tích hợp các mô hình của Openai, một thực tế được gọi là chưng cất. Kỹ thuật này liên quan đến việc trích xuất dữ liệu từ các mô hình lớn hơn, có khả năng hơn để đào tạo các mô hình mới, vi phạm các điều khoản dịch vụ của Openai. Openai đã nhấn mạnh cam kết bảo vệ tài sản trí tuệ của mình và đang hợp tác với chính phủ Hoa Kỳ để bảo vệ các mô hình tiên tiến của mình khỏi các hoạt động đó bởi các đối thủ cạnh tranh và đối thủ.

David Sacks, AI của Tổng thống Trump, đã nhấn mạnh các bằng chứng cho thấy kiến ​​thức chưng cất Deepseek từ các mô hình của Openai, cho thấy rằng các công ty AI dẫn đầu Hoa Kỳ có thể thực hiện các bước để ngăn chặn sự chưng cất như vậy trong tương lai.

Sự trớ trêu trong tình huống của Openai đã không được chú ý, với các nhà phê bình chỉ ra rằng chính Openai đã bị buộc tội sử dụng tài liệu có bản quyền từ Internet để đào tạo Chats. Vào tháng 1 năm 2024, Openai thừa nhận rằng đào tạo các mô hình ngôn ngữ lớn mà không có tài liệu có bản quyền là "không thể", lập luận rằng việc hạn chế dữ liệu đào tạo đối với các công trình miền công cộng sẽ không đáp ứng nhu cầu hiện đại. Lập trường này đã thúc đẩy các cuộc tranh luận liên tục về việc sử dụng các tài liệu có bản quyền trong đào tạo AI, được nhấn mạnh bởi các vụ kiện từ New York Times và một nhóm 17 tác giả, bao gồm George RR Martin, chống lại Openai và Microsoft vì bị cáo buộc "sử dụng bất hợp pháp" của họ. Openai đã bảo vệ các hoạt động của mình là "sử dụng hợp lý", khẳng định rằng đào tạo như vậy là rất cần thiết để phát triển các hệ thống AI phục vụ nhu cầu đương đại.

Bối cảnh hợp pháp xung quanh AI và bản quyền tiếp tục phát triển, với phán quyết đáng chú ý vào tháng 8 năm 2023 bởi Thẩm phán quận Beryl Howell khẳng định lập trường của Văn phòng Bản quyền Hoa Kỳ rằng nghệ thuật do AI tạo ra không thể có bản quyền, nhấn mạnh sự cần thiết của sự sáng tạo của con người trong bảo vệ bản quyền.

Deepseek bị buộc tội sử dụng mô hình của Openai để đào tạo đối thủ cạnh tranh bằng cách chưng cất. Tín dụng hình ảnh: Andrey Rudakov/Bloomberg qua Getty Images.