Дом Новости DeepSeek AI Development стоит 1,6 млрд. Долл.

DeepSeek AI Development стоит 1,6 млрд. Долл.

by Jason Apr 21,2025

Тем не менее, это все еще дешевле, чем его конкуренты.

Новый чат -бот из DeepSeek предстал перед мне с этим описанием:

Привет, я был создан, чтобы вы могли спросить что угодно и получить ответ, который может даже удивить вас.

Сегодня искусственный интеллект, разработанный DeepSeek, стал грозным конкурентом на рынке, что способствовало одному из крупнейших падений цен на акции Nvidia.

Тест DeepSeek Изображение: Ensigame.com

Что отличает эту модель, так это ее инновационная архитектура и методы обучения. Он включает в себя несколько передовых технологий:

Multi-Token Production (MTP): вместо того, чтобы предсказывать по одному слову за раз, модель прогнозирует несколько слов одновременно, анализируя различные части предложения. Этот подход значительно повышает как точность, так и эффективность модели.

Смесь экспертов (MOE): эта архитектура использует различные нейронные сети для обработки входных данных. Это ускоряет обучение ИИ и повышает производительность. В DeepSeek V3 используются 256 нейронных сетей, причем восемь активируются для каждой задачи обработки токенов.

Многоугольное скрытое внимание (MLA): этот механизм фокусируется на наиболее значимых частях предложения. MLA неоднократно извлекает ключевые детали из фрагментов текста, снижая вероятность отсутствия важной информации. В результате ИИ более искусен при захвате важных нюансов во входных данных.

Выдающийся китайский стартап Deepseek утверждает, что разработал конкурентную модель ИИ с минимальными затратами, заявив, что они потратили всего 6 миллионов долларов на обучение мощной нейронной сети Deepseek V3 и использовали только 2048 графических процессоров.

DeepSeek v3 Изображение: Ensigame.com

Тем не менее, аналитики полуанализа показали, что DeepSeek управляет большой вычислительной инфраструктурой, содержащей приблизительно 50 000 графических процессоров Nvidia. Это включает в себя 10 000 единиц H800, более 10 000 продвинутых H100 и дополнительные партии графических процессоров H20. Эти ресурсы распределены по нескольким центрам обработки данных и используются для обучения, исследований и финансового моделирования искусственного интеллекта.

Общая инвестиция компании в серверы составляет около 1,6 млрд. Долл. США, а эксплуатационные расходы оцениваются в 944 млн. Долл. США.

DeepSeek является дочерней компанией китайского хедж-фонда High-Flyer, который отключился от стартапа как отдельное подразделение, ориентированное на технологии искусственного интеллекта в 2023 году. В отличие от большинства стартапов, которые арендуют вычислительную власть от облачных провайдеров, Deepseek владеет своими собственными центрами обработки обработки данных, предоставляя ему полный контроль над оптимизацией модели ИИ и обеспечивая более быстрое реализацию инноваций. Компания остается самофинансированной, что положительно влияет на его гибкость и скорость принятия решений.

DeepSeek Изображение: Ensigame.com

Более того, некоторые исследователи в DeepSeek зарабатывают более 1,3 миллиона долларов в год, привлекая лучших талантов от ведущих китайских университетов (компания не нанимает иностранных специалистов).

Даже учитывая это, недавняя претензия Deepseek о обучении своей последней модели всего за 6 миллионов долларов кажется нереальным. Эта цифра относится только к стоимости использования графических процессоров во время предварительного обучения и не учитывает расходы на исследования, уточнение модели, обработку данных или общие затраты на инфраструктуру.

С момента своего создания DeepSeek инвестировала более 500 миллионов долларов в разработку ИИ. Однако, в отличие от более крупных компаний, обремененных бюрократией, компактная структура Deepseek позволяет ей активно и эффективно внедрять инновации в области ИИ.

DeepSeek Изображение: Ensigame.com

Пример DeepSeek демонстрирует, что хорошо финансируемая независимая компания ИИ может конкурировать с лидерами отрасли. Тем не менее, эксперты подчеркивают, что успех компании в значительной степени связан с миллиардами инвестиций, технических прорывов и сильной командой, в то время как заявления о «революционном бюджете» для разработки моделей ИИ несколько преувеличены.

Тем не менее, затраты конкурентов остаются значительно выше. Например, сравните стоимость модельного обучения: Deepseek потратил 5 миллионов долларов на R1, а Chatgpt4o стоила 100 миллионов долларов.

Последние статьи

Трендовые игры +

Темы +

Лучшие приложения для общения для поддержания Mar 06,2025
Веселая музыка и танцевальные игры для Android Jun 19,2025
Сложные головоломки для всех возрастов Jun 08,2025
Лучшие приключенческие игры на Android Feb 26,2025
Лучшие приложения для образа жизни для Android Jan 01,2025

Главные новости +

07-01

«Дюна: Пробуждение взлетает в Steam с номерами игроков записи» Несмотря на то, что стартеры были ранним доступом к Арракису с 5 июня, Dune: Awakening официально запущено для всех игроков вчера 10 июня. Через несколько часов после полного релиза Expancive MMO выживания привлек более 142 000 одновременных игроков в Steam - в Steeking, в течение 142 050. Это Ifl
06-28

Tango Gameworks общается с уникальными IPS, начинает нанимать для новой игры Творческие умы, стоящие за *Hi-Fi Rush *, Tango Gameworks, официально запустили обновленный веб-сайт и подтвердили, что в настоящее время они разрабатывают «безоблажающую игру». Недавно переработанный сайт демонстрирует обновленную брендинг Studio и включает в себя специальные рекламные роли на странице карьеры.
06-26

Кто хороший мальчик? Человеческий актер играет роль Матта в Королевстве: освобождение 2 В *Королевстве приходит: освобождение 2 *, любимый собачий спутник не был воплощен в жизнь, используя захват движения от настоящей собаки, а скорее благодаря творческому исполнению человеческого актера. Команда разработчиков выбрала этот уникальный подход во время сцен, который требовал прямого взаимодействия между
06-22

Mutazione: мутантная мыльная опера, теперь на iOS и Android Mutazione теперь доступен для покупки как на iOS, так и на Google Play после успешного запуска в качестве эксклюзивного Apple Arcade. Это знаменует собой важную веху для игры, позволяя более широкой аудитории испытать свой богатый повествование и захватывающий мир.
06-22

Стелла Сора запускает расширенную закрытую бета -версию с большим количеством разблокировки Стелла Сора, долгожданная кроссплатформенная RPG из Yostar Games, вернулась с новым закрытым бета-тестом (CBT), работающим с настоящего момента до 8 июня. Эта последняя бета -версия предлагает игрокам еще один шанс погрузиться в обширный мир Новой и познакомиться с тем, что предстоящее название может предложить -