Что такое DeepSeek
Это бесплатный чат-бот. Название сервис получил по наименованию создавшей его китайской компании. Организация базируется в Ханчжоу и занимается разработкой открытых больших языковых моделей (LLM).
Началась история DeepSeek в 2023 году, когда Лян Вэньфэн, выпускник Чжэцзянского университета (один из ведущих в Китае), основал стартап. Он объявил, что планирует организовать "новую, независимую исследовательскую группу для изучения AGI". Под этой аббревиатурой понимают искусственный интеллект общего назначения – автономные системы, которые в большинстве задач превосходят человека.
Лян закупил чипы Nvidia A100 (разработку американской технологической компании, производящей графические процессоры). Предположительно, именно они стали основой нейросети.
На чем основана нейросеть
DeepSeek использует передовые методы машинного обучения. Прежде всего, дистилляцию модели. Это значит, что систему обучали на базе более крупных ИИ, что обеспечило высокую производительность без необходимости применения большого объема вычислительных ресурсов. Скорость обработки при этом очень высока.
Также сервис снабжен функцией расширенной NLP (Natural Language Processing – обработка письменной и устной речи человека языка). Фактически, нейросеть DeepSeek лучше понимает контекст и может участвовать в более содержательных разговорах с пользователями.
Еще разработчики заявили, что ИИ сможет обрабатывать не только текст, но и изображения и даже звуки.
Кроме того, сервис способен к самообучению – учету результатов своего взаимодействия с пользователями и постепенному его совершенствованию. Даже при учете увеличения объема данных ИИ сможет более эффективно обрабатывать информацию без ущерба для производительности.
Наконец, модель совместима с различным ПО, ее можно легко использовать на существующих платформах.
Что умеет DeepSeek
- Искать информацию в Интернете (со ссылками на источники).
- Создавать тексты в разных объемах и стилях, что может помочь в написании статей, эссе и так далее.
- Распознавать и анализировать изображения.
- Писать и форматировать код на разных языках программирования (C++, Go, Java, JavaScript, Python, Rust).
- Логически рассуждать, решать задачи и обосновывать свои ответы.
Версия R1
На январь 2025 года самой передовой считается версия R1, которая:
- Превосходно справляется с генерацией кода (например, Python, Java) и решением сложных уравнений.
- Быстро обрабатывает запросы при небольших ресурсных затратах.
- Характеризуется открытым исходным кодом (пользователи могут локально запускать ИИ, просматривать и редактировать).
При этом из-за существующих в Китае цензурных протоколов ИИ не может поддерживать политические темы, а также в ней пока отсутствуют функции запоминания контекста, генерации изображений и режим голосового взаимодействия.
Другие версии
Одна из первых разработок компании вышла в начале ноября 2023 года и называлась Coder. В серии было 8 моделей, из них 4 были предварительно обучены (Base), еще 4 – с контролируемой тонкой настройкой. Их важная особенность – длина контекста в 16 тысяч токенов. Это значит, что они могли обрабатывать как короткие вопросы, так и, например, большие фрагменты кода.
К концу ноября выпустили другую серию – LLM в двух формах: базовой и чате. Их словарный запас насчитывал 102400 токенов (столько они могли распознавать и обрабатывать).
В апреле 2024 года для установки стали доступны версии Math. Их оптимизировали для выполнения математических задач. А через месяц вышла серия V2, которая объединяла 2 базовые модели (DeepSeek-V2, DeepSeek-V2-Lite) и 2 чат-бота (-Chat). Длина контекста была увеличена до 128 тысяч – это уровень анализа книг, юридических документов и сложных научных статей.
В конце ноября 2024 года стала доступна версия R1-Lite-Preview. Она была обучена логическому выводу (прогнозированию), математическому обоснованию и решению задач в реальном времени. Уже тогда модель могла конкурировать с разработками OpenAI.
В декабре 2024 выпустили базовую модель DeepSeek-V3-Base и версию чата DeepSeek-V3 – улучшенные версии V2, отличавшиеся более высокой скоростью обработки, обученная на 14,8 триллионах токенов мультиязычного корпуса (база текстовых данных на нескольких языках, преимущественно на английском и китайском), с повышенным содержанием математических и программных данных.
Вскоре, в январе 2025 появилась модель R1, о которой мы писали выше. А одновременно с ней компания выпустила версию R1-Zero. Ее совершенствовали с помощью метода обучения с подкреплением (Reinforcement Learning, RL) без предварительного обучения с использованием SFT (адаптации под конкретную задачу). В итоге модель научилась самопроверке, рефлексии и генерации длинных цепочек рассуждений. При этом возникли трудности с читаемостью и смешением языков.
Также была разработана версия R1-Distill, которую создавали на базе других предварительно обученных моделей с открытым исходным кодом, таких как LLaMA и Qwen (используются в средах с ограниченными вычислительными ресурсами).
Приложение DeepSeek
Мобильная версия, основанная на версии R1, доступна для устройств на iOS и Android (установка бесплатная).
По состоянию на январь 2025 года, сервис поддерживает обработку текста: пользователи могут задавать вопросы и получать ответы в чате.
Однако из-за резкого роста популярности нового искусственного интеллекта и, как следствие, перегрузки серверов приложения могут быть перебои. А также, по официальным заявлениям, сервис подвергся "крупномасштабным злонамеренным атакам" и задействует все доступные ресурсы для борьбы с ними.
Каковы недостатки DeepSeek
Прежде всего, это периодически возникающие технические ошибки и сбои, изредка генерируемая недостоверная информация и использование частей речи в неправильных формах.
Кроме того, цензура. Как мы уже писали, про политику (например, про статус Тайваня) поговорить с ИИ не получится. А это непосредственно ограничивает способность ИИ объективно предоставлять информацию.
А также важно учитывать следующее. Согласно своей политике конфиденциальности, компания хранит на своих серверах персональные данные пользователей: дата рождения, текстовый и аудио-контент, загруженные файлы, история чатов. А также в перечень может входить техническая информация – от модели устройства и операционной системы до IP-адреса и схемы нажатия клавиш.
Рекорды по показателям
Международные тесты демонстрируют выдающиеся результаты R1, сопоставимые или даже превосходящие успехи разработок OpenAI:
- Точность – 79,8%;
- Решение математических задач – 97,3%;
- Написание кода – 96,3%
- MMLU (Massive Multitask Language Understanding, комплексный тест для оценки уровня знаний в различных областях) – 90,8%. Тест помогает проверить логическое мышление, способность понимать язык и эрудицию.
Конкурентоспособность
Нейросеть предлагает более эффективные и доступные решения в совершенствовании искусственного интеллекта и тем самым бросает вызов своим более крупным конкурентам.
Так, нейросеть модели R1 по качеству работы сопоставима с GPT-4o и o1 от OpenAI, а стоимость ее обучения при этом обходится в 6 млн долларов (против 100 млн, затраченных на совершенствование GPT-4 в 2023 году). А также она задействует лишь десятую часть вычислительной мощности по сравнению с конкурентами.
Кроме того, компания публикует код, алгоритмы и детали обучения в открытом доступе и активно привлекает к разработке молодых специалистов разных профилей из ведущих университетов Китая.
Сравнение с ChatGPT
Параметр | DeepSeek | ChatGPT |
Архитектура и дизайн | Mixture-of-Experts (MoE): использует 37 млрд параметров из доступных 671 подмоделей (экспертов) под разные задачи | Трансформер: задействует все доступные параметры, что делает модель более универсальной, но снижает скорость обработки запросов |
Производительность и возможности | Отлично справляется с техническими задачами, особенно с написанием кода и решением сложных математических задач. Может выполнять такие функции, как подсветка синтаксиса и обнаружение ошибок | Известен навыками ведения диалога с пользователем и креативностью |
Среднее время отклика на сложные запросы | Мгновенно | Около 10 секунд |
Скорость обработки технических задач | 10 секунд | 30 секунд |
Стоимость токенов (за 1 млн) | 2,20 $ | 30 $ |
Стоимость подписки (в месяц) | 0,5 $ | 20 $ |
Модерация контента | Есть политическая цензура | Хорошо осведомлен о событиях в мире и о многом может рассказать |
Фокус разработки | Преимущественно азиатский рынок | Глобальный рынок и многозадачность |
Базы данных для обучения | Преимущественно на китайском и английском языках | Более широкий спектр языков, более разноплановые источники |
Технологии (исходный код) | Открытые | Закрытые |
Последствия для мирового рынка искусственного интеллекта
Успех DeepSeek уже заметили в высших политических кругах Китая. 20 января, в день, когда R1 представили публике, основатель компании Лян посетил закрытый симпозиум для бизнесменов и экспертов, организованный премьер-министром Китая Ли Цяном.
Присутствие Ляна на встрече – потенциальный признак того, что его разработка может пригодиться для решения политических задач. В частности, в утверждении лидерства Поднебесной в стратегических отраслях, таких как ИИ.
Падение акций мировых лидеров
Разработки стартапа из Китая вызвали ажиотаж на биржах – в первый же день после выхода мобильного приложения DeepSeek акции Nvidia упали на 18%. Причина простая: модель от DeepSeek – достойный аналог западным сервисам, который демонстрирует сопоставимые успехи при меньших затратах на вычислительные ресурсы. А это автоматически поставило под угрозу доминирование американских компаний в сфере искусственного интеллекта.
У инвесторов возникли сомнения, насколько целесообразно вкладывать средства в разработку и внедрение американских ИИ.
Впрочем, после первоначального падения акции Nvidia восстановились на 8%. Это указывает на частичное восстановление доверия инвесторов.
Как интегрировать китайскую нейросеть в бизнес
За счет открытого исходного кода снижается порог вхождения для организаций, которые планируют внедрить искусственный интеллект в свою работу. В итоге технология становится более доступной для широкого круга предприятий.
Кроме того, компании, которые первыми внедрят DeepSeek, получат стратегические преимущества:
- Расширенная NLP для взаимодействия с клиентами;
- Продвинутая поддержка нескольких языков для выхода на международный рынок;
- Адаптивные алгоритмы обучения для оптимизации решения задач.
В чем польза для маленьких компаний?
Малый бизнес часто сталкивается с такими проблемами, как ограниченный бюджет и необходимость выполнять несколько задач одновременно. DeepSeek эти проблемы решает.
Например, за счет открытого исходного кода компании могут полностью адаптировать ее под свои потребности и задачи. Особенно такая функция полезна для стартапов и малого бизнеса.
Также при использовании DeepSeek, скорее всего, сократится потребность в ручном труде, что позволит сэкономить и выделить больше ресурсов на более важные инициативы.
Еще у китайского ИИ есть функция аналитики. Сервис может предоставлять информацию о производительности бизнеса в режиме реального времени, что поможет принимать более разумные для развития бизнеса решения.
Как пользоваться в России
Региональные ограничения на Россию не распространяются. Это значит, что, чтобы зайти на сайт или общаться в чате, не требуется VPN.
Для создания аккаунта нужно ввести только адрес электронной почты или номер телефона. А также есть возможность зарегистрироваться с помощью аккаунта Google. После этого потребуется подтверждение регистрации, а затем откроется доступ к чат-боту.
Хорошие новости – приложение полностью оптимизировано для работы на русском языке.
Сервис предлагает общение с ИИ, опцию поиска информации в Интернете, а также режим DeepThink для более глубоких рассуждений.
При этом важно учитывать, что из-за высокого спроса возможны временные задержки при регистрации или сбои при использовании ИИ.
Будущее DeepSeek: прогнозы
Успех DeepSeek – не просто свидетельство технологических инноваций. Этот феномен коренным образом повлияет на то, как компании используют ИИ. Одна из причин – открытый исходный код и возможность адаптации модели к потребностям конкретной организации или человека.
Свою конкурентоспособность китайская нейросеть уже доказала – и вызывала резонанс на рынке ИИ и колебания на фондовых рынках.
Предположительно, феномен DeepSeek может ускорить внедрение ИИ в разных отраслях, предлагая более дешевые и эффективные способы оптимизации задач, клиентской поддержки и аналитики.
Также вероятно, что технология будет активно распространяться за пределами Китая. Однако такие выводы делать пока сложно из-за политической и экономической напряженности, связанной с китайскими технологиями. Это может привести к тому, что некоторые страны начнут вводить ограничения на использование DeepSeek в корпоративном и государственном секторе.
Что касается конкуренции с западными ИИ, дальнейшее развитие разработки зависит от качества генерации контента, введения инноваций в архитектуре нейросети, способности оптимизировать затраты.
Впрочем, даже если конкуренция на рынке усилится, скорее всего, будущее не за одним конкретным ИИ, а за сложной экосистемой из множества. Теоретически, компании смогут использовать разные ИИ для решения разных задач (условно, ChatGPT – для творчества и обсуждения бытовых вопросов, например, психологи отношений, а новую разработку – для программирования).