Как новая модель DeepSeek V3 превосходит американские ИИ решения
Китайская компания DeepSeek представила мощную языковую модель V3, которая обходит популярных конкурентов в создании кода и решении математических задач.
В минувший день, 26 декабря, китайская компания DeepSeek сообщила о запуске своей новейшей модели DeepSeek V3, которая стала одной из самых мощных открытых языковых моделей на современном рынке. В ходе тестирования в области программирования данная модель продемонстрировала выдающиеся результаты, опередив таких конкурентов, как GPT-4o от , Llama 3.1, Claude 3.5 Sonnet и Qwen 2.5 от Alibaba. Особенно интересен тест Aider Polyglot, который проверяет способности модели дополнять и интегрировать новый код в существующие проекты.
Кроме того, DeepSeek V3 показала лучшие результаты в решении задач на платформе Codeforces, которая организует соревнования для программистов со всего мира. Достижения модели не ограничиваются лишь программированием: в тестах на решение математических задач она значительно превзошла конкурентов, особенно в тесте MATH-500 и CNMO 2024, где модели DeepSeek V3 продемонстрировала 43,2 балла, в то время как GPT-4o набрала лишь 10,8 балла. Удивительно, что эта китайская модель лучше справляется не только с задачами на китайском языке, но и превосходит ее американских соперников в английских задачах.
Дополнительно было сообщено, что компания DeepSeek смогла обучить свою модель всего за два месяца при помощи центров обработки данных с графическими ускорителями NVIDIA H800, потратив на это лишь 5,5 миллиона долларов. Для сравнения, инвестировала около 78 миллионов долларов на обучение своих моделей GPT-4, обладателей более широкого доступа к передовым технологиям NVIDIA. С учетом текущих санкций против китайских разработчиков можно предполагать, что без этих ограничений DeepSeek V3 могла бы быть еще более мощной.
Кроме того, новая модель является открытым решением, доступным для модификаций и использования в приложениях, даже в коммерческих целях. Это контрастирует с подходом , которая предоставляет свои модели исключительно через платный API и ограничивает пользователей в запросах с бесплатных подписок.