Прогресс

Метод DeepSeek для обучения нейросетей может открыть новые возможности ИИ

Новый метод обучения нейросетей «гиперсвязи с ограничением на многообразие», разработанный китайской компанией DeepSeek, может привести к новому уровню развития технологии искусственного интеллекта (ИИ), считает IT-редакция ИА Красная Весна. Существующие методы обучения нейросетей уперлись в «потолок»: каждый следующий процент качества требует непропорционально больших затрат.

Новый метод накладывает математические ограничения при обучении, предотвращая сбои из-за исчезающих или чрезмерно усиливающихся сигналов. Тестирование показало, что метод повышает стабильность и качество обучения, увеличивая время обучения лишь на 6,7%. Если новый метод будет работать, то это может привести к решению проблемы нестабильности в обучении, которая возникает при использовании более сложных архитектур. Если западные компании стремятся достичь лидерства в технологии ИИ, опираясь на развитие инфраструктуры и препятствуя продажам оборудования в другие страны, то в Китае сделали ставку на развитие архитектуры моделей. DeepSeek в январе прошлого года уже удивила тем, что выпустила чат-бот R1, который по ряду показателей превзошел ChatGPT, который на тот момент считался наиболее эффективным. При этом китайская модель потребляет гораздо меньше ресурсов. Тогда это привело к падению курса акций американских IT-гигантов, и история может повториться в феврале 2026 года, когда ожидается выход модели V4. В целом история успеха DeepSeek показывает, что в развитии передовой технологии важна команда людей, способная находить нестандартные решения. Именно это позволяет конкурировать с, казалось бы, недосягаемыми американскими корпорациями.

glavno.smi.today

Ссылка на первоисточник

Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов

smi.today

Популярные статьи

Свежие комментарии

Прогресс

Метод DeepSeek для обучения нейросетей может открыть новые возможности ИИ