
Новый метод обучения нейросетей «гиперсвязи с ограничением на многообразие», разработанный китайской компанией DeepSeek, может привести к новому уровню развития технологии искусственного интеллекта (ИИ), считает IT-редакция ИА Красная Весна. Существующие методы обучения нейросетей уперлись в «потолок»: каждый следующий процент качества требует непропорционально больших затрат.
Новый метод накладывает математические ограничения при обучении, предотвращая сбои из-за исчезающих или чрезмерно усиливающихся сигналов. Тестирование показало, что метод повышает стабильность и качество обучения, увеличивая время обучения лишь на 6,7%. Если новый метод будет работать, то это может привести к решению проблемы нестабильности в обучении, которая возникает при использовании более сложных архитектур. Если западные компании стремятся достичь лидерства в технологии ИИ, опираясь на развитие инфраструктуры и препятствуя продажам оборудования в другие страны, то в Китае сделали ставку на развитие архитектуры моделей. DeepSeek в январе прошлого года уже удивила тем, что выпустила чат-бот R1, который по ряду показателей превзошел ChatGPT, который на тот момент считался наиболее эффективным. При этом китайская модель потребляет гораздо меньше ресурсов. Тогда это привело к падению курса акций американских IT-гигантов, и история может повториться в феврале 2026 года, когда ожидается выход модели V4. В целом история успеха DeepSeek показывает, что в развитии передовой технологии важна команда людей, способная находить нестандартные решения. Именно это позволяет конкурировать с, казалось бы, недосягаемыми американскими корпорациями. glavno.smi.today
Свежие комментарии