Прогресс

Китайские компании выпустили новые модели искусственного интеллекта

Новые крупные языковые модели представили китайские интернет-гиганты и стартапы в области искусственного интеллекта, сообщает 22 января издание Yicai. Сообщается, что некоторые из них могут решать задачи по математике и кодированию не хуже, чем последняя модель OpenAI O1. 20 января DeepSeek представила модель DeepSeek-R1, а чуть более часа спустя Moonshot AI запустила модель Kimi K1.

5. В тот же день шанхайская компания MiniMax запустила аудиофункции для своей платформы Hailuo AI text-to-video, а компания ByteDance Doubao представила голосовую модель реального времени, которая может выступать в роли учителя английского языка или рассказчика для пользователей. Moonshot AI из Пекина утверждает, что Kimi K1.5 догнала OpenAI O1, которая дебютировала в прошлом месяце, в математике, кодировании и возможностях мультимодального мышления. Аналогичным образом, компания DeepSeek из Ханчжоу заявила, что DeepSeek-R1 работает наравне с O1 в таких задачах, как математика, кодирование и умозаключения на естественном языке. Китайские программы также менее дороги. DeepSeek предлагает услуги интерфейса прикладного программирования по цене 1 юань ($0,1) за миллион входных токенов и 16 юаней ($2,20) за миллион выходных токенов, что значительно ниже, чем у O1 — $15 и $60 соответственно. Последние обновления Moonshot AI и DeepSeek в целом соответствуют направлению выводов в серии O1 от OpenAI, но могут не использовать идентичные технические решения, сказал сотрудник отдела исследований и разработок ведущей китайской LLM-компании. Китайские компании переходят на модели с открытым исходным кодом, в то время как OpenAI, американский разработчик ChatGPT, придерживается стратегии проприетарного исходного кода.

Например, Moonshot AI впервые опубликовала технический отчет об обучении модели, а DeepSeek раскрыла весовые коэффициенты модели. Джим Фан, старший менеджер по исследованиям в Nvidia, высоко оценил переход DeepSeek к совместным инструментам разработки ИИ. «Мы живем в такое время, когда неамериканская компания поддерживает первоначальную миссию OpenAI — действительно открытые, пограничные исследования, которые расширяют возможности всех. В этом нет никакого смысла. Самый занимательный исход — самый вероятный», — написал Фан на сайте X 20 января. «DeepSeek-R1 не только открывает исходный код множества моделей, но и раскрывает все секреты обучения. Это, пожалуй, первый проект OSS, который демонстрирует значительный и устойчивый рост маховика RL», — добавил Фан, имея в виду систему обучения с подкреплением, которая получает вознаграждение за успешное взаимодействие, что приводит к положительной обратной связи. Более того, гигант социальных сетей и игр Tencent Holdings вчера выпустил свою модель Hunyuan3D 2.0, модель с открытым исходным кодом, преобразующую 2D-изображения в 3D-изображения, которая, как ожидается, найдет применение в разработке игр, рекламе в электронной коммерции и промышленном производстве. Китайский технологический гигант Baidu также недавно начал тестировать новое ИИ-приложение под названием Free Canvas, инструмент для создания досок на базе облачной платформы компании и Baidu Wenku, электронной библиотеки, которая превратилась в генератор ИИ-контента. Число ежемесячных активных пользователей Baidu Wenku превысило 90 миллионов, сообщил Ванг Йинг, вице-президент поискового оператора. glavno.smi.today

Ссылка на первоисточник

Понравилась статья? Подпишитесь на канал, чтобы быть в курсе самых интересных материалов

smi.today

Популярные статьи

Свежие комментарии

Прогресс

Китайские компании выпустили новые модели искусственного интеллекта