На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

smi.today

4 593 подписчика

Свежие комментарии

  • YYYYYYY XXXXXXX
    Ну а мы давайте на эти санкции им удобрения, титан, уран для АЭС, бред какой-то. Кому война, а кому мать родна. Неуже...Макрон не исключи...
  • Сергей
    Чухонский еблан!!Президент Эстонии...
  • Сергей
    Пора варить уху из этого лягушенка! На битуме!!Макрон выразил не...

Китайские компании выпустили новые модели искусственного интеллекта

Новые крупные языковые модели представили китайские интернет-гиганты и стартапы в области искусственного интеллекта, сообщает 22 января издание Yicai. Сообщается, что некоторые из них могут решать задачи по математике и кодированию не хуже, чем последняя модель OpenAI O1. 20 января DeepSeek представила модель DeepSeek-R1, а чуть более часа спустя Moonshot AI запустила модель Kimi K1.

5. В тот же день шанхайская компания MiniMax запустила аудиофункции для своей платформы Hailuo AI text-to-video, а компания ByteDance Doubao представила голосовую модель реального времени, которая может выступать в роли учителя английского языка или рассказчика для пользователей. Moonshot AI из Пекина утверждает, что Kimi K1.5 догнала OpenAI O1, которая дебютировала в прошлом месяце, в математике, кодировании и возможностях мультимодального мышления. Аналогичным образом, компания DeepSeek из Ханчжоу заявила, что DeepSeek-R1 работает наравне с O1 в таких задачах, как математика, кодирование и умозаключения на естественном языке. Китайские программы также менее дороги. DeepSeek предлагает услуги интерфейса прикладного программирования по цене 1 юань ($0,1) за миллион входных токенов и 16 юаней ($2,20) за миллион выходных токенов, что значительно ниже, чем у O1 — $15 и $60 соответственно. Последние обновления Moonshot AI и DeepSeek в целом соответствуют направлению выводов в серии O1 от OpenAI, но могут не использовать идентичные технические решения, сказал сотрудник отдела исследований и разработок ведущей китайской LLM-компании. Китайские компании переходят на модели с открытым исходным кодом, в то время как OpenAI, американский разработчик ChatGPT, придерживается стратегии проприетарного исходного кода. Например, Moonshot AI впервые опубликовала технический отчет об обучении модели, а DeepSeek раскрыла весовые коэффициенты модели. Джим Фан, старший менеджер по исследованиям в Nvidia, высоко оценил переход DeepSeek к совместным инструментам разработки ИИ. «Мы живем в такое время, когда неамериканская компания поддерживает первоначальную миссию OpenAI — действительно открытые, пограничные исследования, которые расширяют возможности всех. В этом нет никакого смысла. Самый занимательный исход — самый вероятный», — написал Фан на сайте X 20 января. «DeepSeek-R1 не только открывает исходный код множества моделей, но и раскрывает все секреты обучения. Это, пожалуй, первый проект OSS, который демонстрирует значительный и устойчивый рост маховика RL», — добавил Фан, имея в виду систему обучения с подкреплением, которая получает вознаграждение за успешное взаимодействие, что приводит к положительной обратной связи. Более того, гигант социальных сетей и игр Tencent Holdings вчера выпустил свою модель Hunyuan3D 2.0, модель с открытым исходным кодом, преобразующую 2D-изображения в 3D-изображения, которая, как ожидается, найдет применение в разработке игр, рекламе в электронной коммерции и промышленном производстве. Китайский технологический гигант Baidu также недавно начал тестировать новое ИИ-приложение под названием Free Canvas, инструмент для создания досок на базе облачной платформы компании и Baidu Wenku, электронной библиотеки, которая превратилась в генератор ИИ-контента. Число ежемесячных активных пользователей Baidu Wenku превысило 90 миллионов, сообщил Ванг Йинг, вице-президент поискового оператора. glavno.smi.today

 

Ссылка на первоисточник
наверх