ARP: авторегрессионное обучение последовательности действий для задач роботизир…

🌟 ARP: авторегрессионное обучение последовательности действий для задач роботизированного манипулирования. ARP – архитектура авторегрессионной политики, разработанная в Рутгерском университете, которая учится генерировать последовательности действий, используя Chunking Causal Transformer (CCT), предлагая…

CogVideoX Factory: оптимизация файнтюна моделей генерации видео семейства CogVi…

🌟 CogVideoX Factory: оптимизация файнтюна моделей генерации видео семейства CogVideoX.CogVideoX Factory – репозиторий с набором скриптов для эффективного файнтюна моделей семейства CogVideoX (CogVideoX-2B и CogVideoX-5B) с фокусом на оптимизацию VRAM.…

OpenMathInstruct-2: математический датасет и набор моделей от NVIDIA.OpenMathIn…

🌟 OpenMathInstruct-2: математический датасет и набор моделей от NVIDIA. OpenMathInstruct-2 состоит из 14 млн. пар “вопрос-решение” (примерно 600 тысяч уникальных вопросов) и является одним из крупнейших общедоступных наборов данных для…

ASR и диаризация речи от RevAI.RevAI, лидер в области профессиональной транскри…

🌟 ASR и диаризация речи от RevAI. RevAI, лидер в области профессиональной транскрипции английской речи выпустила в открытый доступ фреймdорк Reverb и набор моделей для построения конвейера speech-to-text. Reverb включает…

Малые языковые модели: обзор, измерения и выводы.Исследование, проведенное Унив…

🌟 Малые языковые модели: обзор, измерения и выводы. Исследование, проведенное Университетом Кембриджа, Пекинским университетом почты и телекоммуникаций о малых языковых моделях, опубликованных в открытом доступе в период с 2022-2024 гг.…

Пространственно-временное прогнозирование с помощью Байесовских нейронных поле…

🌟 Пространственно-временное прогнозирование с помощью Байесовских нейронных полей. Байесовские нейронные поля (Bayes NF) – метод масштабируемого пространственно-временного прогнозирования, объединяющий архитектуру глубокой нейронной сети моделирования функций с иерархическим Байесовским моделированием для…

Emu3: набор MMLM, основанный на методе предсказании следующего токена.Модели …

🌟 Emu3: набор MMLM, основанный на методе предсказании следующего токена. Модели Emu3 разработаны для задач мультимодальной генерации и восприятия: генерации изображений и видео по текстовому описанию, понимание визуальных представлений и…