Туториал по файнтюну Qwen2-VL-7B с использованием экосистемы Hugging Face.Статья…

📌Туториал по файнтюну Qwen2-VL-7B с использованием экосистемы Hugging Face. Статья на HF из цикла Open-Source AI Cookbook c подробным пошаговым описанием и примерами кода процесса тонкой настройки VLM Qwen2-VL-7B в…

LLaMA-Mesh: метод генерации 3D-мешей с помощью LLM.LLaMA-Mesh – метод, разработ…

🌟 LLaMA-Mesh: метод генерации 3D-мешей с помощью LLM. LLaMA-Mesh – метод, разработанный NVIDIA Labs, позволяющий генерировать 3D-модели с помощью текстовых инструкций, используя LLM. В отличие от других методов, LLaMA-Mesh представляет…

AdaCache: ускорение DiT в генерации видео через необучаемое адаптивное кэширова…

🌟 AdaCache: ускорение DiT в генерации видео через необучаемое адаптивное кэширование. AdaCache основан на наблюдении, что «не все видео одинаковы»: некоторым видео требуется меньше шагов денойза для достижения приемлемого качества,…

D-FINE: метод регрессии bounding box в детекторах объектов на основе DETR.D-FIN…

🌟 D-FINE: метод регрессии bounding box в детекторах объектов на основе DETR. D-FINE – детектор объектов в режиме реального времени, который предлагает улучшение регрессии bounding box в моделях DETR .…

Llama-3.1-Centaur-70B: модель симуляции поведения человека.Centaur – модель, ко…

🌟 Llama-3.1-Centaur-70B: модель симуляции поведения человека. Centaur – модель, которая способная предсказывать и симулировать поведение человека в любом психологическом эксперименте, который можно описать на естественном языке. Это первая модель, соответствующая…

SHORTCUT MODELS: метод обучение диффузионных моделей генерации в 1 шаг.Shortcut…

🌟 SHORTCUT MODELS: метод обучение диффузионных моделей генерации в 1 шаг. Shortcut models – метод обучения диффузионных моделей, который позволяет генерировать изображения высокого качества за один или несколько шагов. В…

ARP: авторегрессионное обучение последовательности действий для задач роботизир…

🌟 ARP: авторегрессионное обучение последовательности действий для задач роботизированного манипулирования. ARP – архитектура авторегрессионной политики, разработанная в Рутгерском университете, которая учится генерировать последовательности действий, используя Chunking Causal Transformer (CCT), предлагая…

CogVideoX Factory: оптимизация файнтюна моделей генерации видео семейства CogVi…

🌟 CogVideoX Factory: оптимизация файнтюна моделей генерации видео семейства CogVideoX.CogVideoX Factory – репозиторий с набором скриптов для эффективного файнтюна моделей семейства CogVideoX (CogVideoX-2B и CogVideoX-5B) с фокусом на оптимизацию VRAM.…