CogVideoX Factory: оптимизация файнтюна моделей генерации видео семейства CogVi…

🌟 CogVideoX Factory: оптимизация файнтюна моделей генерации видео семейства CogVideoX.CogVideoX Factory – репозиторий с набором скриптов для эффективного файнтюна моделей семейства CogVideoX (CogVideoX-2B и CogVideoX-5B) с фокусом на оптимизацию VRAM.…

OpenMathInstruct-2: математический датасет и набор моделей от NVIDIA.OpenMathIn…

🌟 OpenMathInstruct-2: математический датасет и набор моделей от NVIDIA. OpenMathInstruct-2 состоит из 14 млн. пар “вопрос-решение” (примерно 600 тысяч уникальных вопросов) и является одним из крупнейших общедоступных наборов данных для…

ASR и диаризация речи от RevAI.RevAI, лидер в области профессиональной транскри…

🌟 ASR и диаризация речи от RevAI. RevAI, лидер в области профессиональной транскрипции английской речи выпустила в открытый доступ фреймdорк Reverb и набор моделей для построения конвейера speech-to-text. Reverb включает…

Малые языковые модели: обзор, измерения и выводы.Исследование, проведенное Унив…

🌟 Малые языковые модели: обзор, измерения и выводы. Исследование, проведенное Университетом Кембриджа, Пекинским университетом почты и телекоммуникаций о малых языковых моделях, опубликованных в открытом доступе в период с 2022-2024 гг.…

Пространственно-временное прогнозирование с помощью Байесовских нейронных поле…

🌟 Пространственно-временное прогнозирование с помощью Байесовских нейронных полей. Байесовские нейронные поля (Bayes NF) – метод масштабируемого пространственно-временного прогнозирования, объединяющий архитектуру глубокой нейронной сети моделирования функций с иерархическим Байесовским моделированием для…

Emu3: набор MMLM, основанный на методе предсказании следующего токена.Модели …

🌟 Emu3: набор MMLM, основанный на методе предсказании следующего токена. Модели Emu3 разработаны для задач мультимодальной генерации и восприятия: генерации изображений и видео по текстовому описанию, понимание визуальных представлений и…

Show-me: альтернатива ChatGPT-O1 на Сhat-Gpt-4o-mini.Show-Me — это проект, кото…

🌟 Show-me: альтернатива ChatGPT-O1 на Сhat-Gpt-4o-mini. Show-Me — это проект, который использует LangChain для связи с gpt-4o-mini и визуализирует процесс рассуждений в виде динамического графического интерфейса. Ключевая особенность Show-Me –…