AutoRound: расширенный алгоритм квантования LLM от Intel.AutoRound – усовершенс…

🌟 AutoRound: расширенный алгоритм квантования LLM от Intel. AutoRound – усовершенствованный алгоритм квантования для малоразрядных LLM, основанный на методе “SignRound” исследования “Optimize Weight Rounding via Signed Gradient Descent for the…

LongLLaVA: MMLM, оптимизированная для обработки большого количества изображений…

🌟 LongLLaVA: MMLM, оптимизированная для обработки большого количества изображений. LongLLaVA – мультимодальная модель, предназначена для разработки приложений, требующих понимания длинных видеороликов, изображений высокого разрешения и сложных мультимодальных сценариев. В модели…

Nyuntam: Многофункциональный Toolkit для LLM и VLM.Nyuntam – это набор инструме…

🌟 Nyuntam: Многофункциональный Toolkit для LLM и VLM. Nyuntam – это набор инструментов для оптимизации, адаптации и ускорения моделей разной модальности в различных сферах применения. Nyuntam умеет обрезать (pruning), квантовать,…

OLMoE: Открытые языковые модели на основе Mixture-of-Experts.OLMoE (Open Mixtur…

🌟 OLMoE: Открытые языковые модели на основе Mixture-of-Experts. OLMoE (Open Mixture-of-Experts Language Models) – это метод создания языковых моделей, использующий разреженно активированные смеси экспертов (Mixture-of-Experts, MoE). Следуя этому методу была…

OLMoE: Открытые языковые модели на основе Mixture-of-Experts.OLMoE (Open Mixtur…

🌟 OLMoE: Открытые языковые модели на основе Mixture-of-Experts. OLMoE (Open Mixture-of-Experts Language Models) – это метод создания языковых моделей, использующий разреженно активированные смеси экспертов (Mixture-of-Experts, MoE). Следуя этому методу была…

LLaVaOLMBitNet1B: первая тернарная мультимодальная LLM от IntelLabs.LLaVaOLMoBi…

🌟 LLaVaOLMBitNet1B: первая тернарная мультимодальная LLM от IntelLabs. LLaVaOLMoBitnet1B – мультимодальная модель, способная принимать в качестве входных данных изображение + текст (запрос) и отдавать согласованные текстовые ответы на выходе. Архитектура…

MAPF-GPT: Имитационное обучение для многоагентного поиска путей.MAPF-GPT – это …

🌟 MAPF-GPT: Имитационное обучение для многоагентного поиска путей. MAPF-GPT – это метод решения задачи планирования движения агентов (MAPF) с помощью обучения с подкреплением. Он включает в себя четыре основных этапа:…

Свежайщая Бесплатня книга “Introduction to Machine Learning” Внутри множество в…

💻 Свежайщая Бесплатня книга “Introduction to Machine Learning” Внутри множество важных тем. – оптимизация с серьёзными математическими выкладками, – разборах метода главных компонент (PCA) с детальным анализом. Так же внутри…

Google DeepMind только что выпустили еще один крутой биотех инструмент с искусс…

😖 Google DeepMind только что выпустили еще один крутой биотех инструмент с искусственным интеллектом: AlphaProteoЭто AI для разработки новых белков. Он поможет в разработке лекарств, для лечения рака, аутоиммунных заболеваний,…

ICRT : Внутриконтекстное обучение имитации действия с помощью предсказания след…

🌟 ICRT : Внутриконтекстное обучение имитации действия с помощью предсказания следующего токена. In-Context Robot Transformer (ICRT) – модель, которая позволяет роботу выполнять новые задачи, интерпретируя контекстную информацию, предоставленную во время…

Mini-Omni : Мультимодальная речевая модель.Mini-Omni – open-source MMLM, котора…

🌟 Mini-Omni : Мультимодальная речевая модель. Mini-Omni – open-source MMLM, которая умеет ввод-вывод речи в режиме реального времени. Она построена по предложенному в исследовании методу “Any Model Can Talk”, который…

GuideLLM: Оценка и анализ производительности LLM в реальных условиях.GuideLLM -…

🌟 GuideLLM: Оценка и анализ производительности LLM в реальных условиях. GuideLLM – инструмент для оценки и оптимизации развертывания LLM. Моделируя рабочие нагрузки по инференсу в реальных условиях, GuideLLM помогает оценить…

Command-r и Command-r-plus: Обновление 08-2024 мультиязычных LLM.Command-r (35B…

🌟 Command-r и Command-r-plus: Обновление 08-2024 мультиязычных LLM. Command-r (35B) и Command-r-plus(104B) редакции 08-2024 – это мультиязычные (23 языка, включая русский) модели с контекстным окном 128К и навыками в генерации…

Автоматическое проектирование агентов LLMРазвитие базовых языковых и иснтруктив…

🌟 Автоматическое проектирование агентов LLM Развитие базовых языковых и иснтруктивных моделей , таких как GPT и Claude, дал возможность создания агентов общего назначения, способных к гибкому рассуждению и планированию. Но…