AutoRound: расширенный алгоритм квантования LLM от Intel.AutoRound – усовершенс…

🌟 AutoRound: расширенный алгоритм квантования LLM от Intel. AutoRound – усовершенствованный алгоритм квантования для малоразрядных LLM, основанный на методе “SignRound” исследования “Optimize Weight Rounding via Signed Gradient Descent for the…

LongLLaVA: MMLM, оптимизированная для обработки большого количества изображений…

🌟 LongLLaVA: MMLM, оптимизированная для обработки большого количества изображений. LongLLaVA – мультимодальная модель, предназначена для разработки приложений, требующих понимания длинных видеороликов, изображений высокого разрешения и сложных мультимодальных сценариев. В модели…

⚡️ OpenAI выпустили новую модель OpenAI o1, которая в разы мощнее GPT-4o.

⚡️ OpenAI выпустили новую модель OpenAI o1, которая в разы мощнее GPT-4o.

Модель o1 превосходит GPT-4o по различным показателям, включая соревновательное программирование, математические олимпиады и вопросы научного уровня PhD Главное отличие — перед тем как дать ответ, O1 думает и рассуждает через…

Nyuntam: Многофункциональный Toolkit для LLM и VLM.Nyuntam – это набор инструме…

🌟 Nyuntam: Многофункциональный Toolkit для LLM и VLM. Nyuntam – это набор инструментов для оптимизации, адаптации и ускорения моделей разной модальности в различных сферах применения. Nyuntam умеет обрезать (pruning), квантовать,…

OLMoE: Открытые языковые модели на основе Mixture-of-Experts.OLMoE (Open Mixtur…

🌟 OLMoE: Открытые языковые модели на основе Mixture-of-Experts. OLMoE (Open Mixture-of-Experts Language Models) – это метод создания языковых моделей, использующий разреженно активированные смеси экспертов (Mixture-of-Experts, MoE). Следуя этому методу была…

OLMoE: Открытые языковые модели на основе Mixture-of-Experts.OLMoE (Open Mixtur…

🌟 OLMoE: Открытые языковые модели на основе Mixture-of-Experts. OLMoE (Open Mixture-of-Experts Language Models) – это метод создания языковых моделей, использующий разреженно активированные смеси экспертов (Mixture-of-Experts, MoE). Следуя этому методу была…

Machine Learning:  Большой Медицинский дайджест  1.09-07.09 2024 г.

Machine Learning:  Большой Медицинский дайджест  1.09-07.09 2024 г.

В этом дайджесте за первую неделю сентября 2024 года мы собрали самые интересные и важные публикации. Пристегивайтесь, мы начинаем. Модели машинного обучения 🟩 CancerLLM: LLM для онкологии. CancerLLM – это…

LLaVaOLMBitNet1B: первая тернарная мультимодальная LLM от IntelLabs.LLaVaOLMoBi…

🌟 LLaVaOLMBitNet1B: первая тернарная мультимодальная LLM от IntelLabs. LLaVaOLMoBitnet1B – мультимодальная модель, способная принимать в качестве входных данных изображение + текст (запрос) и отдавать согласованные текстовые ответы на выходе. Архитектура…

MAPF-GPT: Имитационное обучение для многоагентного поиска путей.MAPF-GPT – это …

🌟 MAPF-GPT: Имитационное обучение для многоагентного поиска путей. MAPF-GPT – это метод решения задачи планирования движения агентов (MAPF) с помощью обучения с подкреплением. Он включает в себя четыре основных этапа:…

Свежайщая Бесплатня книга “Introduction to Machine Learning” Внутри множество в…

💻 Свежайщая Бесплатня книга “Introduction to Machine Learning” Внутри множество важных тем. – оптимизация с серьёзными математическими выкладками, – разборах метода главных компонент (PCA) с детальным анализом. Так же внутри…

Применение Few-Shot Learning в задачах сегментации изображений: Погружаемся в CoreML

Применение Few-Shot Learning в задачах сегментации изображений: Погружаемся в CoreML

Привет, коллеги! Сегодня мы затронем довольно узкую, но крайне интересную тему — Few-Shot Learning в контексте сегментации изображений. Это направление иногда остается в тени более популярных методов глубокого обучения, но…

Google DeepMind только что выпустили еще один крутой биотех инструмент с искусс…

😖 Google DeepMind только что выпустили еще один крутой биотех инструмент с искусственным интеллектом: AlphaProteoЭто AI для разработки новых белков. Он поможет в разработке лекарств, для лечения рака, аутоиммунных заболеваний,…

ICRT : Внутриконтекстное обучение имитации действия с помощью предсказания след…

🌟 ICRT : Внутриконтекстное обучение имитации действия с помощью предсказания следующего токена. In-Context Robot Transformer (ICRT) – модель, которая позволяет роботу выполнять новые задачи, интерпретируя контекстную информацию, предоставленную во время…

Mini-Omni : Мультимодальная речевая модель.Mini-Omni – open-source MMLM, котора…

🌟 Mini-Omni : Мультимодальная речевая модель. Mini-Omni – open-source MMLM, которая умеет ввод-вывод речи в режиме реального времени. Она построена по предложенному в исследовании методу “Any Model Can Talk”, который…

GuideLLM: Оценка и анализ производительности LLM в реальных условиях.GuideLLM -…

🌟 GuideLLM: Оценка и анализ производительности LLM в реальных условиях. GuideLLM – инструмент для оценки и оптимизации развертывания LLM. Моделируя рабочие нагрузки по инференсу в реальных условиях, GuideLLM помогает оценить…