LongLLaVA: MMLM, оптимизированная для обработки большого количества изображений…

🌟 LongLLaVA: MMLM, оптимизированная для обработки большого количества изображений. LongLLaVA – мультимодальная модель, предназначена для разработки приложений, требующих понимания длинных видеороликов, изображений высокого разрешения и сложных мультимодальных сценариев. В модели…

⚡️ OpenAI выпустили новую модель OpenAI o1, которая в разы мощнее GPT-4o.

⚡️ OpenAI выпустили новую модель OpenAI o1, которая в разы мощнее GPT-4o.

Модель o1 превосходит GPT-4o по различным показателям, включая соревновательное программирование, математические олимпиады и вопросы научного уровня PhD Главное отличие — перед тем как дать ответ, O1 думает и рассуждает через…

Nyuntam: Многофункциональный Toolkit для LLM и VLM.Nyuntam – это набор инструме…

🌟 Nyuntam: Многофункциональный Toolkit для LLM и VLM. Nyuntam – это набор инструментов для оптимизации, адаптации и ускорения моделей разной модальности в различных сферах применения. Nyuntam умеет обрезать (pruning), квантовать,…

SCIAGENTS : Автоматизация научных изысканий с помощью мультиагентных графовых р…

🌟 SCIAGENTS : Автоматизация научных изысканий с помощью мультиагентных графовых рассуждений. SciAgents – фреймворк, который самостоятельно генерирует и уточняет исследовательские гипотезы, разъясняя лежащие в их основе механизмы, принципы проектирования и…

VEnhancer: Генеративное улучшение синтезированного видео.VEnhancer – генератив…

🌟 VEnhancer: Генеративное улучшение синтезированного видео. VEnhancer – генеративная система апсемлинга пространственно-временных характеристик, которая улучшает результаты существующих методов преобразования текста в видео путем добавления большего количества деталей в пространственной области…

OLMoE: Открытые языковые модели на основе Mixture-of-Experts.OLMoE (Open Mixtur…

🌟 OLMoE: Открытые языковые модели на основе Mixture-of-Experts. OLMoE (Open Mixture-of-Experts Language Models) – это метод создания языковых моделей, использующий разреженно активированные смеси экспертов (Mixture-of-Experts, MoE). Следуя этому методу была…

OLMoE: Открытые языковые модели на основе Mixture-of-Experts.OLMoE (Open Mixtur…

🌟 OLMoE: Открытые языковые модели на основе Mixture-of-Experts. OLMoE (Open Mixture-of-Experts Language Models) – это метод создания языковых моделей, использующий разреженно активированные смеси экспертов (Mixture-of-Experts, MoE). Следуя этому методу была…

Machine Learning:  Большой Медицинский дайджест  1.09-07.09 2024 г.

Machine Learning:  Большой Медицинский дайджест  1.09-07.09 2024 г.

В этом дайджесте за первую неделю сентября 2024 года мы собрали самые интересные и важные публикации. Пристегивайтесь, мы начинаем. Модели машинного обучения 🟩 CancerLLM: LLM для онкологии. CancerLLM – это…

LLaVaOLMBitNet1B: первая тернарная мультимодальная LLM от IntelLabs.LLaVaOLMoBi…

🌟 LLaVaOLMBitNet1B: первая тернарная мультимодальная LLM от IntelLabs. LLaVaOLMoBitnet1B – мультимодальная модель, способная принимать в качестве входных данных изображение + текст (запрос) и отдавать согласованные текстовые ответы на выходе. Архитектура…

MAPF-GPT: Имитационное обучение для многоагентного поиска путей.MAPF-GPT – это …

🌟 MAPF-GPT: Имитационное обучение для многоагентного поиска путей. MAPF-GPT – это метод решения задачи планирования движения агентов (MAPF) с помощью обучения с подкреплением. Он включает в себя четыре основных этапа:…

Свежайщая Бесплатня книга “Introduction to Machine Learning” Внутри множество в…

💻 Свежайщая Бесплатня книга “Introduction to Machine Learning” Внутри множество важных тем. – оптимизация с серьёзными математическими выкладками, – разборах метода главных компонент (PCA) с детальным анализом. Так же внутри…

Применение Few-Shot Learning в задачах сегментации изображений: Погружаемся в CoreML

Применение Few-Shot Learning в задачах сегментации изображений: Погружаемся в CoreML

Привет, коллеги! Сегодня мы затронем довольно узкую, но крайне интересную тему — Few-Shot Learning в контексте сегментации изображений. Это направление иногда остается в тени более популярных методов глубокого обучения, но…

Google DeepMind только что выпустили еще один крутой биотех инструмент с искусс…

😖 Google DeepMind только что выпустили еще один крутой биотех инструмент с искусственным интеллектом: AlphaProteoЭто AI для разработки новых белков. Он поможет в разработке лекарств, для лечения рака, аутоиммунных заболеваний,…

ICRT : Внутриконтекстное обучение имитации действия с помощью предсказания след…

🌟 ICRT : Внутриконтекстное обучение имитации действия с помощью предсказания следующего токена. In-Context Robot Transformer (ICRT) – модель, которая позволяет роботу выполнять новые задачи, интерпретируя контекстную информацию, предоставленную во время…

Mini-Omni : Мультимодальная речевая модель.Mini-Omni – open-source MMLM, котора…

🌟 Mini-Omni : Мультимодальная речевая модель. Mini-Omni – open-source MMLM, которая умеет ввод-вывод речи в режиме реального времени. Она построена по предложенному в исследовании методу “Any Model Can Talk”, который…