Машинное обучение: Дайджест свежих новостей

Машинное обучение: Дайджест свежих новостей

✔ Anthropic предлагает новый способ подключения данных к чат-ботам. Anthropic разработала новый открытый стандарт Model Context Protocol (MCP) для подключения ИИ-ассистентов к системам хранения данных. MCP позволяет моделям ИИ, независимо…

RLtools: самая быстрая библиотека глубокого обучения с подкреплением для задач …

🌟 RLtools: самая быстрая библиотека глубокого обучения с подкреплением для задач непрерывного управления. RLtools – библиотека глубокого обучения с подкреплением (Deep Reinforcement Learning, DRL) с высокой скоростью работы для разработки…

Туториал по файнтюну Qwen2-VL-7B с использованием экосистемы Hugging Face.Статья…

📌Туториал по файнтюну Qwen2-VL-7B с использованием экосистемы Hugging Face. Статья на HF из цикла Open-Source AI Cookbook c подробным пошаговым описанием и примерами кода процесса тонкой настройки VLM Qwen2-VL-7B в…

LLaMA-Mesh: метод генерации 3D-мешей с помощью LLM.LLaMA-Mesh – метод, разработ…

🌟 LLaMA-Mesh: метод генерации 3D-мешей с помощью LLM. LLaMA-Mesh – метод, разработанный NVIDIA Labs, позволяющий генерировать 3D-модели с помощью текстовых инструкций, используя LLM. В отличие от других методов, LLaMA-Mesh представляет…

AlphaFold 3: новая система моделирования структуры белков.

AlphaFold 3: новая система моделирования структуры белков.

AlphaFold 3 — конвейер логического вывода системы ИИ, разработанной Google DeepMind, которая произвела революцию в области прогнозирования структуры белков. Пакет AlphaFold 3 включает в себя все необходимое для теоретического моделирования…

ML в медицине: дайджест за 3 – 10 ноября 2024 г.

ML в медицине: дайджест за 3 - 10 ноября 2024 г.

Модели, бенчмарки и датасеты 🟩 GSCo: совместное использование LLM общего назначения и экспертных моделей в медицинской визуализации. GSCo (Generalist-Specialist Collaboration) – система, которая использует преимущества моделей общего назначения (GFM) и…

AdaCache: ускорение DiT в генерации видео через необучаемое адаптивное кэширова…

🌟 AdaCache: ускорение DiT в генерации видео через необучаемое адаптивное кэширование. AdaCache основан на наблюдении, что «не все видео одинаковы»: некоторым видео требуется меньше шагов денойза для достижения приемлемого качества,…

D-FINE: метод регрессии bounding box в детекторах объектов на основе DETR.D-FIN…

🌟 D-FINE: метод регрессии bounding box в детекторах объектов на основе DETR. D-FINE – детектор объектов в режиме реального времени, который предлагает улучшение регрессии bounding box в моделях DETR .…

Llama-3.1-Centaur-70B: модель симуляции поведения человека.Centaur – модель, ко…

🌟 Llama-3.1-Centaur-70B: модель симуляции поведения человека. Centaur – модель, которая способная предсказывать и симулировать поведение человека в любом психологическом эксперименте, который можно описать на естественном языке. Это первая модель, соответствующая…

Машинное обучение в медицине: большой дайджест за 21 – 27 октября 2024 г.

Машинное обучение в медицине: большой дайджест за 21 - 27 октября 2024 г.

Модели машинного обучения и бенчмарки 🟩 BioMistral-NLU: модель с повышенным пониманием медицинской терминологии. BioMistral-NLU – модель, разработанная на основе BioMistral и настроенная на выполнение инструкций для 7 задач здравоохранения. Чтобы…

DuoAttention: эффективный метод для работы с длинными контекстами в LLM.

DuoAttention: эффективный метод для работы с длинными контекстами в LLM.

DuoAttention – метод, который решает проблему LLM при работе с длинными текстами. Эта неэффективность проявляется в большом потреблении памяти и замедлении работы модели. DuoAttention позволяет сократить использование памяти и ускорить…

SHORTCUT MODELS: метод обучение диффузионных моделей генерации в 1 шаг.Shortcut…

🌟 SHORTCUT MODELS: метод обучение диффузионных моделей генерации в 1 шаг. Shortcut models – метод обучения диффузионных моделей, который позволяет генерировать изображения высокого качества за один или несколько шагов. В…