Машинное обучение в медицине: большой дайджест за 21 – 27 октября 2024 г.

Машинное обучение в медицине: большой дайджест за 21 - 27 октября 2024 г.

Модели машинного обучения и бенчмарки 🟩 BioMistral-NLU: модель с повышенным пониманием медицинской терминологии. BioMistral-NLU – модель, разработанная на основе BioMistral и настроенная на выполнение инструкций для 7 задач здравоохранения. Чтобы…

DuoAttention: эффективный метод для работы с длинными контекстами в LLM.

DuoAttention: эффективный метод для работы с длинными контекстами в LLM.

DuoAttention – метод, который решает проблему LLM при работе с длинными текстами. Эта неэффективность проявляется в большом потреблении памяти и замедлении работы модели. DuoAttention позволяет сократить использование памяти и ускорить…

⚡️ Mistral AI представила новые модели 3B и 8B.

⚡️ Mistral AI представила новые модели 3B и 8B.

Mistral AI, отмечая годовщину выпуска Mistral 7B, представила две новые модели: Ministral 3B и Ministral 8B.  Семейство этих моделей получило название «Ministraux», они отличаются высокой производительностью в области знаний, рассуждений,…

CogVideoX Factory: оптимизация файнтюна моделей генерации видео семейства CogVi…

🌟 CogVideoX Factory: оптимизация файнтюна моделей генерации видео семейства CogVideoX.CogVideoX Factory – репозиторий с набором скриптов для эффективного файнтюна моделей семейства CogVideoX (CogVideoX-2B и CogVideoX-5B) с фокусом на оптимизацию VRAM.…

OpenMathInstruct-2: математический датасет и набор моделей от NVIDIA.OpenMathIn…

🌟 OpenMathInstruct-2: математический датасет и набор моделей от NVIDIA. OpenMathInstruct-2 состоит из 14 млн. пар “вопрос-решение” (примерно 600 тысяч уникальных вопросов) и является одним из крупнейших общедоступных наборов данных для…

Выпущена новая версия Python 3.13

Выпущена новая версия Python 3.13

Год разработки завершился публикацией новой версии выпуска Python 3.13. В новой ветке поддержка будет осуществляться полтора года, затем еще три с половиной года для нее будут создаваться обновления, устраняющие уязвимости.…

ASR и диаризация речи от RevAI.RevAI, лидер в области профессиональной транскри…

🌟 ASR и диаризация речи от RevAI. RevAI, лидер в области профессиональной транскрипции английской речи выпустила в открытый доступ фреймdорк Reverb и набор моделей для построения конвейера speech-to-text. Reverb включает…

Малые языковые модели: обзор, измерения и выводы.Исследование, проведенное Унив…

🌟 Малые языковые модели: обзор, измерения и выводы. Исследование, проведенное Университетом Кембриджа, Пекинским университетом почты и телекоммуникаций о малых языковых моделях, опубликованных в открытом доступе в период с 2022-2024 гг.…

Пространственно-временное прогнозирование с помощью Байесовских нейронных поле…

🌟 Пространственно-временное прогнозирование с помощью Байесовских нейронных полей. Байесовские нейронные поля (Bayes NF) – метод масштабируемого пространственно-временного прогнозирования, объединяющий архитектуру глубокой нейронной сети моделирования функций с иерархическим Байесовским моделированием для…