Список лучших (и бесплатных) книг для изучения Машинного Обучения

Мы составили список из 50 лучших (и бесплатных) книг, которые будут полезны для всех, кто работает в сфере машинного обучения.

“Чего мы хотим, так это машин, которые смогут учиться на собственном опыту”

Алан Тьюринг

Нет никаких сомнений в том, что машинное обучение стало одной из самых популярных тем в наше время. Согласно исследованиям, инженер по машинному обучению был признан одной из лучших профессий в США в 2019 году. С этой статьей вы можете скачать бесплатно книги по машинному обучению.

@datascienceiot – в телеграм канале собраны сотни бесплатных книг, которые вы можете скачать. по машинному обучению, статистике, математике и глубокому обучению.

Учитывая эту тенденцию, мы составили список некоторых из лучших (и бесплатных) книг по машинному обучению, которые окажутся полезными для всех, кто стремится построить карьеру в этой области.

Наслаждайтесь!

Начнем со свежей монографии по машинному обучению.

Монография “Reinforcement Learning: An Overview”

Исчерпывающий материал по обучению с подкреплением (Reinforcement Learning, RL), в котором подробно описываются различные модели среды, задачи оптимизации, исследуется определение компромисса между теорией и практической эксплуатаций RL.

Отдельно рассматриваются смежные темы: распределенное RL, иерархическое RL, обучение вне политики и VLM.

В работе представлен обзор алгоритмов RL:

🟢SARSA;

🟢Q-learning; 

🟢REINFORCE; 

🟢A2C;

🟢TRPO/PPO; 

🟢DDPG;

🟢Soft actor-critic;  

🟢MBRL.

Автор – Kevin Murphy, главный научный сотрудник и руководитель команды из 28 ресечеров и инженеров в Google Deepmind. Группа работает над генеративными моделями (диффузия и LLM), RL, робототехникой, байесовским выводом и другими темами. 

Кевин опубликовал более 140 статей на рецензируемых конференциях и в журналах, а также 3 учебника по ML, опубликованных в 2012, 2022 и 2023 годах издательством MIT Press. (Книга 2012 года была удостоена премии ДеГроота как лучшая книга в области статистической науки).

Ссылка

1. Введение в статистическое обучение с R (ISLR)

Ссылка на книгу: ISLR

Список лучших (и бесплатных) книг для изучения Машинного Обучения

Лучшая вводная книга по теории машинного обучения. Даже платные источники редко могут оказаться лучше. Книга является хорошим введение в математику, а также содержит практический материал для языка R.

2 Книга “Обучение с подкреплением: Основы”

Хороших книг по обучению с подкреплением (Reinforcement Learning, RL) уже выпущено достаточно, однако есть пробел между продвинутыми учебниками, в которых основное внимание уделяется одному или нескольким аспектам, и более общими книгами, в которых предпочтение отдается удобочитаемости, а не сложности. 

Авторы книги, люди с опытом работы в CS и инжиниринга, подают тему RL в строгом и академическом стиле. Книга основана на конспектах лекций для углубленного курса бакалавриата, который преподается авторами в Тель-Авивском университете.

К этой книге дополнительно идет брошюра с упражнениями и экзаменационными вопросами, которые помогут освоить материал книги на практике. Эти упражнения разрабатывались на протяжении нескольких лет.

Математическая модель книги – Марковский процесс принятия решений (Markov Decision Process, MDP). Основное внимание уделяется: последовательному принятию решений, выбору действий, долгосрочному эффекту от этих действий и разница между немедленным вознаграждением и долгосрочной выгодой.

Тематически книга состоит из двух частей – “Планирование” и “Обучение”.

▶️ Раздел “Планирование” – основы принятия оптимальных решений в условиях неопределенности в соответствии с MDP.  

🟢Глава 2. Обоснование модели MDP и ее связь с другими моделями. 

🟢Глава 3. Основные алгоритмические идеи в детерминированной постановке.

🟢Глава 4. Цепи Маркова, на которых основана MDP.

🟢Глава 5. Модель MDP с конечным горизонтом и фундаментальный подход к динамическому программированию. 

🟢Глава 6. Дисконтированная настройка с бесконечным горизонтом.

🟢Глава 7. Эпизодическая настройка. 

🟢Глава 8. Альтернативный подход к решению MDP с использованием формулировки линейного программирования.

▶️ Раздел “Обучение” – принятие решений, когда модель MDP неизвестна заранее. 

🟠Глава 9. Описание и мотивация модели обучения и ее связь с альтернативами при принятии решений.

🟠Глава 10. Подход, основанный на моделях, при котором агент явно изучает модель MDP на основе своего опыта и использует ее для принятия решений по планированию.

🟠Глава 11. Альтернативный подход без использования моделей, при котором решения принимаются без явного построения модели. 

🟠Глава 12. Изучение приблизительно оптимальных решений крупных задач с использованием аппроксимации функции стоимости.

🟠Глава 13 Решение крупных задач с использованием методов градиентной политики. 

🟠Глава 14. Особый случай на примере игровых автоматов, как MDP с единым состоянием и неизвестными наградами, и онлайн-характер принятия решений.

🟡Сайт учебника

🟡Читать

3. Нейронные сети и глубокое обучение

Ссылка на книгуNeural Networks and Deep Learning

Эта бесплатная онлайн-книга – одно из лучших и самых быстрых введений в глубокое обучение. Чтение этой книги займет всего несколько дней, но даст вам все основы глубокого обучения.

4. Распознавание образов и машинное обучение

Book LinkPattern Recognition and Machine Learning

Это одна из самых известных книг по теоретическому машинному обучению, поэтому мне не нужно писать много вступительных слов.

5. Глубокое обучение

Book LinkDeep Learning Book

Библия глубокого обучения. Эта книга представляет собой введение в алгоритмы и методы глубокого обучения. Стоит отметить, что данное пособие будет полезно как новичку, так и человеку, который уже некоторое время изучает сферу машинного обучения.

6. Понимание машинного обучения: от теории к алгоритмам

Book LinkUnderstanding Machine Learning: From Theory to Algorithms

Действительно хорошее пособия для изучения машинного обучения!

7. 7 шагов к успеху: Машинное обучения на практике


Book Link
Seven Steps to Success: Machine Learning in Practice

Важно: люди, которые только начинают углубляться в сферу машинного обучения, просто обязаны ознакомиться с данной книгой. Стоит заметить, что она очень хорошо и понятно написана (немного устарело и не охватывает глубокое обучение, но работает для всех практических целей).

8. Правила машинного обучения: Лучшая практика для инженеров машинного обучения

Book LinkRules of Machine Learning: Best practices for Machine Learning Engineering

Интересно, что Google думает о своих продуктах машинного обучения? Это действительно хороший учебник по управлению продуктами в сфере машинного обучения!

9. Краткое введение в машинное обучение для инженеров

Book LinkA Brief Introduction to Machine Learning for Engineers

Монолог, охватывающий практически все методы машинного обучения. Книга облегчает процесс понимания математики (для людей, которые боятся сложных математических обозначений).

10. Краткое введение в машинное обучение без глубокого обучения

Book LinkBrief Introduction to Machine Learning without Deep Learning

Книга представляет собой пособие для новичков, которое не содержит в себе темы глубокого обучения.

11. Вводные заметки по машинному обучению

Book LinkIntroductory Machine Learning notes

Руководство по машинному обучению для абсолютных новичков.

12. Основы машинного обучения

Book LinkFoundations of Machine Learning

Список лучших (и бесплатных) книг для изучения Машинного Обучения

Подробный трактат о математических концепциях машинного обучения.

13. Введение в выбор переменных и функций

Book Link: An Introduction to Variable and Feature Selection

Разработка функций и выбор переменных, вероятно, являются наиболее важным вкладом человека в традиционные алгоритмы машинного обучения (тема не так уж важна в методах глубокого обучения, но стоит помнить, что не всё решается с помощью глубокого обучения). В этом руководстве представлено введение в различные методы проектирования объектов.

14. Автоматизированное машинное обучение – Фрэнк Хаттер, Ларс Коттхофф, Хоакин Ваншорен

Book LinkAutoML Book – Frank Hutter, Lars Kotthoff, Joaquin Vanschoren

Традиционное машинное обучение в последние дни действительно свелось к запуску моделей автоматизированного машинного обучения (h2o, auto sklearn или tpot, наши любимые в ParallelDots), как только вы закончите с разработкой функций. (На самом деле, существует также несколько методов автоматического проектирования объектов, не относящихся к конкретной предметной области). В этой книге рассматриваются методы, используемые в автоматизированном машинному обучении.

15. Глубокое обучение с помощью Pytorch

Book LinkDeep Learning with Pytorch

Бесплатная книга, которая поможет вам освоить глубокое обучение с помощью PyTorch. PyTorch – наша любимая библиотека глубокого обучения в ParallelDots. Мы рекомендуем ее всем, кто занимается прикладными исследованиями / разработками в области глубокого обучения.

16. Погружение в глубокое обучение

Book LinkDive Into Deep Learning

Еще одна подробная книга по глубокому обучению, в которой используется библиотека MXNet от Amazon для погружения в глубокое обучение.

17. Записные книжки Keras на Github

Book LinkKeras Github notebooks

Франсуа Шоле – руководитель библиотеки Keras. Его книга, “Глубокое обучение на Python”, написанная для обучения глубокому обучению в Keras, оценена очень хорошо. Книга недоступна бесплатно, но весь ее код доступен на Github в виде записных книжек (образующих книгу с примерами глубокого обучения) и является хорошим ресурсом. Я прочитал это, когда изучал Keras несколько лет назад, очень хороший ресурс.

18. Машинное обучение на основе моделей

Book LinkModel-based Machine Learning

Список лучших (и бесплатных) книг для изучения Машинного Обучения

Отличный ресурс по байесовскому машинному обучению. Книга будет полезна как новичкам, так и прогрессирующим специалистам!

19. Байесовские модели для машинного обучения


Book Link
Bayesian Models for Machine Learning

Еще одна книга, в которой подробно описываются различные байесовские методы в машинном обучении.

20. Eisenstein NLP notes

Ссылка на книгуEisenstein NLP notes

Обработка естественного языка – самое популярное применение машинного обучения. Эти заметки из курса GATech дают действительно хороший обзор того, как машинное обучение используется для интерпретации человеческого языка.

21. Обучение с подкреплением

Ссылка на книгу:  Reinforcement Learning – Sutton and Barto

Это обязательная книга для всех, кто начинает заниматься обучением с подкреплением.

22. Гауссовские процессы для машинного обучения

Ссылка на книгуGaussian Processes for Machine Learning

Книга раскрывет использование байесовской оптимизации и гауссовых процессов для машинного обучения с библиотеками Edward / GpyTorch / BOTorch и т.д..

23. Интервью по машинному обучению. Дизайн систем машинного обучения

Ссылка на книгу: Machine Learning Interviews Machine Learning Systems Design Chip Huyen

Собираетесь на собеседование для работы по машинному обучению? Эти вопросы могут помочь определить стратегию при ответе на вопросы в сфере машинного обучения.

24. Алгоритмические аспекты машинного обучения

Ссылка на книгу: Algorithmic Aspects of Machine Learning

Эта книга посвящена разделам машинного обучения, которые имеют дело с вычислительными алгоритмами и численными методами для решения таких задач, как модели факторизации, изучение словаря и гауссовы модели.

25. Причинно-следственная связь для машинного обучения

Ссылка на книгу: Causality for Machine Learning

Поскольку причинно-следственная связь проникает в области науки о данных, машинное обучение тоже не остается позади. Хотя подробных материалов по этому поводу нет, вот краткое руководство, в котором предпринимается попытка объяснить ключевые концепции причинно-следственной связи для машинного обучения.

26. Математические основы Data Sciences

Ссылка на книгу: https://mathematical-tours.github.io/book-sources/FundationsDataScience.pdf

Основы математики для специалистов по данным.

25. Математические основы Data Sciences

Создаем нейронную сеть

27. Music Classification: Beyond Supervised Learning, Towards Real-world Application

Ссылка на книгу: https://music-classification.github.io/tutorial/landing-page.html

Музыкальная классификация: помимо контролируемого обучения, к реальному применению

 
Список лучших (и бесплатных) книг для изучения Машинного Обучения


28 .«Глубокое обучение» (Deep Learning). образовательный проект по глубокому обучению

Ссылка на гит: https://github.com/Dyakonov/DL

  • образовательный проект по глубокому обучению
  • лектор: Александр Дьяконов
  • читался как кафедральный курс на факультете ВМК, МГУ имени М.В. Ломоносова для бакалавров 317 группа (2019-2022)
  • часть лекций легла в основу курса программы ОзонМастерс


29 Практические упражнения и дополнительные материалы к книге “Build a Large Language Model (From Scratch)”

Репозиторий на Github c прикладными упражнениями, ноутбуками с кодом для разработки, предварительной подготовки и тонкой настройке LLM-модели типа GPT по одной из лучших книг о построении LLM с нуля.

▶️ О книге:

В книге вы узнаете и поймете, как работают большие языковые модели изнутри, создавая собственную LLM  шаг за шагом, c подробным объяснением каждого этапа понятным языком, диаграммами и примерами.

Метод, описанный в книге демонстрирует подход, используемый при создании крупных фундаментальных моделей, таких как те, что лежат в основе ChatGPT. 

В репозитории к каждой главе книги соответствуют несколько (3-4) прикладных примеров в формате ipynb или в виде исполняемого python-скрипта. Код ориентирован на широкую аудиторию, разработан для запуска на обычных ноутбуках и не требует специализированного оборудования. 

▶️Главная ценность репозитория – дополнительные практические материалы, которые помогут глубже изучить тонкости и нюансы процесса настройки и обучения LLM:

Настройка

 🟢Советы на настройке Python

 🟢Установка пакетов и библиотек Python

 🟢Руководство по настройке среды Docker

Глава 2: Работа с текстовыми данными

🟠Сравнение различных реализаций Byte Pair Encoding (BPE)

🟠Понимание разницы между embedding и линейными слоями

🟠Dataloader Intuition с простыми числами

Глава 3: Код механизмов внимания

🟢Сравнение эффективных реализаций Multi-Head Attention

🟢Буферы PyTorch

Глава 4: Реализация модели GPT с нуля

🟠Анализ FLOPS

Глава 5: Предварительное обучение на немаркированных данных

🟢Альтернативная загрузка весов с HuggingFace с использованием Transformers

🟢Предварительное обучение GPT на наборе данных проекта Gutenberg

🟢Добавление дополнительных функций в цикл обучения

🟢Оптимизация гиперпараметров для предварительного обучения

🟢Создание пользовательского интерфейса для взаимодействия с LLM

🟢Преобразование GPT в Llama

🟢Llama 3.2 с нуля

🟢Memory-efficient загрузка модели 

Глава 6: Тонкая настройка для классификации

🟠Дополнительные эксперименты по точной настройке различных слоев и использованию более крупных моделей

🟠Тонкая настройка различных моделей на основе датасета обзоров фильмов IMDB объемом 50 тыс. строк.

🟠Создание пользовательского интерфейса для взаимодействия с классификатором спама на основе GPT

Глава 7: Тонкая настройка для следования инструкциям

🟢Утилиты набора данных для поиска близких дубликатов и создания записей в пассивном залоге

🟢Оценка ответов на инструкции с использованием API OpenAI и Ollama

🟢Создание датасета для точной настройки инструкций

🟢Улучшение набора данных для точной настройки инструкций

🟢Создание набора данных предпочтений с помощью Llama 3.1 70B и Ollama

🟢DPO для процедуры LLM Alignment

🟢Создание пользовательского интерфейса для взаимодействия с моделью GPT с тонкой настройкой инструкций

🖥Github

📓 Автоматическая обработка текстов на естественном языке и анализ данных

Ссылка на книгу: https://t.me/machinelearning_books/166

В учебном пособии рассматриваются базовые вопросы компьютерной лингвистики: от теории лингвистического и математического моделирования

до вариантов технологических решений. Дается интерпретация основных

лингвистических объектов и единиц анализа. Приведены сведения, необходимые для создания отдельных подсистем, отвечающих за анализ текстов

на естественном языке. Рассматриваются вопросы анализа тональности и

тематического моделирования текстов, извлечения информации из текстов.

Еще 10 книг раскрывающие машинное обучение книги, которые можно скачать бесплатно

Hal Daume III. A Course in Machine Learning. 2015 – прекрасно оформленный вводный курс в машинное обучение (PDF)

Bayesian Reasoning and Machine Learning – качественный, прекрасно оформленный и регулярно обновляемый курс David Barber

A First Encounter with Machine Learning – курс Max Welling, 2011 г. (PDF)

Gaussian Processes for Machine Learning

Introduction to Machine Learning – конспект лекций по машинному обучению Амнона Шашуа (Amnon Shashua), охватывающий темы статистического вывода

Machine Learning, Neural and Statistical Classification – книга 1994 г. Michie, Spiegelhalter, Taylor, основана на проекте StatLog ЕС (ESPRIT), в котором сравниваются и оцениваются методы классификации с оценкой их достоинств, недостатков и диапазонов применения

The Elements of Statistical Learning

Кристоф Мольнар. Interpretable Machine Learning фокусируется на моделях машинного обучения для табличных данных

Кэмерон Дэвидсон. Bayesian Methods for Hackers — всё о байесовском выводе

Книги по статистике

Статистика

  • Брюс П., Брюс Э. Практическая статистика для специалистов Data Science. 50 важнейших понятий. БХВ-Петербург, 2018. — В качестве основного языка используется R.
  • Illowsky B., Dean S. Introductory Statisctics. OpenStax, 2021.
  • Kormanik K. A. Statistics Fundamentals Succinctly. 2016 – введение в статистику с практической точки зрения
  • Shafer D. S., Zhang Z. Introductory Statistics. University of North Carolina, 2012. – большое количество примеров и иллюстраций
  • Lane D. etc. OnlineStatBook. Rice University
  • James G., Witen D., Hastie T., Tibshirani R. An Introduction to Statistical Learning — введение в методы статистического обучения с лабораторными работами на языке R
  • Dekking F.M., Kraaikamp C., Lopuhaa H.P., Meester L.E. A Modern Introduction to Probability and Statistics. 2005. – подробный ясный учебник по теории вероятностей и математической статистике с большим количеством примеров и упражнений

Нейронные сети и глубинное обучение

@pythonlbooks – здесь вы можете бесплатно скачать книги по python, актуальные на 2023 год.

Если вы нашли эту статью интересной, то вы можете поддержать нас лайком, комментарием и подпиской!

+1
1
+1
6
+1
2
+1
0
+1
0

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *