Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Математика — это краеугольный камень Data Science. Хотя некоторые теоремы, аксиомы и формулы кажутся слишком абстрактными и далекими от практики, на самом деле без них невозможно по-настоящему глубоко анализировать и систематизировать огромные массивы данных.

Для специалиста Data Science важны следующие направления математики:

  • статистика;
  • теория вероятностей;
  • математический анализ;
  • линейная алгебра.

Статистика и теория вероятностей

Сложно переоценить важность знания статистики для Data Scientist любого уровня. Все классическое machine learning основано на statistical learning. Более того, на нем же основываются стандартные A/B-тесты.

Источники для вдохновения:

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

All of Statistics
Larry Wasserman

Как пишет сам автор: «This book is for people who want to learn probability and statistics quickly».

В книге даются все основные положения теории вероятностей и статистики.

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Топовые бесплатные курсы по статистике

  1. Khan Academy Statistics and probability series (beginner-friendly).
  2. Seeing Theory: A visual introduction to probability and statistics.
  3. Intro to Descriptive Statistics from Udacity.
  4. Intro to Inferential Statistics from Udacity.
  5. Statistics with R Specialization from Coursera.
  6. Stanford CS229 Probability Theory review.

Основы статистики (3 части)
Образовательная платформа Stepik

Курс по статистике для новичков. Охватывает все элементарные понятия.

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Statistics Fundamentals Succinctly Katharine
Alexis Kormanik

В предыдущей статье уже была рекомендована эта книга, но повторить будет не лишним. 🙂

В первых разделах приведены основные определения с иллюстрациями и комментариями, в последних раскрывается значимость T- и Z-тестов. Материалы изложены доступным языком, с минимально необходимым математическим аппаратом. Это руководство — отличное введение в статистику с точки зрения практики.

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Теория вероятностей и математическая статистика
Н. Ш. Кремер

Учебник ориентирован на экономистов, поэтому сложность и глубина понятий не шокирует новичка в Data Science. Подходит для изучения основ перед погружением в профильную литературу.

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Теория вероятностей и математическая статистика
А. И. Кибзун, Е. Р. Горяинова, А. В. Наумов, А. Н. Сиротин

Этот базовый курс дает более глубокие представления, чем предыдущий. Кроме
теории включает практические задания и справочные материалы.

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Основные понятия теории вероятностей и математической статистики
М. Я. Кельберт, Ю. М. Сухов

Прекрасный вариант для тех, кто уже хорошо знаком с темой и хочет получить более глубокие знания.

Бонус

  1. Deep Learning book.
  2. CMU Math Background for ML course.
  3. Mathematics for Machine Learning book.

Математический анализ

На первый взгляд это направление необходимо больше в стенах университетов, однако без него не удастся разобраться с backpropagation или качественно освоить курс по deep learning.

Восполнив пробелы в статистике, самое время приступить к изучению материалов по этому разделу. А их превеликое множество.

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Calculus
edX

Курс от Массачусетского технологического института, состоящий из 3 частей:

  • Calculus 1A: Differentiation — курс о нахождении производной, ее геометрической интерпретации и физическом смысле.
  • Calculus 1B: Integration — курс о нахождении интеграла, его связи с производной и применении в инженерном проектировании, научном анализе, теории вероятностей и статистике.
  • Calculus 1C: Coordinate Systems & Infinite Series — курс об исчислении кривых, системах координат, приближении функций к полиномам и бесконечных рядах. Все это необходимо для построения математических моделей реального мира.
Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Calculus One
Образовательная платформа Coursera

Курс ориентирован на новичков, но удобная подача материала поможет освежить память и бывалым Data Scientist.

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Khan Academy
Образовательная платформа

Разнообразные материалы, представленные на ресурсе, отлично подойдут для старта изучения математики, программирования и информатики.

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Calculus
James Stewart

Книга славится тщательно проработанным содержанием и довольно простым языком.

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Курс математического анализа
Л. Д. Кудрявцев

Для тех, кто хочет получить более фундаментальные знания о дифференциальных и интегральных исчислениях, теории рядов, функциональном и гармоническом анализе.

Также можно обратить внимание на два курса от MIT:

  1. Single Variable Calculus — курс для самостоятельного изучения дифференцирования, интегральных исчислений и бесконечных рядов.
  2. Multivariable Calculus — еще один курс для самостоятельного изучения дифференцирования, а также интегрального и векторного исчислений функций нескольких переменных.

Линейная алгебра

Без этого раздела математики не получится разработать методы machine learning, смоделировать поведение различных объектов или оптимизировать процесс кластеризации и уменьшения размерности описания данных.

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Linear Algebra
Georgi E. Shilov

В учебнике изложен прекрасно проработанный материал. Книга подойдет для изучения вводного курса в линейную алгебру.

Математика для Data Scientist. Книги, курсы, лекции и рекомендации.

Линейная алгебра
В. А. Ильин, Э. Г. Позняк

Этот учебник был написан на базе лекций преподавателей физического факультета МГУ. Все материалы изложены доступным языком и подойдут для глубокого изучения основных теорий линейной алгебры.
Линейная алгебра нужна в машинном обучении, чтобы понять, как алгоритмы работают под капотом. Все дело в векторных/матричных/тензорных операциях; никакой черной магии!

Вот список крутых бесплатных курсов от ведущих вузов мира:

  1. @machinelearning_interview( разбор вопросов с собеседований и практические мл задачи).
  2. Coding the Matrix course (курс и книги).
  3. 3Blue1Brown Linear Algebra series.
  4. fast.ai Linear Algebra for coders course, очень актуальный ML курс от FastaAI.
  5. The first course in Coursera Mathematics for Machine Learning specialization.
  6. “Introduction to Applied Linear Algebra — Vectors, Matrices, and Least Squares” книга.
  7. MIT Linear Algebra course,учебный курс Linear Algebra от MIT. Он раскрывает теорию матриц и положения линейной алгебры.
  8. Stanford CS229 Linear Algebra review. линейная Алгбра от Стенфорда

Источник

+1
2
+1
0
+1
0
+1
0
+1
0

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *