12 бесплатных материалов по статистике – разберется каждый
Многие из ошибок, совершаемые аналитиками, да и не только аналитиками, но и продактами, предпринимателями, маркетологами вызваны непониманием концепций статистики, что приводит к запуску неправильного теста или неправильной интерпретации результатов.
Поэтому тут подборка материалов, которые помогут разобраться (бесплатно все, кроме книг – их возможно придется приобрести).
“Статистика для чайников” (Рамси) и “Статистика и котики” (Савельев) – очень простые книги, которые подойдут каждому. В “Статистика и котики” все объсняется на котах, а “Статистика для чайников” много интересных примеров из жизни.
Statistics
Университет: Udacity — это сайт, появившийся в результате эксперимента Стэнфордского университета с лекциями, выложенными в открытый доступ. Преподаватели и профессора из разных учебных заведений создают свои курсы и распространяют их с помощью данного ресурса.
Лекторы: Шон Ларвэй, Рональд Роджерс, Кэти Корманик (помощник). Шон Ларвэй — доктор наук, изучал поведенческий анализ, потом занялся психофармакологией. Преподает статистику уже более 15 лет. Рональд Роджерс — профессор психологии в Университете штата в Сан-Хосе, изучал поведенческую неврологию, создал свои курсы по статистике и исследовательским методам для разных уровней обучения. Кэти Корманик — составитель учебных планов и консультант по образованию. Имеет степень магистра наук в области международного обучения.
Краткое описание: курс должен научить простым и действенным методам описания и понимания информации, чтобы студенты могли более точно принимать решения. Он включает в себя применение статистики в повседневной жизни, сбор данных через наблюдение и эксперименты, организация и описание данных, статистические выводы с помощью оценок и проверок гипотез, корреляция и простая регрессия и многое другое.
Содержание:
- статистические исследовательские методы, частотные распределения и визуализация данных;
- среднее значение, изменчивость;
- вероятности и нормальное распределение, выборочное распределение;
- оценка, проверка статистических гипотез;
- t-критерии, дисперсионный анализ;
- корреляция, регрессия, критерий хи-квадрата.
Предполагаемые исходные знания: базовое понимание пропорций (доли, проценты, десятые части), отрицательных чисел, основ алгебры.
Срок обучения: зависит от скорости вашего обучения.
Сертификат: доступен после получения первого уровня знаний по курсу.
Введение в статистику от Stanford University – основные концепции статистики от одного из лучших университетов мира.
Статистика для экспериментов от Harvard University – статистика для проведения экспериментов от одного из лучших университетов мира. Правда, в курсе используется язык R.
Вероятность и статистика в науке о данных с использованием Python от SanDiego University – теория вероятности и статистика с примесью Python.
Статистическое мышление для Data Scientist и аналитиков данных от Columbia University – применение аналитического мышления в различных областях науки о данных.
Основы статистики на Stepik: 1 часть, 2 часть, 3 часть. Его очень часто рекомендуют, видимо потому что это чуть ли не единственный курс по статистике на русском. Но мне он кажется не совсем удачным.
Mathematical Biostatistics Boot Camp
Платформа: Coursera
Университет: университет Джона Хопкинса — частный исследовательский университет, названный по имени своего основателя; основан в 1876 г. Широко занимается научной деятельностью — в разное время там работало более тридцати лауреатов Нобелевской премии. Является организатором международных Гордоновских конференций.
Лектор: Брайан Каффо — доцент кафедры биометрии на факультете здравоохранения. Он работает в области вычислительной статистики и нейроинформатики. За свои исследования получил президентскую награду PECASE.
Краткое описание: биометрия — это статистика, примененная к биомедицинским исследованиям. Данный курс должен помочь студентам глубже понять этот раздел науки. После его завершения слушатели будут знать на базовом уровне цели, предпосылки, плюсы и минус вероятностных моделей в медицине. Такой подход даст им в руки инструмент для дальнейшего самообучения. Курс включает в себя изучение теории вероятности, случайных переменных, распределений, математических ожиданий, доверительных интервалов и многого другого.
Содержание:
- Математическая биометрия, вероятностные выборки и их свойства;
- статистическая вероятность;
- доверительные интервалы;
- графический и прикладной анализ данных, использование диаграмм рассеивания, ящичковых диаграмм и отображения многовариантных данных.
Предполагаемые исходные знания: необходимо разбираться в математическом анализе, теории множеств и иметь достаточный уровень математической грамотности. Полезно также обладать некоторыми навыками программирования.
Срок обучения: 7 недель.