Инструкция для быстрого овладения наукой о данных.

Я ЗАКАНЧИВАЮ ФАКУЛЬТЕТ КОМПЬЮТЕРНЫХ НАУК. ПРЕДЛОЖЕНИЙ ПО ТРУДОУСТРОЙСТВУ НЕ ПОЛУЧИЛ. ХОТЕЛ БЫ В ТЕЧЕНИЕ МЕСЯЦА СТАТЬ СПЕЦИАЛИСТОМ ПО ОБРАБОТКЕ ДАННЫХ, НЕ ТРАТЯ ДЕНЬГИ НА ДОРОГОСТОЯЩИЕ КУРСЫ. НЕ МОГЛИ БЫ ВЫ…

Как самостоятельно выучиться на дата-саентиста, не бросая на ветер деньги. Бесплатные курсы для аналитика данных.

Недавно собрал ответ на этот вопрос достаточно развернуто, на мой взгляд, чтобы поделиться им с широкой аудиторией. Не все платные курсы плохие (хотя большинство — да — из-за механизмов отбора,…

🐍📊 Графики в Python: 9 видов визуализации, привлекающих внимание лучше, чем гистограмма. Инструкция по визуализации данных.

Гистограмму нетрудно создать и просто понять. Однако есть и другие виды графиков, способных донести идею в некоторых случаях гораздо лучше привычной гистограммы. Ловите девять идей (с кодом), которые можно использовать…

Инструкция по Работе с Библиотекой PyTorch-Ignite

PyTorch — среда глубокого обучения, которая была принята такими технологическими гигантами, как Tesla, OpenAI и Microsoft для ключевых исследовательских и производственных рабочих нагрузок. PyTorch-Ignite — это библиотека высокого уровня, помогающая гибко и…

Большое руководство по визуализации. Визуализация данных с помощью веб-фреймворка Dash.

Dash является довольно интересным Веб-фреймворком для визуализации данных и имеет в семе довольно много полезных функций в сочетании с простотой их применения. Сам Dash это некий коллаб  HTML, React.Js, Flask …

🐍⛩️🥤 Руководство для начинающих по шаблонам Jinja в Flask

Подробный гайд по шаблонизатору Jinja: от создания первого шаблона, использования условных операторов и for-циклов до применения фильтров и макросов. С помощью Jinja вы можете создавать шаблоны, имеющие широкие возможности и обеспечивающие работу интерфейсов веб-приложений…

Коллаборативная фильтрация и ее реализация на Python.

Последние несколько лет в интернет-магазинах, онлайн-кинотеатрах и других сервисах активно развиваются алгоритмы отслеживания интересов пользователей, на основе которых составляется индивидуальный список интересных товаров. Рекомендательные системы — win-win инструмент как для владельцев…

 Различные варианты визуализации данных с примерами кода.

Визуализация данных — это большая часть работы специалистов в области data science. На ранних стадиях развития проекта часто необходимо выполнять разведочный анализ данных (РАД, Exploratory data analysis (EDA)), чтобы выявить закономерности, которые…

Градиентый бустинг — подробный разбор алгоритма машинного обучения.

Хотя большинство победителей соревнований на Kaggle используют композицию разных моделей, одна из них заслуживает особого внимания, так как является почти обязательной частью. Речь, конечно, про Градиентный бустинг (GBM) и его вариации. Возьмем, например.…

Алгоритмы машинного обучения. Наивный байесовский алгоритм классификации: преимущества и недостатки

Наивный байесовский классификатор (Naive Bayes classifier) – это очень популярный в машинном обучении алгоритм, который в основном используется для получения базовой точности набора данных. Изучим его преимущества и недостатки, а…

Полный список вопросов с собеседований по Python для дата-сайентистов и инженеров

Бывает, что компания ищет дата-сайентиста, а на самом деле ей нужен Python-разработчик. Поэтому при подготовке к собеседованию есть смысл освежить в памяти информацию по Python, а не только штудировать алгоритмы.…

50 новых инструментов для анализа и визуализации данных

50 новых инструментов, демократизирующих процесс анализа и визуализации данных от Леонардо Мерфи. Подобно тому как ранее мы стали свидетелями перехода на платформы сбора данных, работающие по принципу «сделай сам»,…

5 самых сложных примеров в SQL при аналитике данных.

Многие из нас сталкивались в работе себе мощь скорости и эффективности, обеспечиваемую централизацией вычислений в облачном хранилище данных. Хотя это правда, многие из нас также осознали, что, как и…

10 скриптов автоматизации Python для решения ваших повседневных задач.

Несколько скриптов для автоматизации ваших повседневных задач. Нижу будет приведен полный код Python программ. Почему в эпоху программирования мы все еще делаем то, что можем автоматизировать. Подумайте о задачах, которые…

Магия таблиц стилей Matplotlib. Пошаговая инструкция Визуализации данных на Python

Визуализация данных — важная компетенция любого специалиста по данным. К сожалению, создание готовых к публикации визуализаций данных занимает очень много времени и хорошего вкуса. В мире Python + Matplotlib специалисты…

Визуализация данных GeoJSON и GeoPandas

Визуализация данных GeoJSON GeoJSON — это формат для кодирования различных структур географических данных. Делимся статьей, где автор демонстрирует визуализацию данных GeoJSON с помощью библиотеки GeoPandas. Построим карту данных регионы нью-йоркка.…

Использование GPT-3 для объяснения работы кода

Языковая модель ИИ GPT-3 способна генерировать объяснение того, как работает код. Она поразительно эффективна в этом: ее обучающий набор включает огромное количество исходного кода. Делимся статьей, где автор демонстрирует работу…

Git для Аналитика данных: контроль версий моделей и датасетов с помощью DVC

Публикация представляет собой незначительно сокращенный перевод статьи Кристиана Иванчича Data Version Control With Python and DVC. *** Машинное обучение и наука о данных сопряжены с рядом задач, отличающихся от традиционной разработки…

Генерируем персонажей Властелина Колец с помощью Dall-E2

Прежде чем мы углубимся в результаты, давайте поговорим о том, что такое искусственный интеллект Dall-E2. DALL·E 2 — это новая система искусственного интеллекта, которая может создавать реалистичные изображения и рисунки из…