Визуализация в Python: сравнительный анализ Matplotlib и Plotly. Шпаргалка по визуализации данных.

Визуализация в Python: сравнительный анализ Matplotlib и Plotly. Шпаргалка по визуализации данных.

Data Scientist работает с огромным объемом данных, который необходимо проанализировать и обработать. Одним из подходов к анализу данных является их визуализация с использованием графического представления. Сегодня существует множество библиотек для…

Метод SHAP для категориальных признаков

Метод SHAP для категориальных признаков

Категориальные признаки необходимо преобразовывать, прежде чем использовать их в модели. Зачастую это делается с помощью прямого кодирования  —  в итоге получаем бинарную переменную для каждой категории. Проблемы не возникают до…

Анализ данных для выявления признаков неструктурированном тексте  с помощью pandas и json.

Анализ данных для выявления признаков неструктурированном тексте  с помощью pandas и json.

При анализе данных есть необходимость выявлять объекты контроля по атрибутам, размещенным в неструктурированном текстовом поле. На первый взгляд, задача может показаться легкой, если анализируемый объем незначительный, но когда объем обрабатываемой…

Машинное обучение при маржинальной торговле

Машинное обучение при маржинальной торговле

Ошибочное определение уровня риска клиента может привести к низкой доходности банка и повышенному риску для банка, в т.ч. репутационному, так как недостаточная квалификация клиента может привести к неграмотным инвестициям, что…

Топ 5 асинхронных веб-фреймворков на Python

Топ 5 асинхронных веб-фреймворков на Python

Асинхронность уже не является просто модным словечком в сообществе Python. После выпуска библиотеки asyncio в версии 3.5, разработчики Python признали влияние Node.js в сфере веб-разработки и ввели в язык два…

PyArmor: как запутать код, чтобы защитить программное обеспечение

PyArmor: как запутать код, чтобы защитить программное обеспечение

Все еще не шифруете свой скрипт? Тогда самое время изучить обфускацию. Сегодня познакомлю с полезной библиотекой PyArmor, расскажу о двух методах работы модуля и на собственном примере покажу как запутать…

Инструкция для быстрого овладения наукой о данных.

Инструкция для быстрого овладения наукой о данных.

Я ЗАКАНЧИВАЮ ФАКУЛЬТЕТ КОМПЬЮТЕРНЫХ НАУК. ПРЕДЛОЖЕНИЙ ПО ТРУДОУСТРОЙСТВУ НЕ ПОЛУЧИЛ. ХОТЕЛ БЫ В ТЕЧЕНИЕ МЕСЯЦА СТАТЬ СПЕЦИАЛИСТОМ ПО ОБРАБОТКЕ ДАННЫХ, НЕ ТРАТЯ ДЕНЬГИ НА ДОРОГОСТОЯЩИЕ КУРСЫ. НЕ МОГЛИ БЫ ВЫ…

Как превратить Google Таблицы в базу данных с помощью Python

Как превратить Google Таблицы в базу данных с помощью Python

Знаете ли вы, что Google Таблицы можно использовать в качестве упрощенной базы данных? Google Таблицы  —  это облачное приложение для работы с электронными таблицами, которое может хранить данные в структурированном…

Как самостоятельно выучиться на дата-саентиста, не бросая на ветер деньги. Бесплатные курсы для аналитика данных.

Как самостоятельно выучиться на дата-саентиста, не бросая на ветер деньги. Бесплатные курсы для аналитика данных.

Недавно собрал ответ на этот вопрос достаточно развернуто, на мой взгляд, чтобы поделиться им с широкой аудиторией. Не все платные курсы плохие (хотя большинство — да — из-за механизмов отбора,…

Виртуальные окружения. Подробная инструкция на Python.

Виртуальные окружения. Подробная инструкция на Python.

Продолжаем серию “Python.Уроки”. На этот раз мы изучим, что такое виртуальные окружения в Python, зачем они нужны и как их использовать. Познакомимся с инструментами virtualenv и venv для создания виртуальных окружений.…

🐍📊 Графики в Python: 9 видов визуализации, привлекающих внимание лучше, чем гистограмма. Инструкция по визуализации данных.

🐍📊 Графики в Python: 9 видов визуализации, привлекающих внимание лучше, чем гистограмма. Инструкция по визуализации данных.

Гистограмму нетрудно создать и просто понять. Однако есть и другие виды графиков, способных донести идею в некоторых случаях гораздо лучше привычной гистограммы. Ловите девять идей (с кодом), которые можно использовать…

Инструкция по Работе с Библиотекой PyTorch-Ignite

Инструкция по Работе с Библиотекой PyTorch-Ignite

PyTorch — среда глубокого обучения, которая была принята такими технологическими гигантами, как Tesla, OpenAI и Microsoft для ключевых исследовательских и производственных рабочих нагрузок. PyTorch-Ignite — это библиотека высокого уровня, помогающая гибко и…

Большое руководство по визуализации. Визуализация данных с помощью веб-фреймворка Dash.

Большое руководство по визуализации. Визуализация данных с помощью веб-фреймворка Dash.

Dash является довольно интересным Веб-фреймворком для визуализации данных и имеет в семе довольно много полезных функций в сочетании с простотой их применения. Сам Dash это некий коллаб  HTML, React.Js, Flask …

🐍⛩️🥤 Руководство для начинающих по шаблонам Jinja в Flask

🐍⛩️🥤 Руководство для начинающих по шаблонам Jinja в Flask

Подробный гайд по шаблонизатору Jinja: от создания первого шаблона, использования условных операторов и for-циклов до применения фильтров и макросов. С помощью Jinja вы можете создавать шаблоны, имеющие широкие возможности и обеспечивающие работу интерфейсов веб-приложений…

Коллаборативная фильтрация и ее реализация на Python.

Коллаборативная фильтрация и ее реализация на Python.

Последние несколько лет в интернет-магазинах, онлайн-кинотеатрах и других сервисах активно развиваются алгоритмы отслеживания интересов пользователей, на основе которых составляется индивидуальный список интересных товаров. Рекомендательные системы — win-win инструмент как для владельцев…

Что такое цикломатическая сложность ? Какие бывают метрики для измерения сложности кода на примере Python?

Что такое цикломатическая сложность ? Какие бывают метрики для измерения сложности кода на примере Python?

Упрощение кода приложений Python с помощью рефакторинга. Часть 1 В этой серии статей рассказано о способах измерения сложности кода и о том как избавиться от излишней сложности с помощью рефакторинга.…

Паттерн Абстрактная фабрика, реализация на python

Паттерн Абстрактная фабрика, реализация на python

Абстрактная фабрика (англ.Abstract factory) — порождающий шаблон проектирования, предоставляет интерфейс для создания семейств взаимосвязанных или взаимозависимых объектов, не специфицируя их конкретных классов. Шаблон реализуется созданием абстрактного класса Factory, который представляет собой интерфейс для…

 Различные варианты визуализации данных с примерами кода.

 Различные варианты визуализации данных с примерами кода.

Визуализация данных — это большая часть работы специалистов в области data science. На ранних стадиях развития проекта часто необходимо выполнять разведочный анализ данных (РАД, Exploratory data analysis (EDA)), чтобы выявить закономерности, которые…

Градиентый бустинг — подробный разбор алгоритма машинного обучения.

Градиентый бустинг — подробный разбор алгоритма машинного обучения.

Хотя большинство победителей соревнований на Kaggle используют композицию разных моделей, одна из них заслуживает особого внимания, так как является почти обязательной частью. Речь, конечно, про Градиентный бустинг (GBM) и его вариации. Возьмем, например.…

Алгоритмы машинного обучения. Наивный байесовский алгоритм классификации: преимущества и недостатки

Алгоритмы машинного обучения. Наивный байесовский алгоритм классификации: преимущества и недостатки

Наивный байесовский классификатор (Naive Bayes classifier) – это очень популярный в машинном обучении алгоритм, который в основном используется для получения базовой точности набора данных. Изучим его преимущества и недостатки, а…