9 бесплатных курсов бизнес английского

9 бесплатных курсов бизнес английского

Для усиления в английском на днях подбирала курсы английского для бизнеса и работы. Поэтому по традиции делюсь с вами. English_forprogrammers Английский для тех специалистов всех уровней. Oxford online English Как…

23 сайта с дата сетами: для усиления портфолио аналитика

23 сайта с дата сетами: для усиления портфолио аналитика

Эта статья для тех, кто хочет укрепить свое портфолио как аналитика или просто попрактиковаться в свободное время. Особенно будет полезно начинающим аналитикам, которые хотят получить опыт в аналитике. t.me/bigdatai –…

Понятие о визуализации данных в Pandas, если вы пришли из Excel

Понятие о визуализации данных в Pandas, если вы пришли из Excel

Прочитав много уроков по визуализации данных Pandas, я до сих пор не могу понять их механику. Создание даже простого сюжета всегда требует от меня изучения документации. И даже после запуска кода…

Python Flask: взаимодействие с контейнерами Docker

Python Flask: взаимодействие с контейнерами Docker

А вам приходила в голову мысль о том, что вам нужно реализовать сервер для обслуживания своих функций? Звучит довольно интересно, может стоит попробовать?  Итак, для этого нужно сделать: Для начала…

8 паттернов проектирования, которые должен знать каждый ML-разработчик

8 паттернов проектирования, которые должен знать каждый ML-разработчик

Паттерны проектирования предлагают комплексные решения проблем, с которыми разработчики сталкиваются каждый день. В этой статье мы рассмотрим 8 паттернов проектирования с примерами кода на Python. Паттерны проектирования в библиотеках…

Руководство по стилю SQL · SQL Style Guide

Руководство по стилю SQL · SQL Style Guide

Вы можете использовать это руководство целиком, сделать его форк или создать своё на его основе. Цель — определить, какой стиль вам подходит больше, и придерживаться его. Если вы хотите предложить изменение или…

Пишем вирусы и зловредное ПО на Python

Пишем вирусы и зловредное ПО на Python

В мире  существует много явлений с сомнительной и спорной репутацией. Например, сюда можно отнести  хоккей на траве, датскую квашеную селедку и мужские трусы-стринги. А еще к этому  списку можно с…

Сегментация изображений с использованием сети обратного внимания

Сегментация изображений с использованием сети обратного внимания

Проблемы Большинство методов семантической сегментации на основе СNN (convolutional neural network, сверточной нейронной сети) сосредоточены на простом получении правильных предсказаний без обучения модели различать классы. По этой причине характеристики менее распространенных классов…

Как создать GIF из графиков Matplotlib в Python

Как создать GIF из графиков Matplotlib в Python

В этой статье рассмотрим метод визуализации данных для 2-мерных временных рядов данных с использованием imageio Мы все знаем, что линейные графики – это самый интуитивный способ визуализации временных рядов.…

Как увеличить скорость Pandas и обрабатывать 10 млн необработанных наборов данных за миллисекунды

Как увеличить скорость Pandas и обрабатывать 10 млн необработанных наборов данных за миллисекунды

За последние годы использование Pandas выросло в бесчисленное количество раз. Покажу вам, как использовать Pandas максимально быстрым способом. Потому что вы не можете ускорить то, что и так быстро работает.…

AWS Personalize для рекомендации новых фильмов пользователям на основе их оценок по сравнению с другими похожими фильмами.

AWS Personalize для рекомендации новых фильмов пользователям на основе их оценок по сравнению с другими похожими фильмами.

Amazon Personalize позволяет разработчикам, не имеющим опыта машинного обучения, легко встраивать сложные возможности персонализации в свои приложения. С помощью Personalize вы предоставляете поток действий из своего приложения, а также список элементов,…

Наука о данных: структура проекта

Наука о данных: структура проекта

Почему необходимо использовать структуру проекта? Когда-то предпочтение было отдано структуре, но, в конце концов, все, что имеет значение, это то, что вам должно быть удобно перемещаться и писать код. Когда…

Погружаемся в графы. Изучаем применение графов в аналитике данных.

Погружаемся в графы. Изучаем применение графов в аналитике данных.

Графы — это способ аналитики данных, который был известен ещё с древних времён. С увеличением вычислительных мощностей процессоров и развитием компьютерных алгоритмов удалось приспособить их для решения современных сложных задач.…

⬆️ Достиг потолка в профессии: как устроиться в международную компанию

⬆️ Достиг потолка в профессии: как устроиться в международную компанию

Расскажем о том, как оценить свой уровень английского, грамотно оформить резюме и успешно пройти собеседование в международную команду. Искать работу за рубежом непросто: там все по-другому, начиная от способов поиска…

Сорок семь передовых методов рефакторинга для улучшения кода Python

Сорок семь передовых методов рефакторинга для улучшения кода Python

Мы рассмотрим методы и фрагменты кода для документации Python, кодирования, тестирования, проверки и непрерывной интеграции. Есть примеры кода Python до и после, в которых применяется каждый метод. Техники делятся на…

Модель Orbit для прогнозирования временных рядов

Модель Orbit для прогнозирования временных рядов

Временные ряды и бизнес Большое количество современных данных имеют временную структуру. Такой структурой, например, обладают экономические и финансовые переменные (ВВП, инфляция, цены акций), продажи и другие. Многим компаниям необходимо планирование,…

SQL: 45 бесплатных курсов, тренажеров, тестов

SQL: 45 бесплатных курсов, тренажеров, тестов

Всем привет! Данная подборка может быть местами с уклоном в аналитику, однако основная часть материалов для специалистов любой сферы! Все материалы бесплатны, кроме книг, если вы захотите их приобрести. А…

Лайфхаки Python: сэкономить память и ускорить выполнение программы

Лайфхаки Python: сэкономить память и ускорить выполнение программы

Python часто ругают за то, что он медленный. Однако в нем существует несколько подходов, которые позволяют писать достаточно быстрый код. Сегодня поговорим про обработку списков. TL;DR Используйте списковые включения (list comprehensions), генераторные выражения…

Цветной Pythоn

Цветной Pythоn

Бывает, во время работы на Pythоn требуется вывести большое количество информации в терминал. Среди всего объема текста нас интересует конкретное выражение или даже символ. Как выделить интересующую нас сущность в…

Извлечение таблиц из pdf с помощью camelot

Извлечение таблиц из pdf с помощью camelot

На сайте Newtechaudit.ru описывались различные способы извлечения таблиц с данными из pdf-файлов в excel. В частности, с помощью python-библиотеки camelot (как здесь). Рассмотрим расширенные возможности camelot, позволяющие распознать большую таблицу со сложной…