Погружаемся в графы. Изучаем применение графов в аналитике данных.

Графы — это способ аналитики данных, который был известен ещё с древних времён. С увеличением вычислительных мощностей процессоров и развитием компьютерных алгоритмов удалось приспособить их для решения современных сложных задач.…

⬆️ Достиг потолка в профессии: как устроиться в международную компанию

Расскажем о том, как оценить свой уровень английского, грамотно оформить резюме и успешно пройти собеседование в международную команду. Искать работу за рубежом непросто: там все по-другому, начиная от способов поиска…

Сорок семь передовых методов рефакторинга для улучшения кода Python

Мы рассмотрим методы и фрагменты кода для документации Python, кодирования, тестирования, проверки и непрерывной интеграции. Есть примеры кода Python до и после, в которых применяется каждый метод. Техники делятся на…

Модель Orbit для прогнозирования временных рядов

Временные ряды и бизнес Большое количество современных данных имеют временную структуру. Такой структурой, например, обладают экономические и финансовые переменные (ВВП, инфляция, цены акций), продажи и другие. Многим компаниям необходимо планирование,…

SQL: 45 бесплатных курсов, тренажеров, тестов

Всем привет! Данная подборка может быть местами с уклоном в аналитику, однако основная часть материалов для специалистов любой сферы! Все материалы бесплатны, кроме книг, если вы захотите их приобрести. Бесплатные…

Лайфхаки Python: сэкономить память и ускорить выполнение программы

Python часто ругают за то, что он медленный. Однако в нем существует несколько подходов, которые позволяют писать достаточно быстрый код. Сегодня поговорим про обработку списков. TL;DR Используйте списковые включения (list comprehensions), генераторные выражения…

Цветной Pythоn

Бывает, во время работы на Pythоn требуется вывести большое количество информации в терминал. Среди всего объема текста нас интересует конкретное выражение или даже символ. Как выделить интересующую нас сущность в…

Извлечение таблиц из pdf с помощью camelot

На сайте Newtechaudit.ru описывались различные способы извлечения таблиц с данными из pdf-файлов в excel. В частности, с помощью python-библиотеки camelot (как здесь). Рассмотрим расширенные возможности camelot, позволяющие распознать большую таблицу со сложной…

10 полезных советов по написанию SQL запросов

Сегодня я хочу поговорить о тех простых моментах, которые помогут начинающим программистам SQL более правильно, продуманно и просто составлять логику своих запросов и быстрей освоить язык SQL. Все эти моменты…

Что такое LRU алгоритм.

LRU, или LRU cache (Least Recently Used) — алгоритм для хранения ограниченного объема данных: из хранилища вытесняется информация, которая не использовалась дольше всего. Его применяют при организации кэша. Кэш —…

Web-разработка на Python.Что проще Flask?

В моей работе часто встречаются задачи обработки большого количества данных. Хорошей практикой является визуализировать работу программы. Вместо всем наскучивших консольных приложений можно быстро создать статичное веб-приложение. В моей работе часто…

UDF-функции Spark для обработки данных

Что такое пользовательские функции в Spark: особенности создания и применения Пользовательские функции (User Defined Functions, UDF) – это функции, которые не являются встроенными (уже имеющимися) и создаются самим пользователем во…

Адаптивный фавикон для современных веб-приложений на React

Favicon (фавикон)  —  это термин, образованный из двух слов: favorite (“избранный”) и icon (“иконка”). Фавикон можно увидеть практически в каждом веб-приложении. Этот уникальный значок поможет выделить веб-приложение из тысяч других.…

SQL — Числовые функции. Подробная шпаргалка.

Числовые функции в SQL используются в основном для цифровой манипуляции и/или математических расчетов. В следующей таблице приведены числовые функции: No. Описание функций 1 ABS() Возвращает абсолютное значение числового выражения. 2 ACOS() Возвращает…

В чем разница между модулем и пакетом в Python?

Модули и пакеты значительно упрощают работу программиста. Классы, объекты, функции и константы, которыми приходится часто пользоваться можно упаковать в модуль, и, в дальнейшем, загружать его в свои программы при необходимости.…

Учим Pandas Python. Топ-10 вопросов о Pandas на StackOverflow

Объем структурированных табличных данных увеличивается с каждым днем. Именно поэтому дата-сайентисту так важно уметь анализировать табличные данные с помощью Pandas. Хотя самообучение  —  отличный способ повысить квалификацию, иногда может пригодиться…

Чем отличаются модели МО в науке и производстве

Сейчас типичная исследовательская статья по МО выглядит примерно так: ПРЕДЛАГАЕМ НОВУЮ АРХИТЕКТУРУ МОДЕЛИ X. КАК ВЫЯСНИЛОСЬ, X ПРЕВОСХОДИТ SOTA (SELF-ORGANISING TREE ALGORITHM, САМООРГАНИЗУЮЩИЙСЯ ДРЕВОВИДНЫЙ АЛГОРИТМ) НА Y%. ТАКИМ ОБРАЗОМ, X…

Битва титанов: Java vs Kotlin

Java, по мнению Amazon, один из оптимальных по энергопотреблению и времени выполнения языков программирования. Он зарекомендовал себя для серверной разработки, на тех платформах, где может работать виртуальная машина. Не зря же…

Подробный Гайд по визуализации данных. Часть I

Первая часть главы из моего электронного руководства Google Analytics 2019: Tutorial Book (скачать можно на главной странице), которая посвящена визуализации данных – тренду последних нескольких лет. Часть материалов в этой главе взята из…