Визуализация распределений вероятностей в Python.

Визуализация распределений вероятностей в Python.

Из статьи вы узнаете, как визуализировать PMF/PDF важных вероятностных распределений на языке python. Импорт необходимых библиотек . Распределение Бернулли Биномиальное распределение Геометрическое распределение: Отрицательное биномиальное распределение Гипергеометрическое распределение: Дискретное равномерное…

LLaMa-2: вышла лучшая опенсорсная языковая модель

LLaMa-2: вышла лучшая опенсорсная языковая модель

Авторы обновили обучающий датасет, сделав его чище и больше (2T токенов), добавили более быстрый grouped-query attention, удлинили контекст до 4k токенов и учили в несколько этапов: pretraining, supervised fine-tuning, RLHF.…

Популярные API в Data Science Что такое API?

Популярные API в Data Science Что такое API?

Интерфейс прикладного программирования (API) позволяет частям кода взаимодействовать друг с другом. Разработчики используют API для создания сайтов с определенными функциями, например, с интерфейсом Google Maps, вместо того чтобы писать код…

Невероятные шедевры, созданные с помощью Matplotlib

Невероятные шедевры, созданные с помощью Matplotlib

Невероятные шедевры, созданные с помощью Matplotlib Неважно, как сильно вы пытаетесь быть хорошим в чём-то, всегда найдутся другие люди, делающие это намного лучше. Таким примерам нечего завидовать, ими нужно вдохновляться.…

Создание инфографики с помощью Matplotlib

Создание инфографики с помощью Matplotlib

Создание инфографики с помощью Matplotlib Создание захватывающих и привлекательных визуализаций данных имеет важное значение для работы с данными и для того, чтобы быть специалистом по Data Science. Это позволяет нам предоставлять…

Docker для Data Science — введение

Docker для Data Science — введение

Docker для Data Science — введение Когда вы отправляете свой код машинного обучения команде инженеров, могут возникнуть проблемы совместимости с различными операционными системами и версиями библиотек. Эти проблемы могут вызвать сбои…

Базы данных, SQL и моделирование данных — краткий ускоренный курс

Базы данных, SQL и моделирование данных — краткий ускоренный курс

Базы данных, SQL и моделирование данных — краткий ускоренный курс За пять лет работы в корпоративной аналитике я наблюдал большое количество специалистов по обработке данных, приступающих к работе с недостаточными знаниями о…

8 советов по эффективной визуализации данных (Data visualization)

8 советов по эффективной визуализации данных (Data visualization)

8 советов по эффективной визуализации данных (Data visualization) В каждом отдельном Data Science-проекте участвуют как минимум 2 стороны: техническая и нетехническая (заинтересованная сторона может быть каким-либо менеджером или руководителем высшего…

Памятка по TensorFlow: привет глубокому обучению!

Памятка по TensorFlow: привет глубокому обучению!

Введение Вы хотите освоить глубокое обучение с помощью TensorFlow? Независимо от того, являетесь ли вы новичком или опытным специалистом по данным, наша исчерпывающая шпаргалка по TensorFlow поможет вам. С помощью этой памятки…

10 лучших предварительно обученных моделей для встраивания изображений, которые должен знать каждый специалист по данным

10 лучших предварительно обученных моделей для встраивания изображений, которые должен знать каждый специалист по данным

10 лучших предварительно обученных моделей для встраивания изображений, которые должен знать каждый специалист по данным Быстрое развитие компьютерного зрения — вариантов использования классификации изображений ещё больше ускорилось с появлением трансферного…

Python Pandas против Vaex Dataframes: сравнительный анализ

Python Pandas против Vaex Dataframes: сравнительный анализ

Python Pandas против Vaex Dataframes: сравнительный анализ Введение Сферы Data Science и Data Analysis в значительной степени зависят от манипулирования и обработки данных. Поскольку большие и сложные датасеты становятся всё более…

Библиотеки Data Science, которые заслуживают вашего внимания

Библиотеки Data Science, которые заслуживают вашего внимания

Библиотеки Data Science, которые заслуживают гораздо большего внимания В то время как большие ребята, Pandas, Scikit-learn, NumPy, Matplotlib, TensorFlow и т.д., занимают всё ваше внимание, легко пропустить некоторые простые и…

Наборы данных для машинного обучения (ML) и экспериментов

Наборы данных для машинного обучения (ML) и экспериментов

Наборы данных для машинного обучения (ML) и экспериментов Как специалист по Data Science, могу сказать, что данные являются основой любого проекта. В этой статье рассматриваются наиболее распространённые и популярные наборы…

Раскрытие возможностей Data Science: освоение Python

Раскрытие возможностей Data Science: освоение Python

Раскрытие возможностей Data Science: освоение Python Сфера Data Science невообразимым образом меняет сегодняшний рынок. С тех пор как it начало стремительно развиваться, он постоянно совершенствовался и стал самым незаменимым инструментом…

Руководство по эффективной визуализации данных: выбор правильного графика

Руководство по эффективной визуализации данных: выбор правильного графика

Руководство по эффективной визуализации данных: выбор правильного графика Когда я впервые начал работать с визуализацией данных, я обнаружил, что мне трудно выбрать правильный тип диаграммы для точного представления данных. Было…

Эффективная визуализация данных (data visualization): 9 ценных советов по повышению качества ваших графиков

Эффективная визуализация данных (data visualization): 9 ценных советов по повышению качества ваших графиков

Как незначительные изменения могут существенно повлиять на коммуникативную силу ваших визуализаций (data visualization)? Посмотрите на этого беднягу сверху. Он несколько дней работал над тем, чтобы извлечь из своих данных какую-то…

Введение в развёртывание ML: Flask, Docker и Locust

Введение в развёртывание ML: Flask, Docker и Locust

Введение в развёртывание ML Введение Вы потратили много времени на EDA, тщательно проработали все функции, несколько дней настраивали модель и, наконец, получили то, что хорошо работает в тестовом варианте. Теперь,…

Гайд по работе с изображениями Python Pillow для Датасаентиста

Гайд по работе с изображениями Python Pillow для Датасаентиста

Данный туториал является переводом статьи, написанной Stephen Grupetta. Все изображения и коды скопированы без изменений. В конце вы найдете примечания относительно данной информации, а также ссылку на github с работающим кодом. Если…

5 Шагов для разработки уникальных Data Science проектов

5 Шагов для разработки уникальных Data Science проектов

Возможно, самая сложная часть любого проекта – это придумать новую, но выполнимую идею. Вы часами можете просматривать существующие наборы данных и пытаться придумать новые интересные идеи. Но вот в чём…