Наборы данных для машинного обучения (ML) и экспериментов

Наборы данных для машинного обучения (ML) и экспериментов

Наборы данных для машинного обучения (ML) и экспериментов Как специалист по Data Science, могу сказать, что данные являются основой любого проекта. В этой статье рассматриваются наиболее распространённые и популярные наборы…

Раскрытие возможностей Data Science: освоение Python

Раскрытие возможностей Data Science: освоение Python

Раскрытие возможностей Data Science: освоение Python Сфера Data Science невообразимым образом меняет сегодняшний рынок. С тех пор как it начало стремительно развиваться, он постоянно совершенствовался и стал самым незаменимым инструментом…

Руководство по эффективной визуализации данных: выбор правильного графика

Руководство по эффективной визуализации данных: выбор правильного графика

Руководство по эффективной визуализации данных: выбор правильного графика Когда я впервые начал работать с визуализацией данных, я обнаружил, что мне трудно выбрать правильный тип диаграммы для точного представления данных. Было…

Эффективная визуализация данных (data visualization): 9 ценных советов по повышению качества ваших графиков

Эффективная визуализация данных (data visualization): 9 ценных советов по повышению качества ваших графиков

Как незначительные изменения могут существенно повлиять на коммуникативную силу ваших визуализаций (data visualization)? Посмотрите на этого беднягу сверху. Он несколько дней работал над тем, чтобы извлечь из своих данных какую-то…

Введение в развёртывание ML: Flask, Docker и Locust

Введение в развёртывание ML: Flask, Docker и Locust

Введение в развёртывание ML Введение Вы потратили много времени на EDA, тщательно проработали все функции, несколько дней настраивали модель и, наконец, получили то, что хорошо работает в тестовом варианте. Теперь,…

Гайд по работе с изображениями Python Pillow для Датасаентиста

Гайд по работе с изображениями Python Pillow для Датасаентиста

Данный туториал является переводом статьи, написанной Stephen Grupetta. Все изображения и коды скопированы без изменений. В конце вы найдете примечания относительно данной информации, а также ссылку на github с работающим кодом. Если…

5 Шагов для разработки уникальных Data Science проектов

5 Шагов для разработки уникальных Data Science проектов

Возможно, самая сложная часть любого проекта – это придумать новую, но выполнимую идею. Вы часами можете просматривать существующие наборы данных и пытаться придумать новые интересные идеи. Но вот в чём…

19 Датасетов для анализа данных, о которых вы скорее всего не слышали.

19 Датасетов для анализа данных, о которых вы скорее всего не слышали.

Хотя анализ данных всегда носит технический характер, вы всё равно можете получать от этого процесса удовольствие. Работа с интересными датасетами отличная практика, благодаря таким датасетам, вы сможете создать различные проекты,…

Датасеты в открытом доступе

Датасеты в открытом доступе

Мы представляем вам огромный набор открытых датасетов для анализа данных. Mall Customers Dataset — данные посетителей магазина: id, пол, возраст, доход, рейтинг трат. (Вариант применения: Customer Segmentation Project with Machine Learning) Рост…

Топ расширений VS Code для датасаентиста.

Топ расширений VS Code для датасаентиста.

VS Code — один из лучших редакторов кода, функциональность которого легко расширять. Такую возможность обеспечивает встроенный маркетплейс расширений, позволяющий легко находить и устанавливать их в редактор. Любой специалист по инженерии данных…

6 новых библиотек Machine Learning (ML), которые стоит изучить, чтобы улучшить свои навыки в 2023

6 новых библиотек Machine Learning (ML), которые стоит изучить, чтобы улучшить свои навыки в 2023

Немного мотивации На дворе только начался 2023 год, а это значит, что пришло время открыть для себя новые тенденции в области Data Science и машинного обучения. Хотя старые материалы по-прежнему…

Обучаем с YOLOv8 на пользовательских данных? YOLOv8 инструкция по работе

Обучаем с YOLOv8 на пользовательских данных? YOLOv8 инструкция по работе

YOLOv8🔥был выпущен компанией Ultralytics вчера (10 января 2023 г.). YOLOv8 это новые достижения в области компьютерного зрения, которые привели к огромному прорыву в том, как мы воспринимаем, анализируем и понимаем…

50 бесплатных датасетов для создания неотразимого портфолио (2023)

50 бесплатных датасетов для создания неотразимого портфолио (2023)

В этой статье мы расскажем вам, где найти датасеты для различных проектов: Если вы хотите улучшить своё портфолио, показав, что умеете хорошо визуализировать данные, или если у вас есть несколько…

Прогнозирование временных рядов криптовалют с Python

Прогнозирование временных рядов криптовалют с Python

В обанкротившейся криптофирме FTX отсутствует, по меньшей мере, 1 миллиард долларов клиентских средств, а их токен FTX потерял большую часть своей стоимости в ноябре 2022 года. Как бы вы уберегли…

7 лучших веб-сайтов для изучения Data Science: Совершенствуйте свои навыки и знания!

7 лучших веб-сайтов для изучения Data Science: Совершенствуйте свои навыки и знания!

Введение в Data Science и машинное обучение Приветствую всех! Вы заинтересованы в дальнейшем изучении Data Science и машинного обучения? Эти области связаны с использованием научных методов и систем для извлечения…

Самая быстрая библиотека для работы с данными. Как Pandas, но гораздо быстрее (Polars)

Самая быстрая библиотека для работы с данными. Как Pandas, но гораздо быстрее (Polars)

Давайте посмотрим правде в глаза. Фреймворк Pandas медленный. Когда у вас есть миллионы строк в вашей структуре данных, становится очень неприятно ждать в течение минуты выполнения одной строки кода. В…

20 лучших бесплатных книг по Python для начинающих и продвинутых программистов

20 лучших бесплатных книг по Python для начинающих и продвинутых программистов

Python – это интерпретируемый язык программирования, используемый для веб-разработки, машинного обучения и анализа данных. Он является идеальным языком для начинающих, так как его легко выучить и понять.Если вы хотите научиться…

100 статистических терминов для улучшения навыка программирования, Data Science и исследований (Часть 1)

100 статистических терминов для улучшения навыка программирования, Data Science и исследований (Часть 1)

1. Статистические методы Для анализа данных используются 2 главных типа статистических методов: Описательная статистика Описательная статистика (или дескриптивная статистика) занимается обработкой данных, их систематизацией, наглядным представлением в форме графиков и…