100 вопросов c собесов в Data Science и ML

100 вопросов c собесов в Data Science и ML

Доброго времени суток! Представляю вашему вниманию чек-лист из 100 вопросов по Data Science. Вопросы покрывают 5 областей: SQL, Python, Machine Learning, статистику и собственно саму DS. Кому это вообще может…

Как решить задачу классификации в PySpark

Как решить задачу классификации в PySpark

BigData плотно входит в нашу жизнь. Датасеты растут и постоянно изменяются, что усложняет задачу кластеризации клиентов. Обычно для задач кластеризации используется библиотека Sklearn, но с большим объёмом данных её использовать…

Огромный список лучших бесплатных курсов Data Science.

Огромный список лучших бесплатных курсов Data Science.

Изучение data science в 2024 году может быть полезным и важным по нескольким причинам: 1. Растущий спрос на специалистов по data science: С каждым годом все больше компаний осознают значение…

40 Полезных инструментов Дата Саентиста.

40 Полезных инструментов Дата Саентиста.

В мире науки о данных существует бесчисленное множество библиотек и инструментов, которые помогают ускорить работу и повысить эффективность анализа. Но что если я расскажу вам о некоторых полезных библиотеках, о…

Машинное обучение. Где искать работу Дата Саентисту в 2024 году.

Машинное обучение. Где искать работу Дата Саентисту в 2024 году.

В настоящее время профессия дата-саентиста является одной из самых востребованных и перспективных. С развитием технологий и увеличением объема данных, специалисты в области анализа данных становятся незаменимыми для компаний всех отраслей.…

Бесплатные курсы Data Science на 2024 год.

Бесплатные курсы Data Science на 2024 год.

Изучение data science в 2024 году может быть полезным и важным по нескольким причинам: 1. Растущий спрос на специалистов по data science: С каждым годом все больше компаний осознают значение…

Лучшие бесплатные курсы по большим языковым моделям в 2024 году.

Лучшие бесплатные курсы по большим языковым моделям в 2024 году.

В последние годы искусственный интеллект и машинное обучение стали одними из самых актуальных и востребованных технологий. Одной из ключевых составляющих этих областей являются большие языковые модели, которые способны генерировать тексты,…

Визуализация распределений вероятностей в Python.

Визуализация распределений вероятностей в Python.

Из статьи вы узнаете, как визуализировать PMF/PDF важных вероятностных распределений на языке python. Импорт необходимых библиотек . Распределение Бернулли Биномиальное распределение Геометрическое распределение: Отрицательное биномиальное распределение Гипергеометрическое распределение: Дискретное равномерное…

LLaMa-2: вышла лучшая опенсорсная языковая модель

LLaMa-2: вышла лучшая опенсорсная языковая модель

Авторы обновили обучающий датасет, сделав его чище и больше (2T токенов), добавили более быстрый grouped-query attention, удлинили контекст до 4k токенов и учили в несколько этапов: pretraining, supervised fine-tuning, RLHF.…

Популярные API в Data Science Что такое API?

Популярные API в Data Science Что такое API?

Интерфейс прикладного программирования (API) позволяет частям кода взаимодействовать друг с другом. Разработчики используют API для создания сайтов с определенными функциями, например, с интерфейсом Google Maps, вместо того чтобы писать код…

Невероятные шедевры, созданные с помощью Matplotlib

Невероятные шедевры, созданные с помощью Matplotlib

Невероятные шедевры, созданные с помощью Matplotlib Неважно, как сильно вы пытаетесь быть хорошим в чём-то, всегда найдутся другие люди, делающие это намного лучше. Таким примерам нечего завидовать, ими нужно вдохновляться.…

Создание инфографики с помощью Matplotlib

Создание инфографики с помощью Matplotlib

Создание инфографики с помощью Matplotlib Создание захватывающих и привлекательных визуализаций данных имеет важное значение для работы с данными и для того, чтобы быть специалистом по Data Science. Это позволяет нам предоставлять…

Docker для Data Science — введение

Docker для Data Science — введение

Docker для Data Science — введение Когда вы отправляете свой код машинного обучения команде инженеров, могут возникнуть проблемы совместимости с различными операционными системами и версиями библиотек. Эти проблемы могут вызвать сбои…

Базы данных, SQL и моделирование данных — краткий ускоренный курс

Базы данных, SQL и моделирование данных — краткий ускоренный курс

Базы данных, SQL и моделирование данных — краткий ускоренный курс За пять лет работы в корпоративной аналитике я наблюдал большое количество специалистов по обработке данных, приступающих к работе с недостаточными знаниями о…

8 советов по эффективной визуализации данных (Data visualization)

8 советов по эффективной визуализации данных (Data visualization)

8 советов по эффективной визуализации данных (Data visualization) В каждом отдельном Data Science-проекте участвуют как минимум 2 стороны: техническая и нетехническая (заинтересованная сторона может быть каким-либо менеджером или руководителем высшего…

Памятка по TensorFlow: привет глубокому обучению!

Памятка по TensorFlow: привет глубокому обучению!

Введение Вы хотите освоить глубокое обучение с помощью TensorFlow? Независимо от того, являетесь ли вы новичком или опытным специалистом по данным, наша исчерпывающая шпаргалка по TensorFlow поможет вам. С помощью этой памятки…

10 лучших предварительно обученных моделей для встраивания изображений, которые должен знать каждый специалист по данным

10 лучших предварительно обученных моделей для встраивания изображений, которые должен знать каждый специалист по данным

10 лучших предварительно обученных моделей для встраивания изображений, которые должен знать каждый специалист по данным Быстрое развитие компьютерного зрения — вариантов использования классификации изображений ещё больше ускорилось с появлением трансферного…

Python Pandas против Vaex Dataframes: сравнительный анализ

Python Pandas против Vaex Dataframes: сравнительный анализ

Python Pandas против Vaex Dataframes: сравнительный анализ Введение Сферы Data Science и Data Analysis в значительной степени зависят от манипулирования и обработки данных. Поскольку большие и сложные датасеты становятся всё более…

Библиотеки Data Science, которые заслуживают вашего внимания

Библиотеки Data Science, которые заслуживают вашего внимания

Библиотеки Data Science, которые заслуживают гораздо большего внимания В то время как большие ребята, Pandas, Scikit-learn, NumPy, Matplotlib, TensorFlow и т.д., занимают всё ваше внимание, легко пропустить некоторые простые и…