Bamboolib : Инструментарий для интеллектуального исследования и анализа данных

Введение:

Возможность без особых усилий исследовать и манипулировать наборами данных подобна криптониту в вашем наборе инструментов. Представьте себе, что у вас есть инструмент, позволяющий не только с беспрецедентной легкостью погружаться в данные, но и быстро генерировать код, необходимый для воспроизведения полученных результатов. Bamboolib – это небольшая жемчужина, доступная в экосистеме Python и призванная преобразить ваш опыт работы с данными.

Настройка:

#install
pip install bamboolib
#import
import bamboolib as bam
#launch
bam

Рассмотрим набор фиктивных данных
GIF

Launching Data

Магия заключается в том, что код предоставляет

import pandas as pd; import numpy as np
titanicdata = pd.read_csv(bam.titanic_csv)

Основное, что необходимо сделать, – это понять набор данных.

  • Структура данных: Изучите размер и размеры набора данных, включая количество строк и столбцов. Понимание базовой структуры набора данных имеет решающее значение.
  • Отсутствующие данные: Проверьте, нет ли в наборе данных пропущенных значений. Отсутствующие данные могут повлиять на качество анализа, поэтому необходимо решить, как с ними работать (вводить или удалять).
  • Распределение данных: Изучите распределение числовых переменных. Для этого необходимо просмотреть сводные статистики, такие как среднее значение, медиана, стандартное отклонение, а также визуализации, такие как гистограммы или квадратные диаграммы.
  • Корреляция данных: поиск корреляции данных

Таблица исследования данных как раз и позволяет это сделать

GIF

Exploring Data

Создание различных визуализаций данных, таких как диаграммы рассеяния, гистограммы, тепловые карты и гистограммы, для получения информации и выявления потенциальных областей интереса.GIF

Creating visuals

#### Histogram
import plotly.express as px
fig = px.histogram(titanicdata.dropna(subset=['Age']), x='Age', color='Survived', facet_row='Sex')
fig
#### Barplot
import plotly.express as px
fig = px.bar(titanicdata, y='Survived', x='Pclass')
fig

Вы узнаете, как эта библиотека может помочь вам стать более продуктивным, эффективным и, в конечном счете, более успешным в ваших начинаниях, связанных с данными, – от функций исследования наборов данных во время выполнения программы до возможности генерировать код “на лету”.

+1
0
+1
0
+1
0
+1
0
+1
0

Ответить

Ваш адрес email не будет опубликован. Обязательные поля помечены *