← На главную Воспоминания

Среда, 3 Января 2024

Просмотрел видео гет стартед из курса фаст аи. Довольно интересно. Ссылка на урок тут. Нужно еще прочитать раздел из книги, чтобы лучше запомнить и запустить самостоятельно ноутбук

Версия на кагле тут

Изучил несколько видов графиков из библиотеки сиборн

lineplot

sns.lineplot(data=spotify_data) - рисует линии из данных

Пример

# Set the width and height of the figure. 16 inch width and 6 inch hight
plt.figure(figsize=(14,6))

# Add title
plt.title("Daily Global Streams of Popular Songs in 2017-2018")

# Line chart showing daily global streams of each song 
sns.lineplot(data=spotify_data)

Так можно нарисовать линии только для нескольких колонок из датасета

# Set the width and height of the figure
plt.figure(figsize=(14,6))

# Add title
plt.title("Daily Global Streams of Popular Songs in 2017-2018")

# Line chart showing daily global streams of 'Shape of You'
sns.lineplot(data=spotify_data['Shape of You'], label="Shape of You")

# Line chart showing daily global streams of 'Despacito'
sns.lineplot(data=spotify_data['Despacito'], label="Despacito")

# Add label for horizontal axis
plt.xlabel("Date")

Bar chart

# Set the width and height of the figure
plt.figure(figsize=(10,6))

# Add title
plt.title("Average Arrival Delay for Spirit Airlines Flights, by Month")

# Bar chart showing average arrival delay for Spirit Airlines flights by month
sns.barplot(x=flight_data.index, y=flight_data['NK'])

# Add label for vertical axis
plt.ylabel("Arrival delay (in minutes)")

Heat map

# Set the width and height of the figure
plt.figure(figsize=(14,7))

# Add title
plt.title("Average Arrival Delay for Each Airline, by Month")

# Heatmap showing average arrival delay for each airline by month
sns.heatmap(data=flight_data, annot=True)

# Add label for horizontal axis
plt.xlabel("Airline")

Scatterplot

sns.scatterplot(x=insurance_data['bmi'], y=insurance_data['charges'])

Регплот такойже как и скейтерплот, только на нем есть регрессионая линия которая показывает тренд в данных

sns.regplot(x=insurance_data['bmi'], y=insurance_data['charges'])

Можно сделать точки разных цветов. Например если задать параметр hue, он расскрасит в разные цвета значения 3го параметра

sns.scatterplot(x=insurance_data['bmi'], y=insurance_data['charges'], hue=insurance_data['smoker'])

Тоже что и hue, только с регрессионными линиями показывающими тренд

sns.lmplot(x="bmi", y="charges", hue="smoker", data=insurance_data)

Swarmplot

sns.swarmplot(x=insurance_data['smoker'],
              y=insurance_data['charges'])

smoker - категориональная колнка со значениями да и нет. charges - числовая. По игрику будут цифры, а по иксу 2 колонки с да и нет


На этом на сегодня все. Завтра буду изучать как распределения рисовать