Среда, 3 Января 2024
Просмотрел видео гет стартед из курса фаст аи. Довольно интересно. Ссылка на урок тут. Нужно еще прочитать раздел из книги, чтобы лучше запомнить и запустить самостоятельно ноутбук
Версия на кагле тут
Изучил несколько видов графиков из библиотеки сиборн
lineplot
sns.lineplot(data=spotify_data)
- рисует линии из данных
Пример
# Set the width and height of the figure. 16 inch width and 6 inch hight
plt.figure(figsize=(14,6))
# Add title
plt.title("Daily Global Streams of Popular Songs in 2017-2018")
# Line chart showing daily global streams of each song
sns.lineplot(data=spotify_data)
Так можно нарисовать линии только для нескольких колонок из датасета
# Set the width and height of the figure
plt.figure(figsize=(14,6))
# Add title
plt.title("Daily Global Streams of Popular Songs in 2017-2018")
# Line chart showing daily global streams of 'Shape of You'
sns.lineplot(data=spotify_data['Shape of You'], label="Shape of You")
# Line chart showing daily global streams of 'Despacito'
sns.lineplot(data=spotify_data['Despacito'], label="Despacito")
# Add label for horizontal axis
plt.xlabel("Date")
Bar chart
# Set the width and height of the figure
plt.figure(figsize=(10,6))
# Add title
plt.title("Average Arrival Delay for Spirit Airlines Flights, by Month")
# Bar chart showing average arrival delay for Spirit Airlines flights by month
sns.barplot(x=flight_data.index, y=flight_data['NK'])
# Add label for vertical axis
plt.ylabel("Arrival delay (in minutes)")
Heat map
# Set the width and height of the figure
plt.figure(figsize=(14,7))
# Add title
plt.title("Average Arrival Delay for Each Airline, by Month")
# Heatmap showing average arrival delay for each airline by month
sns.heatmap(data=flight_data, annot=True)
# Add label for horizontal axis
plt.xlabel("Airline")
Scatterplot
sns.scatterplot(x=insurance_data['bmi'], y=insurance_data['charges'])
Регплот такойже как и скейтерплот, только на нем есть регрессионая линия которая показывает тренд в данных
sns.regplot(x=insurance_data['bmi'], y=insurance_data['charges'])
Можно сделать точки разных цветов. Например если задать параметр hue, он расскрасит в разные цвета значения 3го параметра
sns.scatterplot(x=insurance_data['bmi'], y=insurance_data['charges'], hue=insurance_data['smoker'])
Тоже что и hue, только с регрессионными линиями показывающими тренд
sns.lmplot(x="bmi", y="charges", hue="smoker", data=insurance_data)
Swarmplot
sns.swarmplot(x=insurance_data['smoker'],
y=insurance_data['charges'])
smoker - категориональная колнка со значениями да и нет. charges - числовая. По игрику будут цифры, а по иксу 2 колонки с да и нет
На этом на сегодня все. Завтра буду изучать как распределения рисовать