Python 문법/Pandas_Matplotlib & Seaborn 6

[상관관계차트] plt.scatter() & sb.regplot()

Matplotlib 분포도 그리기 : 변수간의 관계 plt.scatter(data=cars, x='displ', y='comb') plt.xlabel('Displacement (L)') plt.ylabel('Combined Fuel Eff(mpg)') plt.title('Disple vs comb ') plt.show() Matplotlib 상관관계 분석하기 regression : 데이터에 fitting 한다 : 기울기 추가 sb.regplot(data=cars, x='displ', y='comb') plt.xlabel('Displacement (L)') plt.ylabel('Combined Fuel Eff(mpg)') plt.title('Disple vs comb ') plt.show()

[상관관계차트] sb의 heatmap() 함수로 비율 비교

# 데이터 프레임의 수치를 바로 색깔의 진하기로 변경하는 히트맵 # seaborn의 heatmap 함수를 이용한다. sb.heatmap(data= df1) plt.show() red를 purpl로 색상 변경 sb.heatmap(data= df1, cmap= 'RdPu') plt.show() 숫자추가 sb.heatmap(data= df1, cmap= 'RdPu',annot=True) plt.show() 소수점 1자리로 변경 sb.heatmap(data= df1, cmap= 'RdPu',annot=True, fmt='.1f') plt.show() 간격조절 sb.heatmap(data= df1, cmap= 'RdPu',annot=True, fmt='.1f', linewidths=0.8) plt.show() 사..

[상관관계차트] sb의 pairplot() 함수로 연관성확인

sb.pairplot(data=sb) plt.show() 또는 sb.pairplot(data=sb, vars=[비교할 컬럼들]) plt.show() (예시) sb.pairplot(data=crime_anal[['강도', '살인', '폭력']]) plt.show() regression : 선추가 sb.pairplot(data=crime_anal[['강도', '살인', '폭력']], kind='reg') plt.show() crime_anal[['강도', '살인', '폭력']].corr() sb.pairplot(data= , x_vars= , y_vars= , kind='reg') plt.show()

[상관관계차트] plot(), .sort_values().plot() 그래프로 컬럼의 데이터 비교

데이터프레임의 plot 함수는 x축에는 인덱스를 y축에는 컬럼의 값을 세팅한다. plt.plot(df) plt.show() df.plot() plt.show() bar로 표현 df['가져올 컬럼'].plot(kind='bar') plt.show() 수평으로 변경 df['가져올컬럼'].plot(kind='barh') plt.show() 사이즈변경 plt.figure(figsize =(10, 8)) df['가져올컬럼'].plot(kind='barh') plt.show() 정렬해서 그리기 df['가져올컬럼'].sort_values().plot(kind='bar') plt.show() 오름차순으로 정렬해서 그리기 df['가져올컬럼'].sort_values(ascending=False).plot(kind='bar..

[Matplotlib] plot(), countplot(), pie(), hist(), subplot()

함수를 사용해서 그래프 영역을 만들고, 몇 개의 선을 표현하고, 레이블로 꾸미는 등의 일을 할 수 있습니다. import matplotlib.pyplot as plt import numpy as np x = np.arange(0, 10, 0.2) y = 2* x plt.plot(x, y) plt.show() Matplotlib Seaborn # 카테고리 별로 데이터가 얼마나 있는지 차트로 표시 sb.countplot(data= , x= ' ') plt.show() Matplotlib 색 지정하기 sb.color_palette()[색 인덱스] base_color = sb.color_palette()[] sb.countplot(data= df, x= 'generation_id', color=base_colo..