AI&ML/preprocessing2 상관계수 code 상관계수 코드 import seaborn as sns # 상관관계 matrix 작성correlation_matrix = train.corr() # 보통 heatmap으로 표현!!mask = np.triu(np.ones_like(correlation_matrix, dtype = bool)) # 하삼각을 가리려면 np.tril plt.figure(figsize = (15, 15))sns.heatmap(correlation_matrix, annot = True, cmap = "coolwarm", fmt = ".2f", mask = mask, vmin = -1, vmax = 1) plt.title("correlation matrix") plt.show() # 상관계수 값 그래프에 표시# heatmap 색 지정.. 2024. 7. 14. 이상치 제거 방법 code IQR (Interquartile Range) 방법 # 함수 생성def detect_outlier_iqr(column): q1 = column.quantile(0.25) q3 = column.quantile(0.75) iqr = q3 - q1 lower_boundary = q1 - iqr * 1.5 upper_boundary = q3 + iqr * 1.5 outlier = (column upper_boundary) return outlier # True와 False로 나타냄outliersr_iqr = train.apply(detect_outlier_iqr) print(outliersr_iqr) # 적용train = train[~outliersr_iqr... 2024. 7. 7. 이전 1 다음 728x90