bookmark_border파이썬 머신러닝

2025-27-100

섹션 2. 파이썬 기반의 머신러닝과 생태계 이해

2. 머신러닝의 개념

머신러닝의 유형

3. 머신러닝의 유형과 데이터의 중요성

파이썬 러닝머신 생태계를 구성하는 주요 패키지

4. 파이썬 기반 머신러닝의 특징및 장점과 구성요소

5. 파이썬기반 머신러닝을 위한 SW의 설치

sklearn 업그레이드

Anaconda Prompt 관리자권한으로 열기

(base) C:\Windows\System32>pip install scikit-learn==1.0.2

Jupyter Notebook

새로운 커널 열기 : new > Python 3(ipykernel)

6. 사이킷런 업그레이드 수행 및 XGBoost와 LightGBM 설치

7. 주피터 노트북 사용법과 넘파이/판다스의 필요성

8. 강의에 사용될 예제 소스 코드 다운로드 받기

9. 넘파이 배열 ndarray 소개

10. 넘파이 배열 ndarray 생성, shape, 차원, 타입 실습

11. numpy ndarray의 axis 축 이해

12. 넘파이 배열 ndarray 초기화 방법과 ndarray차원과 크기를 변경하는 reshape()의 이해 – 01

13. 넘파이 배열 ndarray 초기화 방법과 ndarray차원과 크기를 변경하는 reshape()의 이해 – 02

14. 넘파이 ndarray 인덱싱(Indexing) 이해 – 단일값과 슬라이싱 인덱싱

15. 넘파이 ndarray 인덱싱(Indexing) 이해 – 팬시와 불린 인덱싱

16. 넘파이 ndarray 인덱싱 실습 – 01

17. 넘파이 ndarray 인덱싱 실습 – 02

18. 넘파이 ndarray의 sort와 argsort

19. 넘파이 ndarray의 내적과 전치행렬

20. 판다스(Pandas) 개요와 기본 API – 01

21. 판다스(Pandas) 개요와 기본 API – 02

22. 판다스 value_counts 메소드 소개

23. 판다스 DataFrame의 변환, 컬럼 세트 생성/수정

24. 판다스 DataFrame의 데이터 삭제하기

25. 판다스 Index객체 이해

26. 판다스 데이터 인덱싱과 필터링 – 01

27. 판다스 데이터 인덱싱과 필터링 – 02

28. 판다스 DataFrame의 정렬 그리고 Aggregation함수와 Group by 수행

29. DataFrame의 Groupby시 Named Aggregation적용

30. 판다스 결손 데이터 처리하기

31. 판다스 nunique와 replace의 활용

32. 판다스 람다식 적용하여 데이터 가공하기

33. 파이썬 기반의 머신러닝과 생태계 이해 Summary

섹션 3. 사이킷런으로 시작하는 머신러닝

34. 사이킷런 소개와 머신러닝 분류 예측 모델 개요

35. 첫번째 머신러닝 모델 만들어 보기 – 붓꽃(Iris) 품종 예측

36. 사이킷런의 기반 프레임 워크 익히기 – 주요 API/모듈 및 내장 예제 데이터 세트 소개

37. 학습과 테스트 데이터 세트의 분리

38. 교차검증 – K-Fold와 Stratified K-Fold의 이해 – 01

39. 교차검증 – K-Fold와 Stratified K-Fold의 이해 – 02

40. 교차검증 성능평가 cross_val_score()와 하이퍼 파라미터 튜닝을 위한 GridSearchCV – 01

41. 교차검증 성능평가 cross_val_score()와 하이퍼 파라미터 튜닝을 위한 GridSearchCV – 02

42. 데이터 전처리 – 인코딩 – 01

43. 데이터 전처리 – 인코딩 – 02

44. 데이터 전처리 – 스케일링 – 01

45. 데이터 전처리 – 스케일링 – 02

46. 사이킷런으로 수행하는 타이타닉 생존자 예측 – 01

47. 사이킷런으로 수행하는 타이타닉 생존자 예측 – 02

섹션 4. 평가(Evaluation)

48. 분류(Classification) 성능 평가지표 개요와 정확도(Accuracy) 소개

49. 오차행렬(Confusion Matrix), 정밀도(Precision), 재현율(Recall) 소개

50. 정밀도와 재현율의 트레이드오프(Trade off) – 01

51. 정밀도와 재현율의 트레이드오프(Trade off) – 02

52. F1 Score와 ROC-AUC 이해 – 01

53. F1 Score와 ROC-AUC 이해 – 02

54. 평가 실습 – 피마 인디언 당뇨병 예측

섹션 5. 분류(Classification)

55. 분류(Classification) 개요와 결정트리(Decision Tree) 소개

56. 결정트리 모델 시각화를 위한 Graphviz 설치하기

57. 시각화를 통한 결정 트리 모델의 구조 이해

58. 결정 트리 주요 하이퍼 파라미터의 이해

59. 결정트리 피처 중요도의 이해

60. 결정트리 과적합의 이해

61. 사용자 행동 인식 데이터를 이용한 결정 트리 실습 – 01

62. 사용자 행동 인식 데이터를 이용한 결정 트리 실습 – 02

63. 앙상블 학습의 개요와 보팅(Voting)의 이해

64. 배깅(Bagging)과 랜덤 포레스트(Random Forest)의 이해

65. 랜덤 포레스트 실습

66. 부스팅(Boosting)의 이해와 그래디언트 부스팅 소개 및 실습

67. XGBoost 소개

68. XGBoost를 이용한 위스콘신 유방암 예측(파이썬 Native XGBoost 사용)

69. XGBoost를 이용한 위스콘신 유방암 예측(사이킷런 Wrapper XGBoost 사용)

70. LightGBM 소개

71. LightGBM을 이용한 위스콘신 유방암 예측

72. 그리드 서치(Grid Search) 기반의 하이퍼 파라미터 튜닝 문제점

73. 베이지안 최적화 개요

74. 베이지안 최적화를 위한 HyperOpt 패키지 소개

75. HyperOpt 기본 실습

76. HyperOpt를 이용한 XGBoost 하이퍼 파라미터 튜닝

77. 분류 실습 1 : 캐글경연대회의 산탄데르 은행 고객 만족 예측 – 01

78. 분류 실습 1 : 캐글경연대회의 산탄데르 은행 고객 만족 예측 – 02

79. 분류 실습 1 : 캐글경연대회의 산탄데르 은행 고객 만족 예측 – 03

80. 분류 실습 2: 신용카드 사기 예측 실습 – 01

81. 분류 실습 2: 신용카드 사기 예측 실습 – 02

82. 분류 실습 2: 신용카드 사기 예측 실습 – 03

83. 분류 실습 2: 신용카드 사기 예측 실습 – 04

84. 분류 실습 2: 신용카드 사기 예측 실습 – 05

85. 스태킹 모델 소개 – 기본 스태킹

86. 스태킹 모델 소개 – 교차검증 스태킹

87. 분류(Classification) Summary

88. <신규> Feature Selection의 이해

89. <신규> Recursive Feature Elimination과 SelectFromModel 실습

90. <신규> Permutation Importance 소개 및 실습

91. <신규> 왜 feature importance는 feature selection의 절대 기준이 될 수 없는가?

섹션 6. 회귀(Regression)

92. 회귀(Regression)의 이해

93. 회귀 비용함수 RSS와 경사하강법의 이해

94. 경사하강법을 통한 비용함수 RSS 최소화 – RSS함수의 편미분

95. 경사하강법을 통한 비용함수 RSS 최소화 – 파이썬 코드로 경사 하강법 구현하기

96. 사이킷런 LinearRegression 클래스와 회귀 평가지표 소개

97. 회귀 평가를 위한 사이킷런 API와 유의 사항

98. 사이킷런 LinearRegression을 이용한 보스턴 주택가격 예측

99. 다항회귀(Polynomial Regression)의 이해와 다항회귀를 이용한 보스턴 주택가격 예측

100. 다항회귀를 이용한 과소적합 및 과적합 이해

101. 규제 선형회귀(Regularized Linear Regression)의 개요

102. 릿지(Ridge) 회귀의 이해

103. 라소(Lasso)와 엘라스틱넷(Elastic Net) 회귀의 이해

104. 선형 회귀모델을 위한 데이터 변환

105. 로지스틱 회귀의 이해

106. 로지스틱 회귀를 이용한 위스콘신 암 예측 모델 실습

107. 회귀 트리의 이해

108. 회귀 트리를 이용한 보스톤 주택 가격 예측

109. 회귀 실습 1: 자전거 대여(공유) 수요 예측 – 01

110. 회귀 실습 1: 자전거 대여(공유) 수요 예측 – 02

111. 회귀 실습 2: 캐글경연 주택가격 예측 – Advanced Regression Techniques – 01

112. 회귀 실습 2: 캐글경연 주택가격 예측 – Advanced Regression Techniques – 02

113. 회귀 실습 2: 캐글경연 주택가격 예측 – Advanced Regression Techniques – 03

114. 회귀 실습 2: 캐글경연 주택가격 예측 – Advanced Regression Techniques – 04

115. 회귀 Summary

섹션 7. 차원 축소(Dimension Reduction)

116. 차원 축소 개요

117. PCA(Principal Component Analysis)의 이해

118. 사이킷런 PCA 클래스의 이해

119. PCA를 이용한 붓꽃 데이터 세트의 차원 축소 실습

120. PCA를 이용한 신용카드 데이터 세트의 차원 축소 실습

121. LDA의 이해와 붓꽃 데이터 세트의 차원 축소 실습

122. SVD의 이해

123. SVD를 이용한 행렬 분해 실습 및 NMF(Non Negative Matrix Factorization)의 이해

섹션 8. 군집화(Clustering)

124. 군집화 개요 및 K-Means 군집화의 이해

125. 사이킷런을 이용한 K-Means 군집화 실습 – 01

126. 사이킷런을 이용한 K-Means 군집화 실습 – 02

127. 사이킷런을 이용한 K-Means 군집화 실습 – 03

128. 군집화 성능 평가 – 실루엣 분석의 이해

129. 군집화 성능 평가 – 실루엣 분석 실습

130. 군집별 평균 실루엣 계수의 시각화를 통한 군집 개수 최적화 방법

131. MeanShift 군집화의 이해

132. KDE(Kernel Density Estimation)의 이해와 사이킷런을 이용한 MeanShift 군집화 실습

133. GMM(Gaussian Mixture Model) 군집화의 이해

134. 사이킷런을 이용한 GMM 군집화 실습

135. DBSCAN 군집화의 이해

136. 사이킷런을 이용한 DBSCAN 군집화 실습

137. 군집화 실습 1: 고객 세그먼테이션 구현 실습

섹션 9. 텍스트 분석

138. 텍스트 분석의 개요

139. 텍스트 데이터의 다양한 전처리(Preprocessing) 실습

140. 텍스트의 피처 벡터화 이해 – BOW(Bag of words)모델의 단순 Count 및 TF-IDF 피처 벡터화

141. 사이킷런의 주요 피처 벡터화(Feature Vectorization) 클래스 소개

142. 희소행렬의 이해

143. 텍스트 분류 – 20 Newsgroup 분류 실습 – 01

144. 텍스트 분류 – 20 Newsgroup 분류 실습 – 02

145. 텍스트 분류 – 20 Newsgroup 분류 실습 – 03

146. 감성 분석의 이해와 지도학습기반의 IMDB영화리뷰 감성분석 실습

147. 감성어휘 사전 기반의 감성 분석 이해와 이를 이용한 IMDB 영화리뷰 감성분석 실습

148. 토픽 모델링과 LDA의 이해

149. 사이킷런 LDA를 이용한 20 Newsgroup 토픽 모델링 실습 – 01

150. 사이킷런 LDA를 이용한 20 Newsgroup 토픽 모델링 실습 – 02

151. 문서 군집화의 이해와 Opinion Review 데이터 세트를 이용한 문서 군집화 실습 – 01

152. Opinion Review 데이터 세트를 이용한 문서 군집화 실습 – 02

153. 문서 유사도 개요와 코사인 유사도 이해

154. 코사인 유사도를 이용한 문서 유사도 구현 실습

155. Opinion Review 데이터 세트를 이용한 문서 유사도 구현 실습

156. 한글 NLP 개요와 한글 형태소 엔진 KoNLPy 소개

157. 한글 형태소 엔진 KoNLPy 설치하기

158. 한글 NLP 실습 – 네이버 영화리뷰 감성 분석 – 01

159. 한글 NLP 실습 – 네이버 영화리뷰 감성 분석 – 02

160. 실전 텍스트 분석: 01 – 캐글 경연 Mercari Price Suggestion 실습 개요

161. 실전 텍스트 분석: 02 – Mercari Price Suggestion 데이터 세트 다운로드 및 Kaggle 커널 사용법

162. 실전 텍스트 분석: 03 – Mercari Price Suggestion 데이터 세트 분석 및 변환

163. 실전 텍스트 분석: 04 – Mercari Price Suggestion 피처 인코딩과 피처 벡터화 수행

164. 실전 텍스트 분석: 05 – Mercari Price Suggestion 모델 학습과 예측, 평가

165. 텍스트 분석 Summary

섹션 10. 추천(Recommendation)

166. 추천 시스템의 이해

167. 콘텐츠기반 필터링의 이해와 TMDB5000 데이터 세트를 이용한 콘텐츠기반 필터링 구현 실습 – 01

168. TMDB5000 데이터 세트를 이용한 콘텐츠기반 필터링 구현 실습 – 02

169. 협업 필터링의 개요와 최근접 이웃방식 협업 필터링의 이해

170. 아이템기반 최근접 이웃 협업필터링 영화 추천 구현 실습

171. 잠재요인 기반의 협업필터링 이해와 경사하강법을 이용한 행렬 분해

172. 파이썬 코드를 이용한 경사하강법 기반의 행렬 분해 구현과 잠재요인 협업 필터링 기반 영화 추천 구현 실습

173. 파이썬의 추천 시스템 패키지인 Surprise 개요 – 주요 모듈 소개

174. Surprise를 이용한 추천 시스템 기본 구현

175. Surprise의 추천 알고리즘 소개 및 교차 검증과 하이퍼 파라미터 튜닝 개요

176. Surprise를 이용하여 개인화 영화 추천 시스템 구축

177. 추천 Summary

섹션 11. 시각화

178. 시각화를 시작하며

179. Matplotlib과 Seaborn 개요 및 비교

180. Matplotlib의 이해 – Figure와 Axes

181. Matplotlib Figure와 Axes 실습

182. Matplotlib의 여러 구성 요소를 이용한 시각화 실습 – 01

183. Matplotlib의 여러 구성 요소를 이용한 시각화 실습 – 02

184. 정보의 종류에 따른 시각화 유형

185. Seaborn의 Axis 레벨 함수와 Figure 레벨 함수의 이해

186. Seaborn 히스토그램 시각화 실습

187. Seaborn Bar 플롯 시각화 실습 – 01

188. Seaborn Bar 플롯 시각화 실습 – 02

189. Seaborn Violin 플롯 실습

190. Seaborn에서 subplots을 활용한 시각화 기법 익히기

191. Seaborn Box 플롯과 Scatter 플롯 실습

192. Seaborn 상관 Heatmap 실습