-
[Day20] 캐글에 도전해 보기AIFFEL Life 2020. 12. 14. 14:47
오늘은 캐글에 대해 배워봅니다. 캐글을 이해하는데 도움이 되고, 실제로 캐글 문제를 푸는 데 알아두면 유용한 자료들을 아래에 공유합니다.
1. 캐글 코리아 페이스북
www.facebook.com/groups/KaggleKoreaOpenGroup/
2. 캐글 코리아와 함께하는 2nd ML 대회 - House Price Prediction
www.kaggle.com/c/2019-2nd-ml-month-with-kakr
캐글은 커널을 공개하도록 하여 상위권에 위치한 사람들이 어떻게 문제를 풀었는지 확인할 수 있습니다. 또한 아래처럼 베이스라인 커널이 주어지는 경우도 있네요.
3. 2019 ML month 2nd baseline 커널
www.kaggle.com/kcs93023/2019-ml-month-2nd-baseline
아이펠에서도 주피터 노트북으로 딥러닝 프로그래밍을 하고 노트북 형태로 그 결과를 공유하곤 하는데요. 혹시 주피터 노트북 사용에 익숙하지 않다면 볼 만한 비디오입니다.
4. 주피터 노트북 사용하기
dojang.io/mod/page/view.php?id=2457
5. Python del Keyword
www.w3schools.com/python/ref_keyword_del.asp
혹시 pandas를 사용하다가, 중복된 데이터 제거나 null값 등을 제거하고 싶을 때 다음 페이지를 참고해 보세요.
6. pandas.DataFrame.drop (pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.drop.html)
7. Pandas Lambda, apply를 활용하여 복잡한 로직 적용하기
8. seaborn.kdeplot
seaborn.pydata.org/generated/seaborn.kdeplot.html
9. What is Ensemble Learning? subinium.github.io/introduction-to-ensemble-1/#:~:text=%EC%95%99%EC%83%81%EB%B8%94(Ensemble)%20%ED%95%99%EC%8A%B5%EC%9D%80%20%EC%97%AC%EB%9F%AC,%EB%A5%BC%20%EA%B0%80%EC%A7%80%EA%B3%A0%20%EC%9D%B4%ED%95%B4%ED%95%98%EB%A9%B4%20%EC%A2%8B%EC%8A%B5%EB%8B%88%EB%8B%A4
10. 캐글 앙상블 가이드
11. Coefficient of Determination(결정계수), R^2(R square)
12. Random Search vs Grid Search
shwksl101.github.io/ml/dl/2019/01/30/Hyper_parameter_optimization.html
13. The scoring parameter: defining model evaluation rules
scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter
14. pandas.DataFrame.sort_values
pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sort_values.html
15. lightGBM / XGBoost 파라미터 설명
machinelearningkorea.com/2019/09/29/lightgbm-%ED%8C%8C%EB%9D%BC%EB%AF%B8%ED%84%B0/
16. LightGBM의 장단점
처음에 소개한 캐글 문제에 대해 아래처럼 공개된 노트북을 보면 배울 수 있습니다.
17. 2019 2nd ML month with KaKR
www.kaggle.com/c/2019-2nd-ml-month-with-kakr/notebooks
'AIFFEL Life' 카테고리의 다른 글
[Day22] 매핑과 데이타베이스 (0) 2020.12.14 [Day21] 색과 이미지 파일 (0) 2020.12.14 [Day19] HTTP 이해하기 (0) 2020.09.29 [Day19] 데이타를 준비하기 (0) 2020.09.29 [Day18] 넷플릭스 추천 알고리즘을 만들어 볼까? (0) 2020.09.29