-
[Day15] 캐글이 뭔지 알아봅시다.AIFFEL Life 2020. 9. 29. 15:46
캐글이 무엇인지 아시나요? 저도 잘 모르지만, 캐글은 데이터를 제공하고, 다른 사람들에게 자 여기에 데이터와 답이 있으니 인공지능 학습을 통해 정확도가 높은 인공지능을 구현해 보세요라고 문제를 내는 것입니다.
근데 캐글 문제에 포켓몬에 대한 데이터도 있네요. 캐글 문제와 그것을 풀어가면서 알아두면 좋을 만한 내용들입니다.
1. Pokemon with stats www.kaggle.com/abcsds/pokemon
2. Python Set difference() Method www.w3schools.com/python/ref_set_difference.asp
Pandas 같은 프레임워크에 이제는 데이터 전처리같은 거지같은(?) 작업을 편하게 해주는 함수들이 많이 제공되고 있습니다. 널값이면 그 데이터를 버려라! 이런 함수도 있습니다.
3. pandas.DataFrame.isna pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.isna.html
4. pandas.DataFrame.sum pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sum.html
파이썬에는 C에서의 inline함수 같은 것을 lambda로 구현하는데 익숙하지 않은 초보자가 쓰기에는 참 어색한 것 같습니다.
5. 람다(lambda) wikidocs.net/64
6. pandas.Series.str.isalpha pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.isalpha.html
자바에서 Regex라는 것을 보신 분이라면 정규식이 무엇인지 아실 것입니다. (Regex를 모르더라도 다른 데서 보셨을 수도) 파이썬에도 있습니다.
7. 정규 표현식 시작하기 wikidocs.net/4308
8. Counter github.com/sinramyeon/ME-TIL/blob/master/Python/collections.md#counter
원-핫 인코딩이 뭔지 아시나요? 머신러닝에서 왜 이 용어가 자주 들리는지 알아보시죠.
9. Why One-Hot Encode Data in Machine Learning? machinelearningmastery.com/why-one-hot-encode-data-in-machine-learning/
10. Comparing if objects are equivalent pandas.pydata.org/docs/user_guide/basics.html#comparing-if-objects-are-equivalent
머신러닝에서 성능을 평가할 때 자주 쓰는 용어들이 있죠. 정확도, 민감도, 정밀도 등 각각의 의미와 언제 쓰는지 알아두시면 유용할 것입니다.
11. What is Confusion Matrix and Advanced Classification Metrics? manisha-sirsat.blogspot.com/2019/04/confusion-matrix.html
'AIFFEL Life' 카테고리의 다른 글
[Day16] 주가를 예측해서 부자가 되어보자 (0) 2020.09.29 [Day15] Python으로 GUI application을 만들어 보자. (0) 2020.09.29 [Day14] 회귀분석 (0) 2020.09.25 [Day13] 코딩으로 여는 월요일 (0) 2020.09.11 [Day12] 딥러닝과 신경망의 본질 (글로 배우는 딥러닝) (0) 2020.09.11