-
[Day15] 캐글이 뭔지 알아봅시다.AIFFEL Life 2020. 9. 29. 15:46
캐글이 무엇인지 아시나요? 저도 잘 모르지만, 캐글은 데이터를 제공하고, 다른 사람들에게 자 여기에 데이터와 답이 있으니 인공지능 학습을 통해 정확도가 높은 인공지능을 구현해 보세요라고 문제를 내는 것입니다.
근데 캐글 문제에 포켓몬에 대한 데이터도 있네요. 캐글 문제와 그것을 풀어가면서 알아두면 좋을 만한 내용들입니다.
1. Pokemon with stats www.kaggle.com/abcsds/pokemon
Pokemon with stats
721 Pokemon with stats and types
www.kaggle.com
2. Python Set difference() Method www.w3schools.com/python/ref_set_difference.asp
Python Set difference() Method
Python Set difference() Method ❮ Set Methods Example Return a set that contains the items that only exist in set x, and not in set y: x = {"apple", "banana", "cherry"} y = {"google", "microsoft", "apple"} z = x.difference(y) print(z) Try it Yourself » D
www.w3schools.com
Pandas 같은 프레임워크에 이제는 데이터 전처리같은 거지같은(?) 작업을 편하게 해주는 함수들이 많이 제공되고 있습니다. 널값이면 그 데이터를 버려라! 이런 함수도 있습니다.
3. pandas.DataFrame.isna pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.isna.html
pandas.DataFrame.isna — pandas 1.1.2 documentation
Detect missing values. Return a boolean same-sized object indicating if the values are NA. NA values, such as None or numpy.NaN, gets mapped to True values. Everything else gets mapped to False values. Characters such as empty strings '' or numpy.inf are n
pandas.pydata.org
4. pandas.DataFrame.sum pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.sum.html
pandas.DataFrame.sum — pandas 1.1.2 documentation
The required number of valid values to perform the operation. If fewer than min_count non-NA values are present the result will be NA. New in version 0.22.0: Added with the default being 0. This means the sum of an all-NA or empty Series is 0, and the prod
pandas.pydata.org
파이썬에는 C에서의 inline함수 같은 것을 lambda로 구현하는데 익숙하지 않은 초보자가 쓰기에는 참 어색한 것 같습니다.
5. 람다(lambda) wikidocs.net/64
위키독스
온라인 책을 제작 공유하는 플랫폼 서비스
wikidocs.net
6. pandas.Series.str.isalpha pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.str.isalpha.html
pandas.Series.str.isalpha — pandas 1.1.2 documentation
Series or Index of boolean values with the same length as the original Series/Index.
pandas.pydata.org
자바에서 Regex라는 것을 보신 분이라면 정규식이 무엇인지 아실 것입니다. (Regex를 모르더라도 다른 데서 보셨을 수도) 파이썬에도 있습니다.
7. 정규 표현식 시작하기 wikidocs.net/4308
위키독스
온라인 책을 제작 공유하는 플랫폼 서비스
wikidocs.net
8. Counter github.com/sinramyeon/ME-TIL/blob/master/Python/collections.md#counter
sinramyeon/ME-TIL
Today I Learned! Contribute to sinramyeon/ME-TIL development by creating an account on GitHub.
github.com
원-핫 인코딩이 뭔지 아시나요? 머신러닝에서 왜 이 용어가 자주 들리는지 알아보시죠.
9. Why One-Hot Encode Data in Machine Learning? machinelearningmastery.com/why-one-hot-encode-data-in-machine-learning/
Why One-Hot Encode Data in Machine Learning?
Getting started in applied machine learning can be difficult, especially when working with real-world data. Often, machine learning tutorials will recommend or require that you prepare your data in specific ways before fitting a machine learning model. One
machinelearningmastery.com
10. Comparing if objects are equivalent pandas.pydata.org/docs/user_guide/basics.html#comparing-if-objects-are-equivalent
Essential basic functionality — pandas 1.1.2 documentation
Here we discuss a lot of the essential functionality common to the pandas data structures. To begin, let’s create some example objects like we did in the 10 minutes to pandas section: Head and tail To view a small sample of a Series or DataFrame object,
pandas.pydata.org
머신러닝에서 성능을 평가할 때 자주 쓰는 용어들이 있죠. 정확도, 민감도, 정밀도 등 각각의 의미와 언제 쓰는지 알아두시면 유용할 것입니다.
11. What is Confusion Matrix and Advanced Classification Metrics? manisha-sirsat.blogspot.com/2019/04/confusion-matrix.html
Confusion Matrix
What is Confusion Matrix and Advanced Classification Metrics? After data preparation and model training, there is model evaluat...
manisha-sirsat.blogspot.com
'AIFFEL Life' 카테고리의 다른 글
[Day16] 주가를 예측해서 부자가 되어보자 (0) 2020.09.29 [Day15] Python으로 GUI application을 만들어 보자. (0) 2020.09.29 [Day14] 회귀분석 (0) 2020.09.25 [Day13] 코딩으로 여는 월요일 (0) 2020.09.11 [Day12] 딥러닝과 신경망의 본질 (글로 배우는 딥러닝) (0) 2020.09.11