-
[Day8] 머신러닝을 이해하려면 통계를 알아야 한다.AIFFEL Life 2020. 8. 26. 17:33
오늘은 통계에 관한 내용들을 많이 배웠습니다. 고등학교때 대학교때 통계에 대해서 좀 배웠지만, 잊어버린지 오래...
그렇지만 하나하나씩 기억을 되살려 보고, 모르는 것은 다시 배운다면 머신러닝을 이해할 수 있게 되겠죠?
- 자유도와 불편 추정량: https://hsm-edu.tistory.com/13
그런데 이런 통계를 처리하는 데 파이썬이 무척이나 최적화 되어 있죠? 통계를 처리하는데 필요한 다양한 패키지들이 이미 준비되어 있기 때문에, 이런 내용을 잘 알고 있으면 편하게 사용할 수 있지요. 읽어보면 유익할 만한 포스팅들 공유해 드립니다.
- 자료구조, 리스트(List) 와 배열(Array): https://blog.martinwork.co.kr/theory/2018/09/22/what-is-difference-between-list-and-array.html
- 모듈, 패키지, pip: https://blog.naver.com/reisei11/221762330326
- NumPy: https://numpy.org/
- Array Broadcasting in Numpy: https://numpy.org/devdocs/user/theory.broadcasting.html
- A Visual Intro to NumPy and Data Representation: http://jalammar.github.io/visual-numpy/
- The Array Interface: https://numpy.org/doc/stable/reference/arrays.interface.html
- Modes: https://pillow.readthedocs.io/en/stable/handbook/concepts.html#concept-modes
머신러닝을 위해서는 많은 데이터를 확보하는 것이 중요하다. 그런데 충분한 데이터가 없다고 생각한다면, 가지고 있는 데이터를 조작?하여 데이터 양을 늘릴 수 있는데, 그것이 바로 Data Augmentation이다. TensorFlow를 통해 해 볼 수 있다.
- Data augmentation: https://www.tensorflow.org/tutorials/images/data_augmentation
- COVID-19 in Italy: https://www.kaggle.com/sudalairajkumar/covid19-in-italy
데이터를 엑셀시트나 데이타베이스에 넣고 이리저리 값을 조작하고 조회해 보고 싶을 때, 파이썬에서는 Pandas라는 것을 쓴다. 이 패키지를 통해 DataFrame라는 객체로 데이타를 로딩하여 이런저런 작업을 할 수 있는데... 그것을 쉽게 이해할 수 있게 해주는 페이지
- 10 minutes to pandas: https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html
'파이썬 (Python)에서 모든 것은 오브젝트 (Object)이다'라는 설명
Everything Is an Object: https://linux.die.net/diveintopython/html/getting_to_know_python/everything_is_an_object.html
'AIFFEL Life' 카테고리의 다른 글
[Day9] 웹을 긁어 자연어처리 해보자 (0) 2020.08.26 [Day8] 파이썬 프로그래밍 개념을 좀 더 이해하자. (0) 2020.08.26 [Day7] 글로 배우는 딥러닝... (0) 2020.08.14 [Day6] Scikit Learn으로 인공지능을 구현해 보자 (0) 2020.08.14 [Day5] 리눅스에 대해 더 알아보자 (0) 2020.08.14