-
[Day13] 코딩으로 여는 월요일AIFFEL Life 2020. 9. 11. 18:31
AIFFEL에서는 한주의 시작을 코딩 마스터라는 수업으로 시작합니다. 코딩 문제를 내주고 미리 풀어오라고 하고, 3시간 동안 같이 리뷰하는 시간입니다. 그 시간이 끝나면 온라인 교재로 학습하는 시간이 이어집니다.
오늘은 python의 문자열, 파일 다루기에 대해서 배워 보는 날이네요.
혹시 유니코드라는게 뭔지 아시나요? 1byte로는 (1byte = 8bit) 1bit는 0, 혹은 1입니다. 즉, 1bit는 2개의 무엇인가를 나타낼 수 있고, 8bit는 2의 8제곱, 즉 256개의 무엇인가만 나타낼 수 있습니다. 영어야 26문자밖에 없으니 256으로 대,소문자 다 표현하고도 남지만, 다른 나라 모든 문자를 256개 안에 넣을 수 있을까요? 그래서 등장한 것이 유니코드입니다. 유니코드가 등장하기 전에 한글을 표현하기 위해서 KSC니 뭐 이런 표준들이 있었던 것으로 알고 있습니다.
유니코드에 대해 기억나는 것을 좀 더 적어보면 지금 한글이라는 워드 프로세서나 도깨비 한글 같은 프로그램들이 MS-DOS에서 구동되던 시절에는 조합형 한글이라는 것이 대세(?)인 듯 했습니다. 즉, ㄱ, ㅏ, ㅇ 등 한글 자모를 조합해서 글자를 만드는 거죠. 그러던 것이 마이크로소프트가 완성형으로 한글을 표현 한다고 했을 때, 한창 시끄러웠던 일이 아직도 기억납니다. 완성형으로 표현하면 우리가 흔하게 쓰지 않는 한글 조합은 표현할 수 없다는 거죠. '꺍' 같은 단어는 표현이 안된다고 난리였습니다. 그러다, 마이크로소프트에서 완성형 한글의 범위를 넓혀 안써진다는 한글도 다 써진다며 지하철 광고를 했던 기억이 나네요... 나중에 들었는데, 그때 유니코드에서 한글에 할당된 범위를 넓히기 위해서 한국에서 근무하는 마이크로소프트 분들의 역할이 컸다는 얘기가 있었습니다.
1. 유니코드 https://ko.wikipedia.org/wiki/%EC%9C%A0%EB%8B%88%EC%BD%94%EB%93%9C_%EC%98%81%EC%97%AD
2. Unicode와 UTF-8 간단히 이해하기 https://medium.com/@jeongdowon/unicode%EC%99%80-utf-8-%EA%B0%84%EB%8B%A8%ED%9E%88-%EC%9D%B4%ED%95%B4%ED%95%98%EA%B8%B0-b6aa3f7edf96
3. UTF-8, UTF-16 차이 https://pickykang.tistory.com/13
4. mutable vs immutable (참고로 모회사 전화 스크리닝에서 Immutable에 대해서 물어봤던 기억이 있습니다.)
https://webnautes.tistory.com/1181
5. 리눅스 파일 시스템 구조
6. 리눅스 자주 쓰는 명령어
https://itholic.github.io/linux-basic-command/
7. beautifulsoup4 4.9.1 (웹 크롤링의 더러운 작업을 깔끔하게 할 수 있게 도와주는 프레임워크~)
https://pypi.org/project/beautifulsoup4/
8. lxml 4.5.2
https://pypi.org/project/lxml/
9. Twitter Developer page https://developer.twitter.com/en
10. ipython 의 매직명령어들 https://studymake.tistory.com/601
'AIFFEL Life' 카테고리의 다른 글
[Day15] 캐글이 뭔지 알아봅시다. (0) 2020.09.29 [Day14] 회귀분석 (0) 2020.09.25 [Day12] 딥러닝과 신경망의 본질 (글로 배우는 딥러닝) (0) 2020.09.11 [Day11] 멍멍이 상인지 고양이 상인지 알아보기 (0) 2020.09.11 [Day10] 파이썬 더 알아보기 (0) 2020.08.26