-
[Day48] 보이저 엑스와 텍스트 데이터 다루기AIFFEL Life 2020. 12. 16. 16:57
오늘은 영배스 시간 (영배스를 모르신다면 이 포스트를 확인해 보세요)에 보이저엑스라는 회사에 대해 배웠습니다. 참고로 남세동 대표님과는 후에 화상으로 회사소개 시간도 있었습니다. 개인적으로 흥미로운 회사라고 생각하니, 관심있으신 분들은 아래 글도 참고해 보시기 바랍니다.
0. 보이저 엑스 채용
www.notion.so/Career-at-VoyagerX-833e2878660a4a7590b6946c0da8b151
오늘 배운 내용은 파이썬으로 텍스트 데이터를 다루는 방법에 관한 것이었습니다.
1. 자연 언어 와 프로그래밍 언어
www.aistudy.co.kr/linguistics/natural/language_kim.htm
2. Announcing SyntaxNet: The World’s Most Accurate Parser Goes Open Source
ai.googleblog.com/2016/05/announcing-syntaxnet-worlds-most.html
3. 카톡 데이터는 어떻게 정제할 수 있을까? - Dialog-BERT 만들기 1편
blog.pingpong.us/dialog-bert-normalizer/
4. 정규표현식 (Regex) 정리
5. 코사인 유사도(Cosine Similarity)
6. KoNLPy: 파이썬 한국어 NLP
konlpy-ko.readthedocs.io/ko/v0.4.3/
7. khaiii
8. 형태소 분석기 비교
9. Neural Machine Translation of Rare Words with Subword Units (paper)
10. Japanese and Korean Voice Search (paper)
static.googleusercontent.com/media/research.google.com/ko//pubs/archive/37842.pdf
11. SentencePiece
github.com/google/sentencepiece
12. 워드투벡터(Word2Vec)
13. 한국어를 위한 어휘 임베딩의 개발
brunch.co.kr/@learning/7#comment
'AIFFEL Life' 카테고리의 다른 글
[Day50] 단어 사전 만들기 (0) 2020.12.16 [Day49] 글자를 읽을 줄 아는 인공지능 (0) 2020.12.16 [Day47] 인공지능으로 패션 만들어 보기 (0) 2020.12.16 [Day45, 46] 해커톤 (연구계획서) (0) 2020.12.16 [Day44] 해커톤 (작사하는 인공지능) (0) 2020.12.16