-
[Day52] 문서의 유사도를 구하는 방법AIFFEL Life 2020. 12. 21. 13:15
오늘은 문서가 서로 얼마나 유사한지 알아보는 방법에 대해 배워봤습니다. 코사인 유사도, TF-IDF에서부터 LDA까지... 이해하기 좀 어렵지만 알아두면 유용할 것 같습니다.
1. Cosine Similarity – 코사인 유사도
2. TF-IDF 문서 유사도 측정
3. 머신러닝 - 19. 고유값(eigenvalue), 고유벡터(eigenvector), 고유값 분해(eigen decomposition)
bkshin.tistory.com/entry/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-19-%ED%96%89%EB%A0%AC?category=1057680
4. 특잇값 분해
datascienceschool.net/02%20mathematics/03.04%20%ED%8A%B9%EC%9E%87%EA%B0%92%20%EB%B6%84%ED%95%B4.html
5. fit_transform(X, y=None)
6. LDA Topic Modeling
lettier.com/projects/lda-topic-modeling/
7. 잠재 디리클레 할당(Latent Dirichlet Allocation, LDA)
8. LDA 모형
9. Konlpy install
'AIFFEL Life' 카테고리의 다른 글
[Day54] 뉴스 카테고리 다중 분류 (0) 2020.12.22 [Day53] 애자일 소다와 흐린 사진을 선명하게 (0) 2020.12.21 [Day51] 뉴스 요약봇 만들기 (0) 2020.12.21 [Day51] 슬로우 페이퍼 (Slow Paper) (0) 2020.12.21 [Day50] 단어 사전 만들기 (0) 2020.12.16