VQA
-
[Day92] 마지막 실습 GQAAIFFEL Life 2020. 12. 27. 13:13
오늘이 아이펠의 자연어 심화학습 실습 마지막날이네요. (사실 일정상 이날에 실습 과정이 오픈되었어야 하는데, 1주일 넘게 늦게 오픈되었습니다. 아이펠의 학습 노드를 만드는 과정이 마치 드라마 대본 쫒기듯이 컨텐츠 크리에이터분들이 바쁜 와중에 만드시느라 고생하신다는 얘기를 들었습니다. 또, 최초 작성자분들이 주신 내용을 중간에서 시스템에 맞게 수정하는 작업도 많이 필요하다고 하더군요.) 오늘 실습 내용은 VQA (Visual Question Answering)를 만들어 보는 것이었는데, 생각보다 너무 잘 동작해서 놀라웠습니다. 노트북과 참고자료 공유합니다. 0. GQA 모델 활용하기 (notebook) github.com/nevermet/AIFFEL/blob/master/G20_GQA.ipynb never..
-
[Day91] Multimodal NLPAIFFEL Life 2020. 12. 27. 13:07
오늘은 Visual QA에 대한 내용을 배웠습니다. 어떻게 보면 궁극의 AI가 지향하는 모습이 아닐까 싶고, 이런 AI가 적용된 어플리케이션이야 말로 최첨단 기술의 집약체가 될 수 있다고 생각이 드는 주제였습니다. 영화 A.I.에 보면 돈을 내고 질문을 하면 답을 해주는 AI가 등장하죠? 마치 그런 A.I.를 만들어 내는 듯한... (영화에서는 A.I.가 좀 인간적인 모습으로 나와서 그렇지만 그렇게 자율주행과 직립보행이 가능한 로봇이 검색 시스템과 네트워크만 연결되어 있다면 그렇게 돈내고 질문할 필요가...) QA가 텍스트로 질문하면 답하는 것이라면 Visual QA는 사진을 보여주고 그 사진에 대해 물어보는 것입니다. 몇 년전에 마이크로소프트에서 사진을 보여주면 사람이 몇명이고 뭘하고 있고 등등을 텍스..