비주얼질의응답
-
[Day91] Multimodal NLPAIFFEL Life 2020. 12. 27. 13:07
오늘은 Visual QA에 대한 내용을 배웠습니다. 어떻게 보면 궁극의 AI가 지향하는 모습이 아닐까 싶고, 이런 AI가 적용된 어플리케이션이야 말로 최첨단 기술의 집약체가 될 수 있다고 생각이 드는 주제였습니다. 영화 A.I.에 보면 돈을 내고 질문을 하면 답을 해주는 AI가 등장하죠? 마치 그런 A.I.를 만들어 내는 듯한... (영화에서는 A.I.가 좀 인간적인 모습으로 나와서 그렇지만 그렇게 자율주행과 직립보행이 가능한 로봇이 검색 시스템과 네트워크만 연결되어 있다면 그렇게 돈내고 질문할 필요가...) QA가 텍스트로 질문하면 답하는 것이라면 Visual QA는 사진을 보여주고 그 사진에 대해 물어보는 것입니다. 몇 년전에 마이크로소프트에서 사진을 보여주면 사람이 몇명이고 뭘하고 있고 등등을 텍스..