ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • [cs231n] 1강 시각 인식을 위한 합성곱 소개 (1/3, 소개하기)
    AI 2020. 12. 31. 22:15

    아이펠 과정을 들으면서, 개발자 경력을 가지고 있지만, 인공지능을 전혀 모르는 사람이 인공지능을 배우려고 할 때, 이 정도를 배우면 꽤 괜찮은 것 같다라는 생각이 든 것이 있었는데 바로 cs231n이었습니다. 아주 쉽지도 않고 꽤 챌린징하지만, 조금 노력하면 이해할 수 있을 것 같아 보였기 때문입니다. 그래서 나와 비슷한 상황에 있는 분들을 위해 정리해 보는 것이 어떨까하는 생각이 들었습니다.

    또한 아이펠 과정을 배우면서는 플립 스쿨로 진행했는데, 사실 인공지능에 대해서 아는 바가 전혀 없는 상태로 참여해서 도대체 이 지점에서 왜 이런 이야기가 나오는지 처음엔 이해가 안되는 부분이 많았습니다. 그래서, 아이펠 과정을 다 마치고 나면 다시 한번 이 강좌를 천천히 들여다 보면서 이해해야 겠다는 생각이 들었습니다.

    그리고, 공부를 하면서 이 강의를 한글로 정리한 자료들이 있기는 하지만 뭔가 처음 인공지능을 배우는 사람 입장에서 쓰여 있지 않다는 것을 발견하면서 제 나름대로 정리해 봐야 겠다는 생각이 들었습니다. 비디오 강의가 있는 2017년 슬라이드로 정리합니다.

    공부를 하면서 정리한 자료이니 혹시 부족한 점이 있더라고 양해해 주시고, 고쳐야 할 점을 알려주시면 반영하겠습니다.

    원문 제목: Lecture 1. Introduction to Convolutional Neural Networks for Visual Recognition

    오늘은 플립스쿨 때는 건너 뛴 1강을 정리해 보겠습니다. 컴퓨터 비전에 대한 역사와 강의소개인데 플립스쿨 때도 1강을 건너 뛰지 않았다면, 뭔가 이 강의가 어떤 강의인지 이해도 할 수 있고, 컴퓨터 비전에 대한 역사도 알 수 있는 기회가 되지 않았을까 하는 생각도 드네요.

    이 강의는 세번째 (2017 봄 기준)인데, 학생수가 150명에서 350명으로 늘더니 올해는730명이 수강중입니다. 이 강의는 컴퓨터 비전에 대한 수업입니다. 우리는 시각적 데이타의 양이 폭발적으로 증가하는 시대에 살고 있습니다. 우리 모두 스마트 폰을 가지고 있고, 카메라의 숫자가 사람 숫자 보다 많은 세상입니다. 2017년의 데이타 중 80%는 비디오라고 시스코가 2015년 예측한 바 있습니다. 이 비주얼 데이타를 이해하고 활용할 수 있는 것이 중요한 시대를 살고 있는데요. 문제는 비주얼 데이타를 이해하기가 참 어렵다는 것입니다. 

    유투브에는 1초에 5시간분량의 비디오가 업로드 된다고 합니다. 구글이 아무리 많은 직원이 있다해도 이걸 다 보고 주석을 다는 등을 일을 할 수 없죠. 비디오 데이타를 이해하고 추천해주고 광고를 다는 것은 구글에게도 매우 중요하죠. 자동으로 해야 하는 것입니다.

     

    컴퓨터 비전은 다른 학문과 연계된 분야입니다. 다른 학문을 많이 건드리죠. 예를 들면, 광학과 이미지 합성 등을 위해 물리를 알아야하고, 동물 뇌가 어떻게 보는지, 이미지를 어떻게 처리하는지 알기 위해 생물학도 알아야 합니다. 컴퓨터 사이언스와 수학 , 엔지니어링을 알아야 컴퓨터 비전 알고리즘을 구현하는 시스템을 만들수 있습니다.

    이 과정은 컴퓨터 비전에 대한 기초 지식을 알고 있다고 가정하고 진행합니다. 그래서 학부생이라거나 컴퓨터 비전을 전혀 모르는 사람은 cs131을 들었어야 합니다. 224는 자연어 처리에 관한 것으로 이 과정과 겹치는 부분이 있고, 231a은 컴퓨터 비전 전체를 아우르는 과정이라고 할 수 있습니다우리 과정은 특정 클래스 알고리즘에 집중합니다. 합성곱 신경망에 집중하고, 시각적인 인식 작업 응용프로그램에 집중합니다.

    댓글

Designed by Tistory.