본문 바로가기

공부/컴퓨터비젼13

[컴퓨터비전 과제] 7. CNN(Convolution Neural Network) CNN이란? CNN은 이미지의 전체가 아닌 부분을 보는 것이 핵심 아이디어인데요. 이 부분에 해당하는 것을 filter라고 합니다. 쉽게 말하면 뉴럴네트워크에 Convolution과정을 하는 건데요. Convolution은 어떠한 filter를 통해서 하나의 새로 값을 얻어내는 것이라고 말할 수 있습니다. (사실 복잡하게 설명할 수 있지만 여기서는 간단하게 언급하겠습니다.) image 의 사이즈가 7x7 이고 filter가 3x3 이라고 가정을 했을 때 image의 부분마다 새로운 값을 뽑아내야합니다. filter의 size가 3x3 이니 9개의 parameter 가 있고 이 값이 가중치 W에 대해서 ReLu나 Sigmoid 같은 activation function을 거쳐서 새로운 값을 출력합니다. 이때.. 2021. 6. 10.
[컴퓨터비젼 과제] 6. SVM(Support Vector Machine) 서포트 벡터 머신이란(이하 SVM) 서포트 벡터 머신은 결정 경계(Decision Boundary), 즉 분류를 위한 일종의 기준선을 정의하는 모델. 새로운 점이 주어졌을 때 경계에 의해 분류됨 핵심은 이 결정 경계를 어떻게 정의하고 계산하는 것. 아래는 데이터의 속성(feature) 이 두개일 경우 생각해보면 결정경계는 아래 예시와 같이 일차함수로 간단히 정의됨 속성이 3개가 될 경우에는 다음과 같이 3차원 공간에서 면으로 정의됨 최적의 결정 경계는? 그럼 해결해야하는 문제는 최적의 결정 경계를 정하는 것 아래의 그래프들 중에서 무엇이 나을까 생각해보면 E랑 F랑 좀 아리송하긴 하지만 F라는 걸 알 수 있는데 이는 결정 경계가 두 클래스와 가장 멀리 떨어져 있기 때문이다. 정리를 해보자면 결정경계는 데.. 2021. 5. 27.
[컴퓨터비젼 과제] Epipolar Geometry 과제 목표 두 개의 rectified image를 통해서 epipolar line 얻기 1) Fundamental Matrix Estimation 2) Compute epipoles 3) Epipolar lines 간단 용어 설명 동차좌표(Homogeneous coordinates) n차원 공간을 n+1차원의 좌표로 나타내는 좌표계 스테레오(Streo) : 같은 물체에 대해 서로 다른 장소에서 촬영한 여러 이미지에서 물체의 3차원 정보를 계산하는 학문 간단히 말해서 서로 다른 장소에서 촬영한 두 장의 이미지에서 거리 정보를 추출해 내는 분야 예를 들어 캐치볼을 할 때 한 쪽 눈을 감고 하면 거리계산이 어려운 것과 마찬가지로 이미지를 보고 거리 계산을 하기 위해서는 두 개의 이미지가 필요 디스패리티(dis.. 2021. 5. 14.
[컴퓨터비젼] 13. Stereo Stereo 두개 이상의 뷰가 주어졌을 때 잃어버린 정보를 복원할 수 있는 방법 외눈박이일 경우 공간적으로 인식을 하는 건 불가능 두 개의 뷰가 있을 때 어떻게 3차원 정보를 복원하는지 알아보기 Epipolar geometry 카메라 간의 translating 을 통해서 연결되는 두 이미지를 찍을 수 있음 이는 epipolar lines 을 통해 찾을 수 있음 basci stereo matching algorithm 생각보다 어려움 보통 카메라는 임의의 위치와 구성으로 촬영이 되는데 일정한 기준이 필요하다. 이렇게 추가적인 카메라를 rectified cameras라고 한다. 이 카메라의 위치를 계산하는 방법 첫번째 카메라는 원점에 있다고 가정 X축에서의 차이를 disparity 라고 한다. dispari.. 2021. 4. 18.