반응형

Program 135

[Open CV] 영상의 특징 추출 _ 캐니 엣지 검출

캐니 에지 검출 - 1986년 Jhon F. Canny 라는 사람이 개발한 Edge 검출 알고리즘이다. - OpenCV 에 구현되어있어 많은 사람들이 사용하고 있는 방식 중 하나이다. 지난 시간에 구현한 Sobel Filter는 Threshold를 어느 부분에 두는지에 따라 Edge가 두껍게 잡힐지 얇게 잡힐지가 결정되는 단점이 있었는데 CannyEdge는 기본적으로 Sobel Filter를 쓰지만 Edge를 좀 더 정확하게 검출한다. 그 방식으로는 정확한 검출 ( Good Detection ) : 에지가 아닌 점을 에지로 찾거나 또는 에지인데 에지로 찾지 못하는 확률을 최소화 정확한 위치 ( Good Localization ) : 실제 에지의 중심을 검출 Sobel Filter는 5개의 픽셀을 에지로 ..

Program/OPEN_CV 2022.05.31

머신러닝 이해하기 (1)

본 포스팅은 패스트캠퍼스 OpenCV를 활용한 컴퓨터비전과 딥러닝 올인원 패키지를 참고하여 작성하였습니다. 머신러닝 ( Machine Learning ) 이란? - 주어진 데이터를 분석하여 규칙성, 패턴 등을 찾고, 이를 이용하여 의미 있는 정보를 추출하는 과정 전통적인 프로그래밍과 Machine Learning 을 많이 비교하는데 전통적인 프로그래밍은 Data 에대한 Program을 입력하게되면 그것에 대한 결과로써 Output 을 내놓는것이고 Machine Learning은 Data 는 동일하게 들어가나 Outcome ( Data 에대한 정답 ) 을 같이 입력해주면 이에대한 근거 ( Program, Rules ) 를 내놓는다. 따라서 Machine Learning 은 Program 또는 Rule을 만..

[Open CV] 영상의 특징 추출 _ 그래디언트와 엣지 검출

영상의 그래디언트 ( Gradient ) - 함수 f ( x , y )를 x축과 y축으로 각각 편미분 ( partial derivative ) 하여 벡터 형태로 표현한 것 영상이라는 것은 2차원의 평면이기때문에 미분을 할 때 x방향과 y 방향을 각각 따로 미분을 해줘야하는데 그렇게 되면 수식이 지저분해질 수 있기 때문에 묶어서 하나로 표현한 것을 Gradient 라고 한다.즉, x 방향의 미분값과 y 방향의 미분값을 묶어서 하나의 수로 표현하는 방법이다. 그래디언트 크기 : ∣∇f∣=fx​²+fy​²​ 그래디언트 방향 : θ=tan−¹(fy/fx​​) 그럼 이 크기와 방향이 의미하는 것은 무엇인가? 실제 영상에서 구한 그래디언트 크기와 방향 - 그래디언트 크기 : 픽셀 값의 차이에 비례 , 픽셀값이 얼만..

Program/OPEN_CV 2022.05.30

[Open CV] 영상의 특징 추출 _ 영상의 미분과 소벨 필터

영상에서 미분을 구하는 이뉴는 에지를 검출하기 위함이다. 에지 ( Edge ) - 영상에서 픽셀의 밝기 값이 급격하게 변하는 부분 - 일반적으로 배경과 객체, 또는 객체와 객체의 경계 좌측 상단의 수직형태로 바뀌는 부분을 Step Function 이라고 말하는데 이러한 형태는 실제로는 보기 드문 형태이다. 그렇기 때문에 우측 상단에 있는 형태처럼 Smoody한 형태로 바뀌는 형태가 보통이다. 또는 좌측 하단에 있는 형태처럼 노이즈가 들어가있는 경우도 볼 수 있는데 이러한 형태에 Gaussian Blur 필터를 적용시켜주면 우측 하단에 있는 형태처럼 바꿀 수 있다. ( 픽셀값 증가의 엣지 ) 그렇기에 값이 급격하게 바뀌는 부분을 찾기 위해서 미분값을 사용하게 되는데 미분이라는 것은 간단히 말하면 변화율이라..

Program/OPEN_CV 2022.05.29

[Open CV] 기하학적 변환 _ 실전코딩 ( 문서 스캐너 )

문서 스캐너 구현 - 카메라로 촬영한 문서 영상을 똑바로 펴서 저장해주는 프로그램 구현 위와같이 바닥에 깔려있는 문서들을 affine 또는 perspective 변환을 통해 알아보기 쉽게 펴주는 변환을 구현한다. 구현 할 기능 - 마우스로 문서 모서리 선택 & 이동하기 - 키보드 ENTER 키 인식 - 왜곡된 문서 영상을 직사각형 형태로 똑바로 펴기 ( 투시변환 ( Perspective ) ) 일단 위와같은 기능을 구현하기 전 Open cv C++ 기반으로 만들어 본 투시변환 예제를 사용하여 나름대로의 기능을 만들어보고 강의에 나오는 코드와 얼마나 다른지 비교해볼 예정이다. 내 코딩 내 코딩은 4개의 라인들로 이루어져 변환시키는게 아닌 마우스 이벤트로 발생한 4개의 좌표값을 받아와 해당 좌표값을 Pers..

Program/OPEN_CV 2022.05.28

[Open CV] 기하학적 변환 _ 리매핑

- 리매핑이란 ( remapping ) ? 영상의 특정 위치 픽셀을 다른 위치에 재배치 하는 일반적인 프로세스 출력 영상에서 x , y 좌표의 픽셀 값을 입력영상에서 참조를 하는데 어느 위치에서 참조할것인지를 나타내는 map x 와 map y 라고 하는 함수를 정의를 해서 , 출력 영상의 픽셀값을 입력 영상 어느 좌표에서 참조해서 갖고올것인지를 지정하게끔해서 출력 영상의 픽셀값을 셋팅하는 것. 앞에서 들었던 강의 중 어파인변환, 투시변환같은 것들을 리매핑 기능으로 만들 수 있고, 기존에 만들었었던 사각형, 평행사변형 등의 모양이 아닌 영상 자체가 출렁이도록 만들수도 있다. 위 이미지를 보게되면 x 방향으로 -200 y 방향으로 -100 만큼 이동한 것을 볼 수 있다. 보통 위같은 이동변환을 보고 좌측방향..

Program/OPEN_CV 2022.05.27

[Open CV] 기하학적 변환 _ 어파인 변환과 투시변환

어파인 변환 vs 투시 변환 어파인 변환 직사각형 오리지널 영상에 대한 이동변환, 전단변환, 크기변환, 회전변환 등등이 적용되어 직사각형이 평행사변형 형태로 변환되는 경우를 통틀어 어파인 변환이라고 한다. 어파인 행렬은 2 X 3 형태의 실수형 행렬로 표현할 수 있는데 이 2 X 3 짜리의 행렬안에 회전정보도 들어갈 수있고 이동, 크기 변환정보도 한꺼번에 들어갈 수 있다. 어파인 행렬은 실제 6개의 파라메타가 필요하기 때문에 6 Degree Of Freedom 개의 미지수를 필요로 한다.이는 실제로 왼쪽의 빨간점 , 보라점, 초록점이 오른쪽의 빨간점, 보라점, 초록점 ( 3개의 점 )으로 이동했을때의 이동관계를 알면 남은 모서리의 점은 자연스럽게 유추될 수 있고affine transform 의 행렬 ( ..

Program/OPEN_CV 2022.05.26

[Open CV] 기하학적 변환 _ 영상의 회전

- 회전변환 ( rotation transformation ) 이란? 영상을 특정 각도만큼 회전시키는 변환 ( 반시계 방향 ) 영상을 회전해야할 경우는 자주 발생하는데 어떤 문서 이미지를 OCR 인식할 경우 문서들이 똑바로 스캔이 되어있어야지만 OCR 성능이 좋아지기때문에 영상이 회전되어있을 경우 바른 각도로 기울일때 자주 필요하다. 영상을 회전하기 위한 수식으로는 위 처럼 cos 함수와 sin 함수로 이루어져 있는데 x,y 좌표를 반시계 방향으로 세타만큼 회전시킬때 위 수식을 대입시키면 x ' , y ' 의 결과값을 만들 수 있다. 위 함수를 보게되면 rad은 20도에 해당하는 값을 radian 으로 변환한 변수이고아까 공식에서 나온대로 cos 과 sin 함수를 행렬로 만들어준다. ( aff )그리고 ..

Program/OPEN_CV 2022.05.25

[Open CV] 기하학적 변환 _ 이미지 피라미드

이미지 피라미드 ( Image pyramid ) 란? - 하나의 영상에 대해 다양한 해상도의 영상 세트를 구성한 것 - 보통 가우시안 블러링 & 다운 샘플링 현태로 축소하여 구성 왼쪽 아래의 입력영상을 기준으로 가로 , 세로를 반으로 줄이면서 다양한 크기의 영상을 만들어 놓는 것을 이미지 피라미드라고 한다. 이렇게 다양한 크기의 영상을 만드는 이유는 입력영상에서 어떤 객체를 찾고 싶을 때 ( ex_고양이 얼굴 ) 영상에서 객체크기가 다양하게 나타날 수 있기 때문에 위와 같이 이미지 피라미드를 만들거나 resize를 해줌으로써 다양한 객체를 찾을 수 있도록 하기 위함이다. 예를들어 고양이 얼굴이 100x100 사이즈를 가지고 있다면 원본 영상 640 * 480에서 고양이 얼굴이 100 x 100 사이즈가 ..

Program/OPEN_CV 2022.05.24

[Open CV] 기하학적 변환 _ 영상의 확대와 축소

크기 변환 ( Scale transformation ) 이란? - 영상의 크기를 원본 영상보다 크게 또는 작게 만드는 변환 - x축과 y축 방향으로의 스케일 비율(scale factor)를 지정 크기변환은 영상처리과정에서 빈번하게 일어나기 때문에 OpenCV에서 함수를 제공하고있다.우리가 많이 보던 cv2.resize 함수이다. cv2.resize( src, dsize, dst, fx, fy, interpolation ) src : 입력영상 dsize : 결과 영상 크기 ( w , h ) 튜플. ( 0,0 )이면 fx와 fy 값을 이용하여 결정 dst : 출력영상 fx, fy : x와 y 방향 스케일 비율 ( scale factor ). ( dsize 값이 0일 때 유효 ) ( 영상의 크기를 2배로 키우..

Program/OPEN_CV 2022.05.23
반응형