반응형

숫자인식 2

[Open CV] 머신러닝 _ 숫자 영상 정규화

이번시간에는 HOG과 SVM 알고리즘을 사용하여 숫자 인식을 하는 프로그램에서 숫자 영상을 정규화 하는 과정을 추가하여 성능을 향상시키는 방법에 관해 알아본다. HOG & SVM 필기체 숫자 인식 정중앙에 숫자를 쓰지 않을 경우? - digits.png 데이터를 80:20으로 나눠서 검증할 경우 정확도가 98.7% 이지만, 체감 성능은 훨씬 낮게 나타남 학습 데이터 영상 정규화 ( Normalization ) - 학습 데이터 영상과 테스트 데이터 영상의 위치, 크기, 회전 등의 요소를 정규화 ▶ 인식 성능 향상 * 여러개의 데이터를 분석할 일이 있을때 어떤 식으로 이 데이터들을 정규화 할지 고민해야한다. 숫자 영상의 무게 중심이 전체 영상 중앙이 되도록 위치 정규화 위 이미지를 보게되면 바운딩박스의 중심..

[Open CV] 머신러닝 _ HOG+SVM 필기체 숫자 인식

이번 시간에는 HOG알고리즘과 SVM 알고리즘을 조합해서 필기체 숫자를 인식하는 프로그램을 만들어본다. HOG알고리즘을 이용해서 필기체 숫자의 방향성정보를 추출하고 그 방향성 정보를 SVM 알고리즘을 이용해서 10개의 클래스로 나눠준다. 그리고 사용자가 숫자를 입력하면 해당 클래스를 비교하여 숫자를 인식하는 방법이다. 그럼 저번강의에서도 봤었던 digit 이미지 내부에있는 숫자를 분리해야하는데 해당 숫자들을 HOG알고리즘 사용을 위해 나눠주고 주황색 박스처럼 4개의 셀을 하나로 묶어주어 사용하면 셀 하나가 9개의 히스토그램 그래디언트 방향성 정보를 갖게된다. 그러면 나오게되는 500X324 크기의 행렬에서 SVM 알고리즘의 초평면에 의해서 클래스가 나뉘게 된다. SVM알고리즘은 기본적으로 2개의 클래스로..

반응형