1. Neural Network 이전


Convolution - 시그널 분해

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/7a0e36c2-ee55-4c12-a7ce-0af7763e14ed/37284582-9462-4E19-BEF4-D2BB68BDF451.jpeg

과거에는 일일이 필터를 만들어서 피쳐를 뽑았다 (엣지, 코너 등등) - 좋은 예시로는 얼굴을 검출하는Adaboost.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/2947fd20-fbe0-4d56-b625-05242032cb6b/69F7434D-B09F-4C68-84AD-3CF2EAC5E757.jpeg

피쳐를 뽑는것을 좀 더 조직화 할 수 있을까? - HoG Detector + SVM 등으로 분류.

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/39632ad9-f033-4c2e-8c08-885798a909cd/CA7EA064-2088-4777-9CE0-F272742FD602.jpeg

근데 이렇게 해도 성능이 부족함. 성능을 높히려면 더 많은 필터를 써보면 되지않을까? - Gaussian derivative filters, Bag of Words

https://s3-us-west-2.amazonaws.com/secure.notion-static.com/30a451f0-c519-4e58-ac13-58e24be323b9/75604390-658C-49C5-98AA-534414795F4F.jpeg

CNN을 통해서 피쳐를 추출할 경우, 사람이 직접 만든 (Hand-made features)보다 더 많은 필터 (피쳐)를 뽑아내게 됨으로써, 엄청난 성능을 내게 되었다.

뉴럴넷의 출현으로 인해 이미지 프로세싱 계는 뒤집어졌다고 ㅋㅋ

2. CNN의 출현


https://s3-us-west-2.amazonaws.com/secure.notion-static.com/d5a6af14-f8e3-4dd4-bad4-f67f2d63ef92/FF1912AC-99DA-4EEE-85BE-FFAEE2BB207C.jpeg