시작하기 앞서#

컴퓨터 비전과 영상 처리#

영상 처리(image processing)은 영상을 처리하는 연산을 뜻한다. 예를 들어 카메라로 찍은 사진 또는 동영상에 필터, 회전, 색감 조정 등과 같은 연산을 가해서 원하는 결과물을 얻어내는 과정이다. 영상 처리의 주목적은 고품질의 이미지를 얻기위함이다. 사진이나 동영상의 밝기를 조절해 화질을 개선하거나 오래된 영상에서 현대적인 품질로 복원하는 영상 복원, 사진이나 영상에서 원하는 부분만 오려내는 영상 분할과 같은 것들이 있다. 이런 것들은 어도비의 포토샵, 애플의 파이널 컷 등이 있을 것이다.

컴퓨터 비전(computer vision)은 영상 처리 개념을 포함하는 좀 더 큰 포괄적인 의미이다. 영상 처리가 원본 영상을 사용자가 원하는 영상으로 바꿔 주는 기술이라면 컴퓨터 비전은 영상에서 의미 있는 정보를 추출하는 것이다. 이는 영상 속에서 관심있는 대상이 어디있는지 위치를 추출하는 객체 탐지(object detection), 객체가 어디로 움직이는지 추척하는 객체 추적(object tracking), 이미지 속에 피사체가 무엇인지 인식하는 객체(object recognition) 등이 있다. 컴퓨터 비전 작업을 하기 전 영상 처리 작업을 하는 경우가 많다. 특히, 딥러닝 시대로 들어오면서 컴퓨터 비전의 획기적인 발전으로 인해 영상 처리가 더욱 중요해졌다. 20세기의 석유인 데이터를 잘 정제해 고품질의 훈련셋으로 딥러닝 모형을 학습해 좋은 성능을 이끌어내기 위해서다.

[He et al., 2016]

시각 기관#

시각적 지각에 관한 인간의 시야#

필름 카메라와 디지털 카메라의 원리#

객체 탐지#

시맨틱 세그먼테이션#

인스턴스 세그먼테이션#

휴먼 포즈 추정#

깊이 추정#

깊이 추정(depth estimation)

초해상화#

초해상화(super resolution)

GAN#

얼굴 탐지 및 확인#

참고도서#

파이토치#

파이토치는 파이썬 기반의 오픈 소스 머신러닝 라이브러리로, 페이스북 인공지능 연구집단에 의해 개발되었다. 간결하고 구현이 빨리되며, 텐서플로우보다 사용자가 익히기 훨씬 쉽다는 특징이 있다. 또한 코드를 직접 다루거나 사람들에게 설명해 주기에도 효과적이다.