Object Recognition

업데이트:

1. Object recognition(객체 인식)이란?

  • 이미지 또는 비디오 상의 객체를 식별하는 컴퓨터 비전(computer vision)기술

  • 기계가 인간처럼 이미지의 내용을 인식하도록 하는 것이 목표

  • 자율 주행, 바이오이미징, 로봇 비젼과 같은 다양한 분야에서 유용

2. Object recognition의 종류

01

  • Image Classification

    • 이미지를 입력으로 사용하고 해당 이미지의 label을 출력
  • Object Localization

    • 이미지에서 객체의 찾아 경계 박스로 표현
  • Object Detection

    • Image Classification+ Object Localization

    • 경계 박스와 label을 합친 박스를 생성

    • 물체의 면적, 둘게 같은 요소를 정확하게 측정 불가

02

  • Image Segmentation

    • 이미지의 각 객체에 대해 픽셀 단위 마스크로 표시

    • Object Detection의 추가 확장 기술

    • 경계 박스보다 더 세분화된 마스크 표현

    • 종류

      • Semantic Segmentation : 카테고리 또는 label에 따라 다른 색상으로 표시

      • Instance Segmentation : 각 객체의 경계를 식별하고 다른 색상으로 표시

03

3. 딥러닝을 활용한 Object Detection

  • 단일 단계 방식

    • 정해진 위치와 정해진 크기의 객체만 탐색

    • 보통 원본 이미지를 고정된 사이즈로 나누고 각 영역에 대해 형태와 크기가 미리 결정된 객체의 고정 개수를 예측

    • 이단계 방식보다는 정확도가 떨어지지만 빠른 처리가 가능

    • ex) YOLO, SSD 등

  • 이단계 방식

    • 객체를 포함할 가능성이 높은 영역을 제안

    • 제안 방법

      • Selective Search 등의 컴퓨터 비전 기술 사용

      • 딥러닝 기반의 영역 제안 네트워크(RPN - Region Proposal Network) 사용

    • 단일 단계보다 높은 정확도를 제공하지만 처리 속도가 느림

    • ex) Mask R-CNN, Faster R-CNN, R_FCN 등

출처

  • Object Recognition 관련 내용 출처

  • 딥러닝을 활용한 Object Detection 출처

  • Mask R-CNN API 참조