(참고 블로그: https://gaussian37.github.io/vision-detection-centernet/)

Introduction

CenterNet → object size, dimension, 3D extent, orientation, pose와 같은 속성들을 center location으로부터 direct regression

CenterNet은 각 center point에서 output을 추가하여 human pose estimation이나 3d object detection의 task로 확장 가능

image.png

Preliminary

Image:

$$ I\in R^{W\times H\times 3} $$

모델의 목표는 keypoint heatmap을 추론하는 것

Heatmap:

$$ \hat{Y}\in [0, 1]^{\frac{W}{R}\times\frac{H}{R}\times C} $$