物体検出とは
物体検出は、画像の中の物体の位置を推定して、物体のクラスを分類する。
物体を取り囲むボックスをバウンディングボックスという。
画像分類は画像1枚に対して、1つの物体のクラスを分類する。
これに対して、物体検出は、物体の位置の推定とクラス分類の両方を実行する。
1枚の画像中に複数の物体が存在する場合、物体ごとに位置推定とクラス推定を実行する。
R-CNN
物体の領域候補を探す
CNNで特徴を取り出す
取り出した特徴を使ってSVMでクラス分類し、回帰でバウンディングボックスを作成