Selective Search
Bounding boxe들을 찾아주는 super pixel기반(엣지를 잘 표현하는 patch)의 selective search는 hierarchical grouping algorithm 방식을 사용
학습 방법
Definition
$R$: 선택된 region 후보들 {$r_{1}, r_{2},…$}
$S$: region들의 유사도 집합 {$s(r_{i}, r_{j})$,…}
- $r_{1}, r_{2},…r_{n}$들을 초기화
- 가장 유사성이 높은 $s($$r_{i}$, $r_{j}$$)$을 선택
- 선택된 $r_{i}$, $r_{j}$의 영역을 $r_{t}$로 합침
- 유사성 집합 $S$에서 이미 합쳐진 $s($$r_{i}$, $r_{\ast})$, $s(r_{\ast}$, $r_{j}$$)$을 제거
- 합쳐진 $r_{t}$와 나머지 region들의 새로운 유사성 집합($S_t$)를 계산
- 새로운 유사성 집합($S_t$), 합쳐진 region( $r_{t}$)을 원래 집합($S$, $R$)에 포함시킴
- 하나의 region이 될때까지 반복
어떻게 유사성이 높다고 판단할 수 있는가?
- Region similarity
- Selective Search의 유사성은 $[0,1]$ 사이로 정규화된 4가지 요소(Color, Texture, Size, Fill)들의 가중합으로 계산됨
$$S(r_{i},r_{j})=a_{1}s_{colour}(r_{i},r_{j})+a_{2}s_{texture}(r_{i},r_{j})+a_{3}s_{size}(r_{i},r_{j})+a_{4}s_{fill}(r_{i},r_{j})$$
$$A=\{a_{1}, a_{2}, a_{3}, a_{4}\}, \quad 0 \le a_i \le 1 $$
A값 설정은 다양한 전략들이 존재하여 본 논문에서는 모든 요소들의 가중치가 같다고 봄
합쳐진 Region($r_{t}$)의 $c_t$은 어떻게 구할것인가?
초기에 생성한 $C_i={c^1_i,…,c^n_i}$을 이용하여 업데이트함 (efficiently propagated)
$$C_t = \frac{size(r_i) \times C_i + size(r_j) \times C_j}{size(r_i)+size(r_j)}$$
$$r_t = size(r_i)+size(r_j)$$