aMMAI: Fast concurrent object localization and recognition

Fast concurrent object localization and recognition

Summary:
這篇文章中，作者提出了一個方法去實作同時達到object localization和object recognition的動作，假設一張圖片抽出了N個local feature，和給定M個possible object model，要找到在image i中一個bounding region r (localization)去極大化第i個possible model (recognition)的prediction score。
在此目標下，作者使用了branch-and-bound的方式去找解。但是branch-and-bound有兩個很重要的部分，一個是如何去將一個set作分割(branching)，另一個是如何找到一個上限或下限去對每個子集合作處理(bounding)。作者在bounding方面使用的是和ESS[1]中相同的方法，不過在region的取法上，原來的ESS中只針對了長方形的方式來尋找；作者在本篇文章後段也提出了一個改進的方法，可以用composite bounding boxes來用同時搜尋K個長方形，另外一個改進的方法則是選定一個直線邊界的兩端的interval，這樣就可以對一個polygon作出許多不同大小的範圍。這兩種形狀剛好也可以套入branch-and-bound演算法中，且也提出了方法證明了得到score相較於純粹長方形的搜尋中還好，且雖然複雜度稍微提升，但其效果還算顯著。
另外，在搜尋的時候，作者還提出了一個data-dependent的概念，只針對有包含的特徵點的區域來作搜尋，可減少需要搜尋的set。

Comment:
而在原來的ESS中加入一個object model的變數，是否也可讓演算法對應到recognition的功能。還有，雖然作者提出了一些新的方式來定義搜尋區域，但是如何自動選定一個適用的區域形狀，也是一個相當值得思考的課題。

aMMAI

2011年6月1日星期三

Fast concurrent object localization and recognition

沒有留言:

張貼留言

2011年6月1日 星期三

Fast concurrent object localization and recognition

沒有留言:

張貼留言

2011年6月1日星期三