Movatterモバイル変換


[0]ホーム

URL:


takaya imai, profile picture
Uploaded bytakaya imai
PDF, PPTX232,151 views

画像認識の初歩、SIFT,SURF特徴量

Download as PDF, PPTX
画像認識の初歩、SIFT、SURF特徴量          @lawmn2011/01/23, TokyoWebmining
始めにこの知識は個人的なものであり会社とは関係ありません。
Agenda 自己紹介    画像認識に興味を持ったきっかけ 認識手法と変遷     局所特徴量 SIFT特徴量, SURF特徴量    SIFT特徴量とは     用途    SIFT特徴量の抽出方法    SIFT特徴量とSURT特徴量の違い 応用の一例    Bag of features(Bag of keypoints)の紹介
自己紹介名前  lawmn出身  新潟県使用言語  Python, C#大学のときの専攻  素粒子物理学専攻、博士号取得(仕事とはなんの関係もあり  ません)趣味  旅行、今のところ16カ国、南米に行ってみたい
画像認識に興味を持ったきっかけ一年半前にリリースした画像解析による色検索実装
画像特徴量の変遷 第一世代      第二世代          第三世代 対象物全体     局所情報          局所情報のつな 輝度分布      SIFT          がり wavelet   SURF           Haar-like     Joint Haar-like           HOG           Joint HOG                         Shapelet 1990年代    2000 - 2005                         2006 - 現在
局所特徴量SIFT    1999    •Google の論文で言及http://www.esprockets.    com/papers/www2008-jing-baluja.pdf。ただし、アルゴリズムが著作    権で守られている。C#ライブラリ libsift, OpenCV SURF    2006    SIFT の処理速度改良版。OpenCVhaar-like特徴    2001    近接する2 つの矩形領域の明度差                           Haar-    顔認識に用いられ(OpenCVの顔検出)                       likeHOG(Histogram of oriented gradient)    2005                                     HOG    勾配ベースの特徴量    人検出に用いられる
局所特徴量            照明影響 回転不変 拡大縮小 特徴量            特徴量次元   用途             不変        不変 SIFT                             特徴点ごと   128     細かい特徴把握(SURF)       ○        ○      ○                    パノラマ写真生成 HOG                              画像に一つ 3240      おおまかな特徴把握が必要             ○        ×      ×    *4    *5        な場合                      *1     *1Haar-like                         画素ごと    矩形種類数   顔など形状が決まっているも             ○        ×      ○                    のに強い                      *2     *3            *1   別の方法で補完            *2   学習画像による            *3   矩形の大きさで調整            *4   ブロックごとに取得した特徴量を合わせる            *5   30x60画像で、1セルを5ピクセルx5ピクセル、1ブロックを3セルx3セルの場合            *6   前頁の矩形だと14個
SIFT特徴量とはスケールスペースを使った、照明変化や回転、拡大縮小に不変な頑強な特徴量画像一つから128次元のSIFT特徴量が複数取得できる。
SIFT特徴量, SURF特徴量の用途 複数写真からのパノラマ写真合成   Autopano-SIFT
SIFT特徴量, SURF特徴量の用途AR(Argumented Reality, 拡張現実)SURF(Speeded Up Robust Features)すごいhttp://mosapui.blog116.fc2.com/blog-entry-33.html元『【パッケージから】巡音さんがやってきた【召喚】』http://www.nicovideo.jp/watch/sm5519371
SIFT特徴量, SURF特徴量の用途 一般物体認識   具体的な手法を後ほど説明します。
SIFT特徴量の抽出方法1.特徴点検出2.特徴量生成
SIFT特徴量の抽出方法特徴点検出                              元画像・スケールと特徴点検出  DOG(Difference Of Gaussian)   Gaussianで平滑  を使った極値検出                      化(ぼかす)した画                                像の変化を見るこ                                とで特徴的な点を                                調べていく。・不要な特徴点を排除                      (スケールとは平  省略                            滑化Gaussianの                                標準偏差)
SIFT特徴量の抽出方法   拡大縮小の影響               を排除するため、               いくつか解像度               に対して平滑化               処理を行う 元画像               DoG画像例               (左:元画像、右:               DoG画像)
SIFT特徴量の抽出方法特徴量生成・特徴点の向き検出    特徴点周りの輝度変化から最も輝度変化が大きい向きを調べる・特徴量記述   ブロックを特徴点の向きをベースに設定     これにより回転不変となる   特徴点周りの16分割ブロックxブロックごとの8方向輝度変化=128次元   得た128次元ベクトルを長さ1に正規化     照明変化に頑強
SIFT特徴量とSURF特徴量の違い1. 特徴点検出2. 特徴量生成1. 特徴点検出    スケールと特徴点検出      SURFではこの部分の処理が軽量化されている         Gaussianのテイラー展開二次項である上記の左         二つの代わりに、もっと簡単な右二つを使う。      その代わり認識精度はSIFTのほうがよい      SIFTの特許は発明者である David Loweが所有      SURFの特許は? SIFT = Scale-Invariant Feature Transform SURF = Speeded Up Robust Features
Bag of features(Bag of keypoints)の紹介一般物体認識で用いられる方法。2004。複数枚の画像から抽出された特徴量群をクラスタリングし、各物体に割り当てられたクラスタを調べることで、別の画像にどのような物体がどこにあるかを判断する。LBGアルゴリズムではクラスタリングにk-meansを使う。
Bag of features(Bag of keypoints)の紹介         Bag of Words:単語頻度情報   ある単語と文章の関連度を測るために使う一つの方法          文章を単語の集合とみなす       単に頻度情報のみで順番は考えない                 例:TD-IDF       Bag of Features は Bag of Words の画像版     画像(文章)を特徴点集合(単語)の集合とみなし、         特徴点集合(単語)の出現頻度を使う画像から「自転車」「自動車」などを表す特徴点集合の集合を取得し、これらを教師データとして学習して画像内のどこに何があるかを判別する
参考文献SIFT   http://www.vision.ee.ethz.ch/~surf/SURF  http://www.vision.cs.chubu.ac.jp/SIFT/PDF/sift_tutorial.pdfBag of Features(Bag of Keypoints)   http://www.citeulike.org/user/GernotMargreitner/article/581127
ありがとうございました。

Recommended

PDF
Sift特徴量について
PDF
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
PDF
三次元表現まとめ(深層学習を中心に)
PDF
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
PPTX
Structure from Motion
PPTX
SfM Learner系単眼深度推定手法について
PDF
RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
PDF
30th コンピュータビジョン勉強会@関東 DynamicFusion
PDF
【メタサーベイ】基盤モデル / Foundation Models
PDF
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
PDF
確率モデルを用いた3D点群レジストレーション
PDF
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
 
PDF
20190825 vins mono
PDF
【メタサーベイ】Vision and Language のトップ研究室/研究者
PPTX
近年のHierarchical Vision Transformer
PDF
画像生成・生成モデル メタサーベイ
PDF
Domain Adaptation 発展と動向まとめ(サーベイ資料)
PDF
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
PDF
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
PPTX
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
PDF
SSII2018TS: 3D物体検出とロボットビジョンへの応用
 
PDF
機械学習による統計的実験計画(ベイズ最適化を中心に)
PDF
ドメイン適応の原理と応用
PDF
最適化超入門
PDF
[DL輪読会]ICLR2020の分布外検知速報
PDF
トピックモデルの評価指標 Perplexity とは何なのか?
 
PDF
研究効率化Tips Ver.2
PDF
Layer Normalization@NIPS+読み会・関西
PPTX
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
PDF
3次元レジストレーション(PCLデモとコード付き)

More Related Content

PDF
Sift特徴量について
PDF
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
PDF
三次元表現まとめ(深層学習を中心に)
PDF
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
PPTX
Structure from Motion
PPTX
SfM Learner系単眼深度推定手法について
PDF
RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
PDF
30th コンピュータビジョン勉強会@関東 DynamicFusion
Sift特徴量について
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
三次元表現まとめ(深層学習を中心に)
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
Structure from Motion
SfM Learner系単眼深度推定手法について
RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
30th コンピュータビジョン勉強会@関東 DynamicFusion

What's hot

PDF
【メタサーベイ】基盤モデル / Foundation Models
PDF
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
PDF
確率モデルを用いた3D点群レジストレーション
PDF
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
 
PDF
20190825 vins mono
PDF
【メタサーベイ】Vision and Language のトップ研究室/研究者
PPTX
近年のHierarchical Vision Transformer
PDF
画像生成・生成モデル メタサーベイ
PDF
Domain Adaptation 発展と動向まとめ(サーベイ資料)
PDF
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
PDF
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
PPTX
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
PDF
SSII2018TS: 3D物体検出とロボットビジョンへの応用
 
PDF
機械学習による統計的実験計画(ベイズ最適化を中心に)
PDF
ドメイン適応の原理と応用
PDF
最適化超入門
PDF
[DL輪読会]ICLR2020の分布外検知速報
PDF
トピックモデルの評価指標 Perplexity とは何なのか?
 
PDF
研究効率化Tips Ver.2
PDF
Layer Normalization@NIPS+読み会・関西
【メタサーベイ】基盤モデル / Foundation Models
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
確率モデルを用いた3D点群レジストレーション
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
 
20190825 vins mono
【メタサーベイ】Vision and Language のトップ研究室/研究者
近年のHierarchical Vision Transformer
画像生成・生成モデル メタサーベイ
Domain Adaptation 発展と動向まとめ(サーベイ資料)
最近のKaggleに学ぶテーブルデータの特徴量エンジニアリング
SSII2022 [SS2] 少ないデータやラベルを効率的に活用する機械学習技術 〜 足りない情報をどのように補うか?〜
 
【DL輪読会】言語以外でのTransformerのまとめ (ViT, Perceiver, Frozen Pretrained Transformer etc)
SSII2018TS: 3D物体検出とロボットビジョンへの応用
 
機械学習による統計的実験計画(ベイズ最適化を中心に)
ドメイン適応の原理と応用
最適化超入門
[DL輪読会]ICLR2020の分布外検知速報
トピックモデルの評価指標 Perplexity とは何なのか?
 
研究効率化Tips Ver.2
Layer Normalization@NIPS+読み会・関西

Viewers also liked

PPTX
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
PDF
3次元レジストレーション(PCLデモとコード付き)
PDF
PythonによるCVアルゴリズム実装
PDF
統計的学習手法よる人検出
PDF
機械学習モデルフォーマットの話:さようならPMML、こんにちはPFA
PPTX
関東CV勉強会20140802(Face Alignment at 3000fps)
PDF
画像認識のための深層学習
PDF
【第33回コンピュータビジョン勉強会@関東】OpenVX、 NVIDIA VisionWorks使ってみた
PPTX
OpenCVを用いた画像処理入門
PDF
画像認識における幾何学的不変性の扱い
PDF
殺しても死なないアプリ 〜Core Bluetooth の「状態の保存と復元」機能〜
PDF
Apple Watch 間通信
PDF
効果が出る「仕事の教え方」
PPT
Mycin
 
PDF
"Challenges in Object Detection on Embedded Devices," a Presentation from CEVA
PDF
ILSVRC2015 手法のメモ
PDF
PyCharm入門
PDF
10分でわかる無料になったXamarin
PDF
Face Alignment by Explicit Shape Regression
PDF
ICCV2015勉強会 顔関連論文のまとめ
画像処理ライブラリ OpenCV で 出来ること・出来ないこと
3次元レジストレーション(PCLデモとコード付き)
PythonによるCVアルゴリズム実装
統計的学習手法よる人検出
機械学習モデルフォーマットの話:さようならPMML、こんにちはPFA
関東CV勉強会20140802(Face Alignment at 3000fps)
画像認識のための深層学習
【第33回コンピュータビジョン勉強会@関東】OpenVX、 NVIDIA VisionWorks使ってみた
OpenCVを用いた画像処理入門
画像認識における幾何学的不変性の扱い
殺しても死なないアプリ 〜Core Bluetooth の「状態の保存と復元」機能〜
Apple Watch 間通信
効果が出る「仕事の教え方」
Mycin
 
"Challenges in Object Detection on Embedded Devices," a Presentation from CEVA
ILSVRC2015 手法のメモ
PyCharm入門
10分でわかる無料になったXamarin
Face Alignment by Explicit Shape Regression
ICCV2015勉強会 顔関連論文のまとめ

Similar to 画像認識の初歩、SIFT,SURF特徴量

PDF
Siftによる特徴点抽出
PPTX
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
PDF
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
PDF
コンピュータビジョンで作る未来の栽培技術POL共催セミナー_20220527
PDF
カメラ間人物照合サーベイ
PPT
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
PDF
VIEW2013 Binarycode-based Object Recognition
PDF
Opencv object detection_takmin
PDF
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
PPTX
Introduction to Local Image Features....
PDF
ICCV2011 report
PPTX
KantoCV/Selective Search for Object Recognition
PDF
大規模画像認識とその周辺
PDF
20101023 cvsaisentan tsubosaka
PDF
超高速オンライン転移学習
PDF
20110904cvsaisentan(shirasy) 3 4_3
PDF
関西CVPRML勉強会(特定物体認識) 2012.1.14
PDF
20130925.deeplearning
PDF
20140726 関東cv勉強会
PDF
静岡Developers勉強会コンピュータビジョンvol2
Siftによる特徴点抽出
Image Retrieval Overview (from Traditional Local Features to Recent Deep Lear...
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
コンピュータビジョンで作る未来の栽培技術POL共催セミナー_20220527
カメラ間人物照合サーベイ
第18回コンピュータビジョン勉強会@関東「ICCV祭り」発表資料(kanejaki)
VIEW2013 Binarycode-based Object Recognition
Opencv object detection_takmin
【DLゼミ】XFeat: Accelerated Features for Lightweight Image Matching
Introduction to Local Image Features....
ICCV2011 report
KantoCV/Selective Search for Object Recognition
大規模画像認識とその周辺
20101023 cvsaisentan tsubosaka
超高速オンライン転移学習
20110904cvsaisentan(shirasy) 3 4_3
関西CVPRML勉強会(特定物体認識) 2012.1.14
20130925.deeplearning
20140726 関東cv勉強会
静岡Developers勉強会コンピュータビジョンvol2

画像認識の初歩、SIFT,SURF特徴量

  • 1.
    画像認識の初歩、SIFT、SURF特徴量 @lawmn2011/01/23, TokyoWebmining
  • 2.
  • 3.
    Agenda 自己紹介 画像認識に興味を持ったきっかけ 認識手法と変遷  局所特徴量 SIFT特徴量, SURF特徴量 SIFT特徴量とは  用途 SIFT特徴量の抽出方法 SIFT特徴量とSURT特徴量の違い 応用の一例 Bag of features(Bag of keypoints)の紹介
  • 4.
    自己紹介名前 lawmn出身 新潟県使用言語 Python, C#大学のときの専攻 素粒子物理学専攻、博士号取得(仕事とはなんの関係もあり ません)趣味 旅行、今のところ16カ国、南米に行ってみたい
  • 5.
  • 6.
    画像特徴量の変遷 第一世代 第二世代 第三世代 対象物全体 局所情報 局所情報のつな 輝度分布 SIFT がり wavelet SURF Haar-like Joint Haar-like HOG Joint HOG Shapelet 1990年代 2000 - 2005 2006 - 現在
  • 7.
    局所特徴量SIFT 1999 •Google の論文で言及http://www.esprockets. com/papers/www2008-jing-baluja.pdf。ただし、アルゴリズムが著作 権で守られている。C#ライブラリ libsift, OpenCV SURF 2006 SIFT の処理速度改良版。OpenCVhaar-like特徴 2001 近接する2 つの矩形領域の明度差 Haar- 顔認識に用いられ(OpenCVの顔検出) likeHOG(Histogram of oriented gradient) 2005 HOG 勾配ベースの特徴量 人検出に用いられる
  • 8.
    局所特徴量 照明影響 回転不変 拡大縮小 特徴量 特徴量次元 用途 不変 不変 SIFT 特徴点ごと 128 細かい特徴把握(SURF) ○ ○ ○ パノラマ写真生成 HOG 画像に一つ 3240 おおまかな特徴把握が必要 ○ × × *4 *5 な場合 *1 *1Haar-like 画素ごと 矩形種類数 顔など形状が決まっているも ○ × ○ のに強い *2 *3 *1 別の方法で補完 *2 学習画像による *3 矩形の大きさで調整 *4 ブロックごとに取得した特徴量を合わせる *5 30x60画像で、1セルを5ピクセルx5ピクセル、1ブロックを3セルx3セルの場合 *6 前頁の矩形だと14個
  • 9.
  • 11.
  • 12.
    SIFT特徴量, SURF特徴量の用途AR(Argumented Reality,拡張現実)SURF(Speeded Up Robust Features)すごいhttp://mosapui.blog116.fc2.com/blog-entry-33.html元『【パッケージから】巡音さんがやってきた【召喚】』http://www.nicovideo.jp/watch/sm5519371
  • 13.
    SIFT特徴量, SURF特徴量の用途 一般物体認識 具体的な手法を後ほど説明します。
  • 14.
  • 15.
    SIFT特徴量の抽出方法特徴点検出 元画像・スケールと特徴点検出 DOG(Difference Of Gaussian) Gaussianで平滑 を使った極値検出 化(ぼかす)した画 像の変化を見るこ とで特徴的な点を 調べていく。・不要な特徴点を排除 (スケールとは平 省略 滑化Gaussianの 標準偏差)
  • 16.
    SIFT特徴量の抽出方法拡大縮小の影響 を排除するため、 いくつか解像度 に対して平滑化 処理を行う 元画像 DoG画像例 (左:元画像、右: DoG画像)
  • 17.
    SIFT特徴量の抽出方法特徴量生成・特徴点の向き検出 特徴点周りの輝度変化から最も輝度変化が大きい向きを調べる・特徴量記述 ブロックを特徴点の向きをベースに設定 これにより回転不変となる 特徴点周りの16分割ブロックxブロックごとの8方向輝度変化=128次元 得た128次元ベクトルを長さ1に正規化 照明変化に頑強
  • 18.
    SIFT特徴量とSURF特徴量の違い1. 特徴点検出2. 特徴量生成1.特徴点検出 スケールと特徴点検出 SURFではこの部分の処理が軽量化されている Gaussianのテイラー展開二次項である上記の左 二つの代わりに、もっと簡単な右二つを使う。 その代わり認識精度はSIFTのほうがよい SIFTの特許は発明者である David Loweが所有 SURFの特許は? SIFT = Scale-Invariant Feature Transform SURF = Speeded Up Robust Features
  • 19.
    Bag of features(Bagof keypoints)の紹介一般物体認識で用いられる方法。2004。複数枚の画像から抽出された特徴量群をクラスタリングし、各物体に割り当てられたクラスタを調べることで、別の画像にどのような物体がどこにあるかを判断する。LBGアルゴリズムではクラスタリングにk-meansを使う。
  • 20.
    Bag of features(Bagof keypoints)の紹介 Bag of Words:単語頻度情報 ある単語と文章の関連度を測るために使う一つの方法 文章を単語の集合とみなす 単に頻度情報のみで順番は考えない 例:TD-IDF Bag of Features は Bag of Words の画像版 画像(文章)を特徴点集合(単語)の集合とみなし、 特徴点集合(単語)の出現頻度を使う画像から「自転車」「自動車」などを表す特徴点集合の集合を取得し、これらを教師データとして学習して画像内のどこに何があるかを判別する
  • 21.
    参考文献SIFThttp://www.vision.ee.ethz.ch/~surf/SURF http://www.vision.cs.chubu.ac.jp/SIFT/PDF/sift_tutorial.pdfBag of Features(Bag of Keypoints) http://www.citeulike.org/user/GernotMargreitner/article/581127
  • 22.

[8]ページ先頭

©2009-2025 Movatter.jp