Movatterモバイル変換


[0]ホーム

URL:


Uploaded byla_flance
41,390 views

Sift特徴量について

【社内勉強会用】Sift特徴量について※間違っている部分があるかもしれません

Downloaded 157 times
2015/3/12【社内勉強会用】
 SIFT:Scale-Invariant Feature Transform 特徴点の検出と特徴量の記述を行う 特徴◦ 拡大縮小に強い◦ 回転に強い◦ 照明変化に強い 用例◦ 異なる画像間でのマッチング パノラマ画像の自動作成とか◦ 一般物体認識
 ざっくり言うと以下の過程をふむ1.特徴点の検出1-1.特徴点となる候補点の探索1-2.候補点の絞り込み2.特徴量の記述2-1.各特徴点の勾配を検出2-2.各特徴点の勾配方向ヒストグラムを計算
 「第1 段階のキーポイント検出では,DoG 処理を用いてスケールスペースにおける極値探索をすることで,キーポイントの位置とスケールを決定する」(中部大学 藤吉先生 談)
 「スケールスペース」って何?◦ 2次元(x, y)である画像に、「スケール」という次元を加えて、3次元で画像を理解してみようという考え
 「スケール」っていう次元は、具体的にどーやって追加するのか↓ 画像(x,y)を、ある量σだけ平滑化した(x,y,σ)を考える 「平滑化」とは、いわゆる“ぼかした”画像にすることスケールσ
 「平滑化」ってどーやるの?↓平滑化の方法自体はいろいろあるけど、SIFTでは「ガウシアンフィルタ」を使用する・フィルタの式𝑓𝑓 𝑥𝑥, 𝑦𝑦 =12𝜋𝜋𝜎𝜎2 exp(−𝑥𝑥2+𝑦𝑦22𝜎𝜎2 )(3次元目のパラメータがσとなる)
 基本的な考え方注目画素の周辺要素の画素に、適当な倍率を掛けた値の合計を、フィルタ適用後の値とする(例)(2,2)座標の4でフィルタ計算する時。6×(-1)+1×(-1)+6×(-1)+5×(-1)+4×( 8)+3×(-1)+2×(-1)+2×(-1)+1×(-1)=6
 ガウシアンフィルタでは、注目要素周りの倍率を以下の式によって決定する。((x,y)は注目画素からの距離)◦ 𝑓𝑓 𝑥𝑥, 𝑦𝑦 =12𝜋𝜋𝜎𝜎2 exp(−𝑥𝑥2+𝑦𝑦22𝜎𝜎2 )◦ 普通は適用に離散化して使うらしい ⇒◦ フィルタイメージこれが各要素毎に適用されるσ大 σ小
 ガウス窓と計算量◦ ガウシアンフィルタは真上から見ると、実質的な適用範囲は円形になり、それをガウス窓と言ったりする◦ σが大きくなると、ガウス窓が大きくなり、適用範囲も大きくなり、計算量も大きくなる SIFTではこれを回避するための工夫がされてますが割愛します・・・スケールσ
 特徴点の(候補点)探索↓ スケール方向の差分画像(DoG画像)において、極値をとる点を特徴点とする(DoG:Difference-of-Gaussian)DoG画像
 DoG画像における極値の検出DoG画像ある点(図中のX)において、スケールを含めた近傍26点のいずれよりも大きい(or小さい)↓Xを特徴点(の候補)とする
 なぜ、前述の方法で、「特徴点」が探せるのか↓「特徴点として適した点では、スケールスペースにおいてDoGフィルタの結果が極値を持つ」から・・・よくわからないけど差分が極値(最大or最小)となる⇒変化量が大きい⇒情報量が多いってことみたい
 なぜ、拡大・縮小に強いのか↓同じ画像であれば、拡大・縮小しても、同じ点でDog画像が極値を持つから・・・なお、そのときのσは、拡大率・縮小率に比例する
この点が極値を示したとき、DoG画像2倍した画像でもこの点が極値を示す.また、その時のガウス窓のサイズ(σ)も2倍となる:ガウス窓2倍に拡大
 サブピクセル位置推定特徴点をピクセル単位(整数単位)じゃなくて、もっと細かく出す(補正する) ダメな候補点を除外ダメな候補点たち◦ エッジ上の点◦ 極値をとりはしたものの、値自体が小さい点
 サブピクセル位置推定◦ 候補点の周りでDoG関数をテイラー展開◦ 出てきた関数の導関数=0となる点を求めて、それを特徴点とする◎要するに、DoG画像の出力値は、(x,y,σ)を変数とする関数なので、それを特徴点周りで近似してやり、その近似式の導関数とかを使って、極値をとる点を算出し直すってことだと思う
 エッジ上の点を除外◦ ヘッセ行列とハリスのコーナー検出の原理を用いて、エッジ上の点を除外 詳細は割愛・・・ DoG出力値が小さいものを除外◦ 閾値以下だったら除外◦ 閾値は、0.03が良いらしい(値は0~1に正規化済み)
 特徴点の周りで輝度勾配ヒストグラムを作成 方向・強度の計算はHOG特徴量と(ほぼ)同じ 方向は36方向◎ポイント強度は、特徴点のスケールのガウシアンフィルタで重み付け↓・このスケールのみ強調されるのでスケール変化に強くなる・特徴点に近いほど強調される
 求めたヒストグラムにて、強度が最大値の80%を超える方向を、この特徴点の方向と定める(複数出てくるときもある)
 特徴点の方向を基準の方向として、再度 輝度勾配ヒストグラムを作成する(回転に強い) このとき、対象領域をHOGで言うところの4×4ブロックに分割し、各ブロックごとにヒストグラムを作成する 方向は8方向(45度ずつ)とする 4×4×8=128次元の特徴量となる あと、正規化もする(照明変化に強い)
⇒基準方向に回転⇒ブロック毎に勾配(8方向)・強度を算出⇒⇒ヒストグラム作成(4×4×8=128次元)
 各画像で抽出した特徴点同士で、総当たり比較う 比較方法はユークリッド距離を使う dが最も小さい点同士を対応点とする 場合によっては制約をつけたりもする◦ (例)最小のdと2番目に小さいdを比較して、2倍以上差がないとダメ
 あらかじめ特徴点を抽出しておいたテンプレート画像を用意 対象画像とテンプレート画像で対応点探索 対応点の位置・スケール・方向を比較して、最も近いテンプレート画像を決定する
 位置情報は無視して、画像を特徴量の集合とみなし、Bag-of-Keypointsを使って分類する Bag-of-KeypointsはBag-of-Wordsの画像版 特徴量の頻度で画像を分類する
 色情報使ってない SURFはSIFTの特徴点検出処理を軽量化したものらしい(その分精度は落ちる) SURFはOpenCVにあるらしい
 http://www.hci.iis.u-tokyo.ac.jp/~ysato/class14/supplements/sift_tutorial-Fujiyoshi.pdf http://www.isl.titech.ac.jp/~nagahashilab/member/longb/iip/LectureNotes/sift_image.pdf http://www.kki.yamanashi.ac.jp/~ohbuchi/courses/2013/sm2013/pdf/sm13_lect03_20131028all.pdf http://d.hatena.ne.jp/colorcle/20091021/1256138848 http://www.ic.is.tohoku.ac.jp/~swk/lecture/ic2009/kagami_ic20090630.pdf
 以下に、デモようのツール(siftDemoV4)が置いてあったので触ってみた◦ http://www.cs.ubc.ca/~lowe/keypoints/ 使い方◦ コマンドプロンプトから実行 入力画像の特徴点をテキストにはく siftWin32.exe <source.pgm >resultkey.txt 入力画像に特徴点を追記した画像を作成する siftWin32.exe -display <source.pgm >result.pgm※画像形式は.pgm限定
 DoG画像のヘッセ行列H =Dxx DxyDxy Dyyを考えた時、その固有値は主曲率に比例する 主曲率:曲面上のある点における最大曲率と最小曲率(厳密には違うけど雰囲気的にはそんな感じ・・・ 二つの主曲率の差が大きい⇒ある方向の変化は大きいけど、別の方向の変化は小さい⇒エッジの可能性が高い Hの固有値の大小=主曲率の大小から、コーナー(エッジじゃない部分)を検出する
車 顔猫↓SIFT特徴量抽出一つ一つが128次元のベクトル⇒⇒⇒クラスタリング↓代表ベクトル作成車 顔猫各代表ベクトルに最も近い特徴量の出現頻度から、それぞれの画像を表すヒストグラムを作成
 分類したい画像のSIFT特徴量を抽出↓ 前述の方法で、各代表ベクトルのヒストグラムを作成↓ 学習画像のどのヒストグラムに近いかを判定

Recommended

PDF
画像認識の初歩、SIFT,SURF特徴量
PDF
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
PDF
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
PDF
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
 
PPTX
SfM Learner系単眼深度推定手法について
PDF
RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
PPTX
Structure from Motion
PDF
30th コンピュータビジョン勉強会@関東 DynamicFusion
PDF
確率モデルを用いた3D点群レジストレーション
PDF
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
 
PDF
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
PPTX
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autono...
PDF
Siftによる特徴点抽出
PDF
SSII2018TS: 3D物体検出とロボットビジョンへの応用
 
PDF
NDTスキャンマッチング 第1回3D勉強会@PFN 2018年5月27日
PDF
画像生成・生成モデル メタサーベイ
PDF
【メタサーベイ】基盤モデル / Foundation Models
PDF
三次元表現まとめ(深層学習を中心に)
PDF
Point net
PDF
Domain Adaptation 発展と動向まとめ(サーベイ資料)
PDF
ドメイン適応の原理と応用
PDF
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
 
PPTX
[DL輪読会]Flow-based Deep Generative Models
PPTX
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜​
 
PDF
オープンソース SLAM の分類
PPTX
論文紹介: Fast R-CNN&Faster R-CNN
PPTX
モデルアーキテクチャ観点からの高速化2019
PPTX
【DL輪読会】ViT + Self Supervised Learningまとめ
PDF
ILSVRC2015 手法のメモ
PPTX
関東CV勉強会20140802(Face Alignment at 3000fps)

More Related Content

PDF
画像認識の初歩、SIFT,SURF特徴量
PDF
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
PDF
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
PDF
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
 
PPTX
SfM Learner系単眼深度推定手法について
PDF
RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
PPTX
Structure from Motion
PDF
30th コンピュータビジョン勉強会@関東 DynamicFusion
画像認識の初歩、SIFT,SURF特徴量
画像局所特徴量と特定物体認識 - SIFTと最近のアプローチ -
MIRU2013チュートリアル:SIFTとそれ以降のアプローチ
SSII2019TS: 実践カメラキャリブレーション ~カメラを用いた実世界計測の基礎と応用~
 
SfM Learner系単眼深度推定手法について
RAFT: Recurrent All-Pairs Field Transforms for Optical Flow
Structure from Motion
30th コンピュータビジョン勉強会@関東 DynamicFusion

What's hot

PDF
確率モデルを用いた3D点群レジストレーション
PDF
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
 
PDF
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
PPTX
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autono...
PDF
Siftによる特徴点抽出
PDF
SSII2018TS: 3D物体検出とロボットビジョンへの応用
 
PDF
NDTスキャンマッチング 第1回3D勉強会@PFN 2018年5月27日
PDF
画像生成・生成モデル メタサーベイ
PDF
【メタサーベイ】基盤モデル / Foundation Models
PDF
三次元表現まとめ(深層学習を中心に)
PDF
Point net
PDF
Domain Adaptation 発展と動向まとめ(サーベイ資料)
PDF
ドメイン適応の原理と応用
PDF
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
 
PPTX
[DL輪読会]Flow-based Deep Generative Models
PPTX
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜​
 
PDF
オープンソース SLAM の分類
PPTX
論文紹介: Fast R-CNN&Faster R-CNN
PPTX
モデルアーキテクチャ観点からの高速化2019
PPTX
【DL輪読会】ViT + Self Supervised Learningまとめ
確率モデルを用いた3D点群レジストレーション
SSII2022 [TS1] Transformerの最前線〜 畳込みニューラルネットワークの先へ 〜
 
SSII2021 [OS2-01] 転移学習の基礎:異なるタスクの知識を利用するための機械学習の方法
 
[DL輪読会]“Spatial Attention Point Network for Deep-learning-based Robust Autono...
Siftによる特徴点抽出
SSII2018TS: 3D物体検出とロボットビジョンへの応用
 
NDTスキャンマッチング 第1回3D勉強会@PFN 2018年5月27日
画像生成・生成モデル メタサーベイ
【メタサーベイ】基盤モデル / Foundation Models
三次元表現まとめ(深層学習を中心に)
Point net
Domain Adaptation 発展と動向まとめ(サーベイ資料)
ドメイン適応の原理と応用
SSII2021 [TS1] Visual SLAM ~カメラ幾何の基礎から最近の技術動向まで~
 
[DL輪読会]Flow-based Deep Generative Models
SSII2020SS: 微分可能レンダリングの最新動向 〜「見比べる」ことによる3次元理解 〜​
 
オープンソース SLAM の分類
論文紹介: Fast R-CNN&Faster R-CNN
モデルアーキテクチャ観点からの高速化2019
【DL輪読会】ViT + Self Supervised Learningまとめ

Viewers also liked

PDF
ILSVRC2015 手法のメモ
PPTX
関東CV勉強会20140802(Face Alignment at 3000fps)
PDF
Face Alignment by Explicit Shape Regression
PDF
ICCV2015勉強会 顔関連論文のまとめ
PPTX
第28回コンピュータビジョン勉強会@関東(kanejaki担当分)
PDF
cvsaisentan5 Multi View Stereo 3.3
PPTX
Cvim saisentan-5-2-tomoaki
PPTX
20150328 cv関東勉強会 sumisumithパート_v1.3
PPTX
関東コンピュータビジョン勉強会
 
PPTX
【講演資料】アテにされる / どういうこと?どすればいいの?
DOCX
公共案件セールスガイド_sample
PDF
3次元レジストレーション(PCLデモとコード付き)
PDF
AutoEncoderで特徴抽出
PDF
28th CV勉強会@関東 #3
PDF
これから始める人の為のディープラーニング基礎講座
PPTX
Jubatus 1.0 の紹介
PPTX
新聞から今年の漢字を予測する
PDF
Python 特徴抽出プラグイン
PDF
Jubakitの解説
ODP
小町のレス数が予測できるか試してみた
ILSVRC2015 手法のメモ
関東CV勉強会20140802(Face Alignment at 3000fps)
Face Alignment by Explicit Shape Regression
ICCV2015勉強会 顔関連論文のまとめ
第28回コンピュータビジョン勉強会@関東(kanejaki担当分)
cvsaisentan5 Multi View Stereo 3.3
Cvim saisentan-5-2-tomoaki
20150328 cv関東勉強会 sumisumithパート_v1.3
関東コンピュータビジョン勉強会
 
【講演資料】アテにされる / どういうこと?どすればいいの?
公共案件セールスガイド_sample
3次元レジストレーション(PCLデモとコード付き)
AutoEncoderで特徴抽出
28th CV勉強会@関東 #3
これから始める人の為のディープラーニング基礎講座
Jubatus 1.0 の紹介
新聞から今年の漢字を予測する
Python 特徴抽出プラグイン
Jubakitの解説
小町のレス数が予測できるか試してみた

Similar to Sift特徴量について

PDF
ICCV2011 report
PDF
画像認識における幾何学的不変性の扱い
PDF
20101023 cvsaisentan tsubosaka
PDF
藤吉研究室10周年記念「これまで10年,ここから10年」
PDF
20130925.deeplearning
PDF
Deep residual learning for image recognition
PPTX
RAPiD
PDF
東工大長谷川修研紹介 2011 (8月1日版)
PDF
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
PDF
関西CVPRML勉強会(特定物体認識) 2012.1.14
PDF
コンピュータビジョンで作る未来の栽培技術POL共催セミナー_20220527
PDF
紫色の研究 - 画像処理によるパープルフリンジ除去
PDF
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
PDF
カメラ間人物照合サーベイ
PDF
時間空間方向性補間とマルチスケール非線形エンハンサによる1パスビデオ超解像
PDF
Deformable Part Modelとその発展
PPTX
[DL輪読会]Exploiting Cyclic Symmetry in Convolutional Neural Networks
PDF
20140726 関東cv勉強会
PDF
3D映像のための自動色補正論文
PPTX
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation
ICCV2011 report
画像認識における幾何学的不変性の扱い
20101023 cvsaisentan tsubosaka
藤吉研究室10周年記念「これまで10年,ここから10年」
20130925.deeplearning
Deep residual learning for image recognition
RAPiD
東工大長谷川修研紹介 2011 (8月1日版)
20110109第8回CV勉強会(ミーンシフトの原理と応用:6章・7章)shirasy)
関西CVPRML勉強会(特定物体認識) 2012.1.14
コンピュータビジョンで作る未来の栽培技術POL共催セミナー_20220527
紫色の研究 - 画像処理によるパープルフリンジ除去
-SSIIの技術マップ- 過去•現在, そして未来 [領域]認識
カメラ間人物照合サーベイ
時間空間方向性補間とマルチスケール非線形エンハンサによる1パスビデオ超解像
Deformable Part Modelとその発展
[DL輪読会]Exploiting Cyclic Symmetry in Convolutional Neural Networks
20140726 関東cv勉強会
3D映像のための自動色補正論文
DLゼミ: ViTPose: Simple Vision Transformer Baselines for Human Pose Estimation

Sift特徴量について


[8]ページ先頭

©2009-2025 Movatter.jp