Movatterモバイル変換


[0]ホーム

URL:


JP7654421B2 - 情報処理装置、情報処理方法及びプログラム - Google Patents

情報処理装置、情報処理方法及びプログラム
Download PDF

Info

Publication number
JP7654421B2
JP7654421B2JP2021028715AJP2021028715AJP7654421B2JP 7654421 B2JP7654421 B2JP 7654421B2JP 2021028715 AJP2021028715 AJP 2021028715AJP 2021028715 AJP2021028715 AJP 2021028715AJP 7654421 B2JP7654421 B2JP 7654421B2
Authority
JP
Japan
Prior art keywords
cluster
data
information processing
image
threshold
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
JP2021028715A
Other languages
English (en)
Other versions
JP2022129865A (ja
Inventor
康晴 平戸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon IncfiledCriticalCanon Inc
Priority to JP2021028715ApriorityCriticalpatent/JP7654421B2/ja
Publication of JP2022129865ApublicationCriticalpatent/JP2022129865A/ja
Application grantedgrantedCritical
Publication of JP7654421B2publicationCriticalpatent/JP7654421B2/ja
Activelegal-statusCriticalCurrent
Anticipated expirationlegal-statusCritical

Links

Images

Landscapes

Description

本発明は、画像の分類技術に関する。
情報処理システムにおいては、データベース内の画像を同一オブジェクトのクラスタにまとめておき、クエリ画像と同一のクラスタを選択することでユーザーに検索結果を表示する。
特開2010-250633号公報
特許文献1では、階層的クラスタリング手法によって生成したクラスタの中から画像の属性情報を利用してクラスタを選択する技術が開示されている。しかしながら、従来の階層的クラスタリング手法で生成されたクラスタは一般的にクラスタ内のデータ数とクラスタ内のデータのノイズ混入率はトレードオフであることが知られている。本発明はこのような問題点に鑑みなされたものであり、複数のデータを分類したクラスタに含まれるノイズを低減することを目的とする。
本発明は、複数のデータのうち、第1の閾値よりも類似度の大きいデータの集合である第1のクラスタを取得するクラスタ取得手段と、前記複数のデータのうち前記第1のクラスタに含まれない特定のデータとの類似度が、前記第1の閾値とは異なる第2の閾値よりも大きいデータが、前記第1のクラスタ内に所定の数よりも多く存在する場合に、前記特定のデータを前記第1のクラスタに追加することを決定する決定手段と、を有することを特徴とする。
本発明によれば、複数のデータを分類したクラスタに含まれるノイズを低減できる。
情報処理装置のハードウェア構成の一例を示すブロック図。情報処理装置の機能構成例を示すブロック図。情報処理装置が処理するデータのデータフローを示すブロック図。情報処理装置が実行する処理を説明するフローチャート。特徴空間を説明する図。情報処理システムのハードウェア構成の一例を示す図。情報処理システムの機能構成例を示すブロック図。情報処理装置が処理するデータの情報処理装置のデータフローを示すブロック図。情報処理装置が実行する処理を説明するフローチャート。画像抽出システムのハードウェア構成の一例を示す図。情報処理システムの機能構成例を示すブロック図。情報処理装置のデータフローを示すブロック図。情報処理装置が実行する処理を説明するフローチャート。登録顔画像302の各顔特徴量間のコサイン類似度を説明する図。登録顔画像302の各顔画像の人物対応表の一例を示すテーブル。
以下、本発明の実施形態について図面に基づいて説明する。
(実施形態1)
単連結法などに代表される、データやクラスタを融合していく過程を樹形図で表現できる従来の階層的クラスタリング手法で生成されたクラスタは一般的にクラスタ内のデータ数とクラスタ内のデータのノイズ混入率はトレードオフである。例えばクラスタの平均特徴量間の類似度が一定の閾値を越えた場合にクラスタ同士を結合させる場合、閾値を高く設定すると結合されるクラスタは同一クラスで統一されるが、本来同一クラスとして結合されるべき一部のクラスタ結合されない状況が発生する。逆に閾値を低く設定すると同一クラスのクラスタは全て結合されるが、同一クラスではないクラスタも結合してしまう。図1は、本実施形態に係る情報処理システムのハードウェア構成の一例を示す図である。情報処理システムは、情報処理装置100を用いて、クエリとして指定された人物の検索を行う。
CPU101は、情報処理装置100全体を制御するCentral Processing Unitである。ROM102は、変更を必要としないプログラムやパラメータを格納するRead Only Memoryである。RAM103は、外部装置などから供給されるプログラムやデータを一時記憶するRandom Access Memoryである。外部記憶装置104は、情報処理装置100に固定して設置されたハードディスクやメモリカードなどの記憶装置である。なお、外部記憶装置104は、情報処理装置100から着脱可能なフレキシブルディスク(FD)やCompact Disc(CD)等の光ディスク、磁気や光カード、ICカード、メモリカードなどを含んでもよい。なお、後述する情報処理装置100の機能や処理は、CPU101がROM102や外部記憶装置104に格納されているプログラムを読み出し、このプログラムを実行することにより実現されるものである。
入力I/F105は、ユーザーの操作を受け、データを入力するポインティングデバイスやキーボードなどの入力部109とのインターフェースである。出力デバイスI/F106は、情報処理装置100の保持するデータや供給されたデータを表示するためのモニタ(表示装置)110とのインターフェースである。なお、データの出力方法はモニタ等の表示装置に限らず、音声を出力するスピーカー等の出力装置であってもよい。システムバス108は、101~107の各ユニットを通信可能に接続する伝送路である。
図2は、本実施形態に係る情報処理装置100の機能構成例を示すブロック図である。情報処理装置100は、画像取得部201、特徴抽出部202、クラスタ取得部203、選択部204、画像決定部205から成り、ROM102に格納される。ROM102の有する各機能部については後述する。
図3は本実施形態に係る情報処理装置が行う情報処理のデータフローの一例を示すブロック図である。なお、本実施形態は外部記憶装置104内に登録された複数の顔画像から検索したい人物の顔画像をクエリとして検索する情報処理装置について言及する。本実施形態に係る検索処理においては、画像取得部201が、外部記憶装置104から検索対象となる複数の登録顔画像302を取得する。さらに、特徴抽出部202が、複数の登録顔画像302の特徴量である複数の登録顔特徴量303を算出する。特徴量の算出は画像の色ヒストグラムでもよいし、CNN(Convolutional Neutral Network)等の深層学習手法によって算出する方法を用いてもよい。
そして、クラスタ取得部203は登録顔特徴量303を用いた階層的クラスタリング手法で登録顔画像302をクラスタリングする。なお、本実施形態におけるクラスタリングに使用する類似度はコサイン類似度を用いるが、特徴量間のユークリッド距離などでもよい。クラスタリング手法に関してはクラスタ同士の要素間で最大のコサイン類似度が閾値TH1(第1の閾値)以上の場合にクラスタを結合する単連結法を用いる。実施するクラスタリング手法は階層的クラスタリングであればどの手法でもよい。また、本実施形態における閾値TH1は0.8とする。
次に、クラスタリング選択部204は、画像情報取得部204aと類似クラスタ算出部204bをもち、クラスタ取得部203で生成されたクラスタから特定のクラスタを1つ選択する。まず画像情報取得部204aが、入力部109にてユーザーが指定したクエリ顔画像301を入力I/F105を介して取得し、クエリ顔画像301の特徴量であるクエリ顔特徴量304を算出する。なおこの際、特徴量の算出は特徴量抽出部202と同様の方法を用いる。次に、類似クラスタ算出部204bがクエリ顔特徴量304を用いてクエリ顔画像301と同一人物の顔画像をもつクラスタを決定する。本実施形態では各クラスタ内の登録顔特徴量を平均した平均特徴量とクエリ顔特徴量304のコサイン類似度を計算し、閾値TH2以上(第3の閾値)の値かつ最大のコサイン類似度を持つクラスタを選択する。この手法もコサイン類似度に限らず両特徴量のユークリッド距離などを用いても構わない。なお、本実施形態における閾値TH2は0.8とする。
画像決定部205では、選択部204で選択された選択クラスタ305に顔画像を追加する。追加する顔画像は選択クラスタ305に含まれる顔画像以外の登録顔画像であり、選択クラスタ305内の登録顔特徴量と選択クラスタ305に含まれる画像以外の登録顔特徴量のコサイン類似度で追加する画像を決定する。本実施形態では、選択クラスタ305内の3つ以上の登録顔特徴量とのコサイン類似度が閾値TH3以上の関係にある登録顔特徴量を持つ登録顔画像を選択クラスタ305に追加する。本実施形態における閾値TH3は0.5とする。具体的な説明は図5を用いて後述する。画像決定部205によって画像を追加された選択クラスタ305は検索結果306として出力I/F106を介してモニタ10に出力される。
<画像決定部205の説明>
画像決定部205の処理内容を、図5を用いて具体的に説明する。510は登録顔特徴量303を特徴空間に配置した図である。点線で囲われた範囲に含まれるデータ群305は選択部204で選択したクラスタであり、選択クラスタ305は顔画像305a、305b、305c、305d、305e、305fを含む。501、502、503、504、505、506は選択クラスタ305以外の顔画像である。選択クラスタ305内の画像の特徴量同士の組み合わせは必ずいずれかでコサイン類似度が閾値TH1(0.8)以上になっており、選択クラスタ305内の画像とそれ以外の画像の特徴量のコサイン類似度が閾値TH1(0.8)以上になる組み合わせは存在しない。図12に登録顔画像302の顔特徴量間のコサイン類似度の値を示す。
画像決定部205では、取得したクラスタに対して、複数のデータから追加するデータ(顔画像)を決定する。すなわち、選択クラスタ305に、選択クラスタ305以外に含まれる顔画像を追加するか否かを決定する処理を行う。具体的には選択クラスタ305内の所定数以上(例えば3つ以上)の顔画像の特徴量とのコサイン類似度が(第2の)閾値TH3(0.5)以上の関係にある特徴量を持つ顔画像を選択クラスタ305に追加することを決定する。例えば顔画像501は顔画像305c、305d、305e、305fの4つの画像の特徴量とコサイン類似度が閾値TH3(0.5)以上であるため、顔画像501は選択クラスタ305に追加される。同様に、顔画像502、503も選択クラスタ305に追加されるが、残りの顔画像504、505、506は、選択クラスタ305内の3つ以上の画像の特徴量とコサイン類似度が閾値TH3(0.5)以上ではないため、選択クラスタ305に追加されない。
図14は登録顔画像302に対応する人物の表である。図14によれば、画像決定部205によって人物Aの顔画像を一つのクラスタにまとめることができている。従来の階層的クラスタリングによるクラスタだけでは今回の結果は得られない。例えば、単連結法によって顔画像305a~f、501~503を一つのクラスタにまとめようとすると、閾値TH1を0.65まで下げる必要がある。しかし、この場合、顔画像503と顔画像504のコサイン類似度が0.65であるため、クラスタに人物Bである顔画像504も統合されてしまう。さらに、顔画像504と顔画像505のコサイン類似度が0.81であるため、クラスタは最終的に顔画像505も統合し、人物Aと人物Bを含んだクラスタが生成されてしまう。
本手法は、最初に同一人物であるクラスタを生成し、その中から所望のクラスタを選択した上で、その選択したクラスタに対して同一人物と思われる顔画像を追加することでクラスタ内のノイズを抑えながらデータ数を増やすことを可能としている。また、特徴量間の類似度が閾値TH1よりも低いが同一人物である顔画像は、複数の同一人物顔画像に対してやや低めの類似度をもつ性質があり、これを利用することで精度の高いデータの追加が可能となっている。本実施形態では低めの類似度を閾値TH3の0.5とし、結合する画像数の閾値を3とした。なお、結合する画像数の閾値は固定値に限るものではなく、例えばクラスタ内のデータ数に応じて変化させても良い。
以下、情報処理装置100が行う検索処理について、フローチャートに従って説明する。なお、本実施形態において記述されるフローチャートの各に対応する処理は、CPUを用いてソフトウェアで実現されてもよいし、電子回路などのハードウェアで実現されるようにしてもよい。
図4は、本実施形態に係る情報処理装置100が行う検索処理の一例を示したフローチャートである。以下の説明では、各工程(ステップ)について先頭にSを付けて表記することで、工程(ステップ)の表記を省略する。
まず、S401で、画像取得部201が、外部記憶装置104から登録顔画像(複数のデータ)を取得する。S402では、特徴抽出部202が、登録顔画像302の特徴量である登録顔特徴量303を取得する。なお、特徴量はデータの種類によって異なり、例えば、画像である場合は画像特徴、音声データである場合は音声特徴である。S403では、クラスタ取得部203が、登録顔特徴量303を用いて登録顔画像302のクラスタリングを行い、複数のクラスタを取得する。ここにおけるクラスタリングは、取得した登録顔画像302のうち類似度が第1の閾値TH1より大きい組み合わせを同一のクラスタに分類する。この処理によって少なくとも1つ以上のクラスタを取得する。
S404では、選択部204内の画像情報取得部204aが、ユーザーが入力したクエリ顔画像301を入力部109から入力I/F105を介して取得して、S405でクエリ顔特徴量304を取得する。ここでは、登録顔画像のうちユーザーによって選択されたクエリ顔画像(クエリデータ)を注目データとして取得する。
S406では、選択部204内の類似クラスタ算出部204bが、S403で取得したクラスタ毎の平均特徴量に基づいて、クエリ顔特徴量304とのコサイン類似度が閾値TH2以上のクラスタが存在するか否かを判定する。なお、ここでは、各クラスタの平均値を有するデータを取得してもよく、各クラスタの平均的または代表的なデータとして代表データと呼ぶ。閾値を超えるクラスタが存在する場合、S407に進む。クエリ顔特徴量304とのコサイン類似度が閾値TH2以上のクラスタが存在しない場合、追加する画像はないと判定し、S410に進む。
S407では、選択部204が、クラスタの平均特徴量とクエリ顔特徴量304とのコサイン類似度が最大のクラスタを選択する。
S408では、S407で選択した選択クラスタ305内の3つ以上の画像の特徴量とのコサイン類似度が閾値TH3(第2の閾値)以上になる特徴量を持つ顔画像が存在するか否かを判定する。選択クラスタ305内の3つ以上の画像の特徴量とのコサイン類似度が閾値TH3以上になる特徴量を持つ顔画像が存在する場合、S409に進む。選択クラスタ305内の3つ以上の画像の特徴量とのコサイン類似度が閾値TH3以上の特徴量を持つ顔画像が存在しない場合、追加する画像はないと判定し、S410に進む。S409では、選択クラスタ305内の3つ以上の画像の特徴量とのコサイン類似度が閾値TH3以上になる特徴量を持つ顔画像を選択クラスタ305に追加する画像として決定する。
S410では、S408もしくはS409で取得したクラスタの顔画像を検索の結果として表示する。S406で、クラスタの平均特徴量とクエリ顔特徴量のコサイン類似度が閾値TH2以上になるクラスタが存在しなかった場合、S410では「検索結果なし」という結果を表示する。
以上のように、本実施形態の情報処理装置によると、検索結果の画像数を増やしつつ、検索結果のノイズを抑えることが可能になる。
(実施形態2)
本実施形態では、実施形態1に対してより多くの画像を取得する方法について記載する。
実施形態1の画像決定部205では選択クラスタ305に対して選択クラスタ305以外の画像を追加したが、本実施形態では選択クラスタ305に対して選択クラスタ305以外のクラスタを追加する。クラスタ取得部203における閾値TH1が高い値(例えば0.8)に設定されている場合、生成されるクラスタ内の顔画像は全て同一人物である可能性が高い。そのため、選択クラスタ305に追加するデータはクラスタ状であってもよい。その際、選択クラスタ305以外の残クラスタ内のいずれかの顔画像の特徴量が、選択クラスタ305内の3つ以上の顔画像の特徴量と閾値TH3以上のコサイン類似度の関係にある場合、その残クラスタを選択クラスタ305に追加する。この方法によると、残クラスタ内の画像のいずれかで選択クラスタ305に顔画像を追加する条件を満たせば、該当する残クラスタの全ての顔画像を選択クラスタ305に追加できるため、より多くの画像をクラスタに追加することができる。
なお、クラスタ間の連結の方法は今回の手法に限定するものではない。例えば残クラスタの所定数の顔画像の特徴量が、選択クラスタ305内の複数の顔画像の特徴量と閾値TH3以上のコサイン類似度を持つ場合にその残クラスタを選択クラスタ305に追加してもよい。また、残クラスタの平均特徴量が選択クラスタ305内の3つ以上の顔画像の特徴量と閾値TH3以上のコサイン類似度を持つ場合にその残クラスタを選択クラスタ305に追加するなどしてもよい。
(実施形態3)
本実施形態では、クラスタの選択工程において、ユーザーが指定した画像を含むクラスタを選択する方法について記載する。本実施形態は例えば、複数のカメラ内の人物の移動経路を追跡する画像検索ないし追尾システムなどに有効となる。ユーザーは、撮像画像から、検索対象または追尾対象とする人物の画像(クエリデータ)を、表示装置等のUIを介して選択する。選択された人物画像を選択人物画像704と呼ぶ。
図6は、本実施形態に係る情報処理システムのハードウェア構成の一例を示す図である。ここでは実施形態1のハードウェア構成との差分のみ言及する。通信I/F601は、インターネットなどのネットワーク602に接続する。撮像装置603は、監視カメラなどの映像の撮像装置であり、ネットワーク602を介して情報処理装置100に接続されている。システムバス108は、101~106および601の各ユニットを通信可能に接続する伝送路である。
図7は、本実施形態における情報処理システムの機能構成例を示すブロック図である。情報処理装置100は、実施形態1と同様の機能構成を有する。撮像装置603は、機能構成として、撮像部700、画像抽出部701を有する。撮像部700は、レンズ等の光学系とCMOS等の撮像センサから成り、画像を撮像する。画像抽出部701は、撮像画像から特定物体(ここでは人物)の部分画像を抽出する。なお、これらの構成は情報処理装置100が有していてもよい。また、撮像装置603が、特徴抽出部202といった機能を有していてもよい。本実施形態における情報処理システムは、情報処理装置100を用いて、撮像装置603から取得される画像内で、ユーザーが指定した人物の検索を行う。
図8は本実施形態に係る情報処理装置が行う情報処理のデータフローの一例を示すブロック図である。なお、本実施形態は外部記憶装置104内に記録された撮像装置603の撮影画像から検索したい人物画像をクエリとして画像を検索する情報処理装置について言及する。
撮像装置603はネットワーク602と通信I/F601を介して撮影画像を画像抽出部701に入力する。ここでは、撮像装置603は、特定のエリアを撮像した時系列画像(映像)をリアルタイムに情報処理装置に出力できるものとする。
画像抽出部701は撮影画像内に写っている人物部分を抽出する。抽出した人物部分画像702を外部記憶装置104に記録する。人物部分の切り出しはCNNを用いて人物を矩形で検出し、検出部分を抽出する方法をとる。なお、部分画像は矩形に限らず多角形、円上でも構わない。また、人物の検出はCNNに限定しなくてもよく、例えばHOG特徴量でSVM(Support Vector Machine)といった機械学習アルゴリズムを利用した検出方法などでもよい。また、テンプレートマッチングを使って人物のテンプレートと一致度が高い部分領域を抽出してもよい。情報処理装置100における画像取得部201は撮像装置603によって抽出された人物部分画像703を取得する。特徴抽出部202は人物部分画像702の特徴量である人物特徴量703を算出する。特徴量の算出手法は実施形態1と同様の手法を用いる。クラスタ取得部203は人物特徴量を階層的クラスタリング手法でクラスタリングを実施する。本実施形態においては実施形態1と同様の手法を用いる。
選択部705は、画像情報取得部705aと選択部705bを持ち、クラスタ取得部203で生成されたクラスタから特定のクラスタを1つ選択する。画像情報取得部705aは入力部109から入力I/F105を介して、外部記憶装置104に記録されている人物部分画像702からユーザーが指定した検索したい人物画像である選択人物画像704(クエリデータ)を取得する。選択部705bは、クラスタ取得部203で取得したクラスタの中から、選択人物画像704(クエリデータ)に対応する人物の画像を含むクラスタを選択する。
画像決定部205は、選択部705で選択された選択クラスタ706に、撮像画像のうち所定の条件を満たす人物画像を追加する。所定の条件は、画像の追加方法は実施形態1と同様、(第2の)閾値TH3を用いた方法とする。画像決定部205によって画像を追加されたクラスタの画像は検索結果707として出力I/F106を介してモニタ10に出力される。
図9は、本実施形態に係る情報処理装置100が行う検索処理の一例を示したフローチャートである。まず、S801で、画像抽出部701で取得した人物部分画像702を、外部記憶装置104から画像取得部201によって取得する。
S802では、特徴抽出部202によって人物部分画像702の特徴量である人物特徴量703を取得する。S803では、クラスタ取得部203によって人物特徴量703のクラスタリングを行い、複数のクラスタを取得する。S804では、選択部705内の画像情報取得部705aが、外部記憶装置104からユーザーが選択した人物画像である選択人物画像704を、入力部109から入力I/F105を介して取得する。
S805では、選択部705内の選択部705bが、S804で取得した選択人物画像704と同じ画像を含むクラスタを選択する。
S806では、S805で選択した選択クラスタ706内の3つ以上(所定の数)の画像の特徴量とのコサイン類似度が閾値TH3以上の特徴量を持つ顔画像が、撮像装置から取得した人物画像の中に存在するか否かを判定する。条件を満たす画像が存在する場合、S807に進む。選択クラスタ706内の3つ以上の画像の特徴量とのコサイン類似度が閾値TH3以上の特徴量を持つ顔画像が存在しない場合、S808に進む。
S807では、選択クラスタ706内の3つ以上の画像の特徴量とのコサイン類似度が閾値TH3以上の特徴量を持つ顔画像を選択クラスタ706に追加する。S808では、S806もしくはS807で取得したクラスタを検索結果として表示する。
以上のように、本実施形態の情報処理装置によると、ユーザーが指定した画像を含むクラスタを選択する方法においても、検索結果の画像数を増やしつつ、検索結果のノイズを抑えることが可能になる。
(実施形態4)
本実施形態では、WEB画像検索サイトで取得したWEB上の画像から所望のオブジェクトの画像を抽出する方法について記載する。
図10は、本実施形態に係る画像抽出システムのハードウェア構成の一例を示す図である。実施形態3からの構成の変化はネットワーク602が撮像装置603と接続していない部分のみである。
図10は本実施形態に係る画像処置装置が行う情報処理のデータフローの一例を示すブロック図である。図11は、情報処理装置100の機能構成例を説明するブロック図である。検索結果取得部1001は、検索対象となる物体について所定のクエリ(例えば文字)を用いてデータベースから検索した検索結果(複数のデータ)を取得する。例えば、WEB上の画像検索サイトの検索結果をネットワーク602から通信I/F601を介して取得する。なお、検索キーワードは取得したい画像のオブジェクト名であり、例えばハスキー犬の画像を取得したい場合、検索キーワードを「ハスキー犬」として検索サイトで検索をする。取得した検索結果には、検索にヒットした画像の順位情報を含む。
オブジェクト抽出部1002は、検索結果取得部1001で取得した検索結果から、検索にヒットした画像を取得し、画像内に写ったオブジェクトを抽出する。例えば「ハスキー犬」の検索結果の場合、ヒットした画像のハスキー犬の画像部分を抽出する。オブジェクト部分の切出しはCNNを用いてオブジェクトを矩形で検出し、検出部分を抽出する方法をとる。なお、抽出する部分画像の形は矩形に限らず多角形、円上でも構わない。また、人物の検出はCNNに限定しなくてもよく、例えばHOG特徴量でSVM(Support Vector Machine)といった機械学習アルゴリズムを利用した検出方法などでもよい。なお、画像の切り出しは「ハスキー犬」などに特化せずに、一般物体認識モデルによる物体全般を検出して切り出してもよい。抽出されたオブジェクト画像1003に対しては、検索結果に基づいて、対応する検索順位1005を紐づける。オブジェクト画像1003と検索順位1005を紐づけたデータは外部記憶装置104に記録する。ここで、検索順位1005が対応づけられたオブジェクト画像1003をオブジェクト情報1006と呼ぶ。
画像取得部201は、外部記憶装置104からオブジェクト画像1003を取得する。
特徴抽出部202はオブジェクト画像1003の特徴量であるオブジェクト特徴量1007を算出する。特徴量の算出手法は実施形態1と同様の手法を用いる。クラスタ取得部203はオブジェクト特徴量を階層的クラスタリング手法でクラスタリングを実施する。本実施形態においては実施形態1と同様の手法を用いる。
選択部1008は画像情報取得部1008aと高順位クラスタ選択部1008bを持ち、クラスタ取得部203で生成されたクラスタから特定のクラスタを選択する。画像情報取得部1008aは外部記憶装置104に記録されているオブジェクト画像1003に紐づいた検索順位1005を取得する。高順位クラスタ選択部1008bは、検索順位1005を用いて、クラスタ取得部203で取得したクラスタの中から、クラスタを選択する。本実施形態におけるクラスタ選択方法は、クラスタ内の画像の検索順位の逆数を足し合わせた値が最も大きいクラスタを選択する方法をとる。例えばクラスタAが1位、3位、5位の3画像を含んでおり、クラスタBが3位、5位、7位、9位の4画像を含んでいる場合、検索順位の逆数を足し合わせた値はクラスタAが1.53であり、クラスタBは0.79になるため、値の大きいクラスタAを選択する。これは検索順位が上位の画像ほど検索キーワードのオブジェクトを含んでいる確率が高いことを利用した方法である。クラスタの選択方法は検索順位を利用していれば今回の方法には拘らない。例えば検索順位だけでなく、各画像のコサイン類似度の値を参考にして選択するクラスタを決定しても構わない。
画像決定部205は選択部1008で選択された選択クラスタ1009にオブジェクト画像を追加する。画像の追加方法は実施形態1と同様、閾値TH3を用いた方法とする。画像決定部205によって画像を追加された選択クラスタ1009の画像は抽出結果1010として出力I/F106を介してモニタ10に出力される。
図11は、本実施形態に係る情報処理装置100が行う画像抽出処理の一例を示したフローチャートである。
まず、S1101で、ユーザーによって指定されたクエリとの関連度の高さを示す検索結果における順位情報を対応付けたオブジェクト画像を外部記憶装置104から画像取得部201によって取得する。S1102では、特徴抽出部202によってオブジェクト画像の特徴量であるオブジェクト特徴量1007を取得する。S1103では、クラスタ取得部203によってオブジェクト特徴量1007のクラスタリングを行い、複数のクラスタを取得する。S1104では、選択部1008内の画像情報取得部1008aが、外部記憶装置104から検索順位を取得する。S1105では、選択部1008内の類似クラスタ算出部1008bが、S1103で取得した複数のクラスタからS1104で取得した検索順位を用いて特定のクラスタを選択する。S1106では、S1105で選択した選択クラスタ1009内の3つ以上の画像の特徴量とのコサイン類似度が閾値TH3以上の特徴量をもう画像が存在する場合、S1107に進む。選択クラスタ1009内の3つ以上の画像の特徴量とのコサイン類似度が閾値TH3以上の特徴量を持つ画像が存在しない場合、S1108に進む。S1107では、選択クラスタ1009内の3つ以上の画像の特徴量とのコサイン類似度が閾値TH3以上の特徴量を持つ画像を選択クラスタ1009に追加する。S1108では、S1106もしくはS1107で取得したクラスタの画像を抽出結果として表示する。
以上のように、本実施形態の情報処理装置によると、WEB画像検索サイトで取得したWEB上の画像から所望のオブジェクトの画像を抽出する方法においても、抽出結果の画像数を増やしつつ、抽出結果のノイズを抑えることが可能になる。この画像抽出システムは、例えば深層学習といった機械学習システムの学習データの収集などに利用することができる。すなわち、このようにデータを追加したクラスタを用いて所定の解析を実行する学習モデルを学習させてもよい。所定の解析とは、例えば、顔認証処理や物体追尾処理である。本実施形態のようにデータを追加されたクラスタは、ノイズが少ないがデータは多くなるので、学習モデルの精度を向上させうる。
なお、上記全ての実施形態は画像に関する事例で説明をしているが、本特許の効果は画像に限るものではないため、本特許の請求範囲は画像に限定するものではない。
本発明は、以下の処理を実行することによっても実現される。即ち、上述した実施形態の機能を実現するソフトウェア(プログラム)を、データ通信用のネットワーク又は各種記憶媒体を介してシステム或いは装置に供給する。そして、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)がプログラムを読み出して実行する処理である。また、そのプログラムをコンピュータが読み取り可能な記録媒体に記録して提供してもよい。
100 情報処理装置
201 画像取得部
202 特徴抽出部
203 クラスタ取得部
204 選択部
205 画像決定部

Claims (14)

JP2021028715A2021-02-252021-02-25情報処理装置、情報処理方法及びプログラムActiveJP7654421B2 (ja)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
JP2021028715AJP7654421B2 (ja)2021-02-252021-02-25情報処理装置、情報処理方法及びプログラム

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
JP2021028715AJP7654421B2 (ja)2021-02-252021-02-25情報処理装置、情報処理方法及びプログラム

Publications (2)

Publication NumberPublication Date
JP2022129865A JP2022129865A (ja)2022-09-06
JP7654421B2true JP7654421B2 (ja)2025-04-01

Family

ID=83150742

Family Applications (1)

Application NumberTitlePriority DateFiling Date
JP2021028715AActiveJP7654421B2 (ja)2021-02-252021-02-25情報処理装置、情報処理方法及びプログラム

Country Status (1)

CountryLink
JP (1)JP7654421B2 (ja)

Families Citing this family (1)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP7598581B1 (ja)*2023-10-052024-12-12株式会社マーケットヴィジョン情報処理システム

Citations (2)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP2010507139A (ja)2006-10-112010-03-04ヒューレット−パッカード デベロップメント カンパニー エル.ピー.顔に基づく画像クラスタリング
WO2019008961A1 (ja)2017-07-072019-01-10日本電気株式会社情報処理装置、情報処理方法、およびプログラム

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP7057324B2 (ja)*2019-07-102022-04-19Kddi株式会社認識装置、プログラム及び構築装置

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP2010507139A (ja)2006-10-112010-03-04ヒューレット−パッカード デベロップメント カンパニー エル.ピー.顔に基づく画像クラスタリング
WO2019008961A1 (ja)2017-07-072019-01-10日本電気株式会社情報処理装置、情報処理方法、およびプログラム

Also Published As

Publication numberPublication date
JP2022129865A (ja)2022-09-06

Similar Documents

PublicationPublication DateTitle
JP7130425B2 (ja)情報処理装置、情報処理方法及びプログラム
US11386284B2 (en)System and method for improving speed of similarity based searches
US10949702B2 (en)System and a method for semantic level image retrieval
CN105027162B (zh)图像解析装置、图像解析系统、图像解析方法
JP5106271B2 (ja)画像処理装置、画像処理方法、及びコンピュータプログラム
EP4224339A1 (en)Intelligent systems and methods for visual search queries
CN105100894A (zh)面部自动标注方法及系统
US20120287304A1 (en)Image recognition system
CN106663196A (zh)视频中的计算机显著人物识别
EP3324307B1 (en)Retrieval device, retrieval method, and computer-readable medium
JP2014093058A (ja)画像管理装置、画像管理方法、プログラム及び集積回路
JP2022043631A (ja)情報処理装置、情報処理方法及びプログラム
WO2019244276A1 (ja)検索システム、検索方法、及びプログラム
Wang et al.Baseline results for violence detection in still images
JP7654421B2 (ja)情報処理装置、情報処理方法及びプログラム
JP2016076115A (ja)情報処理装置、情報処理方法及びプログラム
JP2019020820A (ja)映像認識システム
JP5538781B2 (ja)画像検索装置及び画像検索方法
EP3751424B1 (en)Search system, search method, and program
JP7540500B2 (ja)グループ特定装置、グループ特定方法、及びプログラム
JP2016018421A (ja)画像分類装置、ナンバープレート読取装置、ナンバープレート読取システムおよび画像分類方法
Pang et al.Fall event detection with global and temporal local information in real-world videos
EP4027308A2 (en)Information processing apparatus, output method, and information processing program
JP2014072620A (ja)画像処理プログラム、画像処理方法、画像処理装置、及び撮像装置
Dhara et al.A survey on visual saliency detection approaches and attention models

Legal Events

DateCodeTitleDescription
RD01Notification of change of attorney

Free format text:JAPANESE INTERMEDIATE CODE: A7421

Effective date:20231213

A621Written request for application examination

Free format text:JAPANESE INTERMEDIATE CODE: A621

Effective date:20240221

A977Report on retrieval

Free format text:JAPANESE INTERMEDIATE CODE: A971007

Effective date:20241106

A131Notification of reasons for refusal

Free format text:JAPANESE INTERMEDIATE CODE: A131

Effective date:20241119

A521Request for written amendment filed

Free format text:JAPANESE INTERMEDIATE CODE: A523

Effective date:20250110

TRDDDecision of grant or rejection written
A01Written decision to grant a patent or to grant a registration (utility model)

Free format text:JAPANESE INTERMEDIATE CODE: A01

Effective date:20250218

A61First payment of annual fees (during grant procedure)

Free format text:JAPANESE INTERMEDIATE CODE: A61

Effective date:20250319

R150Certificate of patent or registration of utility model

Ref document number:7654421

Country of ref document:JP

Free format text:JAPANESE INTERMEDIATE CODE: R150


[8]ページ先頭

©2009-2025 Movatter.jp