JP2007208745A

Movatterモバイル変換

Info

Publication number: JP2007208745A
Application number: JP2006026324A
Authority: JP
Inventors: Kiyousuke Tokoro; 協助所
Original assignee: Victor Company of Japan Ltd
Current assignee: Victor Company of Japan Ltd
Priority date: 2006-02-02
Filing date: 2006-02-02
Publication date: 2007-08-16

Abstract

【課題】監視カメラにより撮像された監視映像の中から所望の監視対象のみの高さを表示する。
【解決手段】操作者が監視対象の上端にポインタを移動しマウスボタンを押し、次いでこの位置とマウスボタンを押したままポインタを移動して刻々変わる時点でのポインタ位置を対角線とするボックスを表示し、監視対象の下端にポインタを移動してマウスボタンを離すと、ボックスの高さを計算し、計算した高さ（身長）を示す数字をスケールとして監視対象のボックスの隣に表示する。また、数字を表示する代わりに、身長ゲージを表示する。
【選択図】図１０

Description

本発明は、監視カメラにより撮像された人物の身長などの監視対象の高さを表示する監視装置及び監視方法に関する。

例えば、防犯目的で設置された監視カメラ装置の利用において、撮像された人物の身体的特徴には、顔貌認識、服装の色、身長、行動パターンなどがある。これらの特徴抽出や認識の方法も、各種自動認識手段や、テレビジョンモニタ画面やプリントアウトなどを人間が目視するなど様々である。ところで、身体的特徴のうち、身長については、撮像された映像だけからは、その判断が困難である。そこで、補助的手段として、監視カメラで撮影されている視野の中に、人物の身長くらい、例えば１７５cmくらいの観葉植物を置き、それと被写体人物を比べることで、被写体人物の身長を監視映像の目視で類推するための補助とすることがある。また、観葉植物の代わりに、壁面に、一定の高さと幅を帯状の模様を塗装することもあり、必要な場合、それを基準に、被写体人物の身長を、人間が目視で類推する。企業のビルの場合、帯状の模様の場合、企業のロゴを帯状にアレンジし、壁面の模様として違和感を感じさせない工夫がなされる場合もある。さらにまた、コンビニエンスストアや商店などでは、特定の商品を陳列する棚の高さと人物の比較で、被写体人物の身長を類推できる場合がある。しかし、これらの方法は、いずれも映像を見る人間の目視によるもので、しかも、比較対象となる模様や物体と、身長を推定したい被写体人物が離れた場所にいる場合、その推定精度は低いものとなりやすい。

そこで、身長の測定を自動化する方法として、複数台のカメラを用いるもの（例えば下記の特許文献１参照）、特殊なカメラを用いるもの（例えば下記の特許文献２参照）などがある。複数台のカメラを用いる方法としては、同時に２つの映像を撮影することにより得られるステレオ画像による物体の計測方法があり、これについては特許文献１に記載されている。この例では、ステレオ画像を構成する第１及び第２の画像信号から、それぞれエッジ画像信号を抽出し、そこから、物体の互いに対応する点が一致するまでシフト量を求め、このシフト量に基づいて物体撮像位置から前記物体までの距離を演算により求め、その距離での被写体の、画像の１画素あたりの長さを演算し、最終的に物体の高さを知る。また、特殊なカメラを用いるものとしては、赤外線や超音波、あるいは電磁波などを物体に照射して、アクティブソナーレーダーと同じ原理で距離を測定するものが知られている。

さて、従来、室内の人物の距離を測定できる監視カメラ装置としては、例えば下記の特許文献３に記載された監視カメラ装置があった。これは、室内の人物の距離を、１台の普通の監視カメラで測ろうとするものである。また、映像に目盛り（スケール）を映し込む装置としては、被写体距離に基づいた撮影倍率から、被写体像の大きさを推定するための基準スケールをフィルムに映し込む下記の特許文献４に記載されたものがある。カメラ内部の測距機能と、映像に目盛り（スケール）を映しこむ機能を組み合わせれば、監視カメラからは、被写体の距離に応じた目盛りが映し込まれた映像が時々刻々と出力させるものも可能となる。

特許文献３に記載された従来の監視カメラ装置の人物と監視カメラとの水平距離の算出方法を図１９に示す。図１９において、１１１は監視カメラのカメラレンズ、１１２は監視カメラの撮影面、１１３はカメラによって撮影される人物である。ｆはカメラレンズ１１１の焦点距離、Ｈはカメラレンズ１１２の光軸中心までの高さ、θは水平線に対するカメラのチルト角、αはカメラレンズ１１２の垂直画角の１／２の角度である。人１１３はカメラレンズ１１１の光軸中心から水平距離でＬjの位置にいるものとし、その位置を（ｉ、ｊ）とすると、撮影面１１２上での垂直方向の位置は、ｊ・ｖとなる。ただし、ｖ＝（垂直撮像サイズ）／（垂直最大画素数）。
ここで、
ｄ／ｐ＝ｖ／ｆ
ｊｄ／ｐ＝tanδj
ここで、ｊは−ｎ、…、０、…、＋ｎの整数。ｎは垂直最大画素数の１／２である。これらより
ｊ（ｖ／ｆ）＝tanδ
Ｌj＝Ｈ／tan（θ＋δj ）
上の２つの式より、監視カメラから被写体の距離までは、
Ｌj＝Ｈ／tan（θ＋ｊ・ｖ／ｆ）
と求められる。
設置条件を限定し、この算出式を簡単にする試みとしては下記の特許文献５に記載された技術がある。距離が分かれば、映った画像の大きさ（撮像時）の被写体の視野角から、更に身長も推定できる。
特開平９−１４５３６２号公報（要約書）特開平７−９５６２５号公報（要約書）特開２０００−１０２０００号公報（要約書）特開平６−１９４７３３号公報（要約書）特開２００２−９９０２７号公報（要約書）

しかしながら、特許文献４に示すように被写体像の大きさを推定するための基準スケールをフィルムに映し込む方法では、監視カメラにより撮像された監視映像の中から所望の監視対象のみの高さを表示することができないという問題点がある。また、被写体距離に基づいた撮影倍率から、被写体像の大きさを推定するための基準スケールを算出するために、撮影時に、画面内に設定された複数の焦点検出エリアの焦点検出結果の中からいずれかの焦点検出エリアを選択し、その焦点検出エリアの焦点結果に基づいて被写体距離を決める。そのため、ビデオレコーダに録画済の再生映像から、被写体への距離を推定するためには、ビデオレコーダの映像の他に、その録画映像の撮像時の焦点結果も保持し、参照できるようにしておかねばならない。

また、特許文献３では、特許文献５に示すように、演算量を軽減させるために、光軸と水平との角度が画角の１／２になるように下方に向けて配置することが前提となっている。また、特許文献３に記載されるように、設置工事の際には、監視カメラの正確な高さＨとチルト角θを把握する必要もある。監視映像全体の視野に、監視したい対象が入っているかどうかを、目視で合わせることが多く、チルト角については、把握されない場合が多い。

そこで、本発明は上記の問題点に鑑み、監視カメラにより撮像された監視映像の中から所望の監視対象のみの高さを表示することができる監視装置及び監視方法を提供することを目的とする。
また、本発明は上記の問題点に鑑み、簡単な方法で、監視カメラにより撮像された監視映像の中から所望の監視対象のみの高さを表示することができる監視装置及び監視方法を提供することを目的とする。

本発明は上記目的を達成するために、監視カメラの撮像画像における所望の監視対象の上下方向の原寸法を算出し、この原寸法の数値情報を前記撮像画像と共に出力する監視装置であって、
前記撮像画像における前記所望の監視対象の上下各位置を指定するポインティング手段（２２）と、
前記監視カメラの地上からの設置高情報と前記ポインティング手段で指定された上下各位置とに基づき前記監視対象の上下方向の原寸法を算出する原寸法算出手段（３）と、
前記ポインティング手段で指定された上下各位置に対応した大きさのスケール画像を前記原寸法算出手段で算出された原寸法の数値情報と共に生成するスケール画像生成手段（３）と、
前記生成されたスケール画像と前記原寸法の数値情報とを前記撮像画像に合成して出力する合成出力手段（３）とを、
備えたことを特徴とする。

また、本発明は上記目的を達成するために、監視カメラの撮像画像における所望の監視対象の上下方向の原寸法を算出し、この原寸法の数値情報を前記撮像画像と共に出力する監視装置であって、
前記撮像画像内の前記監視カメラからの距離の異なる複数箇所それぞれにおける特定のスケールの上下各位置を遠近法の消失点に基づき決定するスケール位置決定手段（３）と、
前記撮像画像における前記所望の監視対象の上下各位置を指定するポインティング手段（２２）と、
前記スケール位置決定手段で決定された前記複数箇所それぞれにおける前記スケールの上下各位置と前記ポインティング手段で指定された上下各位置とに基づき前記監視対象の上下方向の原寸法を算出する原寸法算出手段（３）と、
前記ポインティング手段で指定された上下各位置に対応した大きさのスケール画像を前記原寸法算出手段で算出された原寸法の数値情報と共に生成するスケール画像生成手段（３）と、
前記生成されたスケール画像と前記原寸法の数値情報とを前記撮像画像に合成して出力する合成出力手段（３）とを、
備えたことを特徴とする。

また、本発明は上記目的を達成するために、監視カメラの撮像画像における所望の監視対象の上下方向の原寸法を算出し、この原寸法の数値情報を前記撮像画像と共に出力する監視方法であって、
前記撮像画像における前記所望の監視対象の上下各位置をポインティングデバイスによって指定するポインティングステップ（Ｓ３）と、
前記監視カメラの地上からの設置高情報と前記ポインティングステップにおいて指定された上下各位置とに基づき前記監視対象の上下方向の原寸法を算出する原寸法算出ステップ（Ｓ４）と、
前記ポインティングステップにおいて指定された上下各位置に対応した大きさのスケール画像を前記原寸法算出ステップにおいて算出された原寸法の数値情報と共に生成するスケール画像生成ステップ（Ｓ４）と、
前記生成されたスケール画像と前記原寸法の数値情報とを前記撮像画像に合成して出力する合成出力ステップ（Ｓ５）とを、
有したことを特徴とする。

また、本発明は上記目的を達成するために、監視カメラの撮像画像における所望の監視対象の上下方向の原寸法を算出し、この原寸法の数値情報を前記撮像画像と共に出力する監視方法であって、
前記撮像画像内の前記監視カメラからの距離の異なる複数箇所それぞれにおける特定のスケールの上下各位置を遠近法の消失点に基づき決定するスケール位置決定ステップ（Ｓ１１〜Ｓ１３）と、
前記撮像画像における前記所望の監視対象の上下各位置をポインティングデバイスによって指定するポインティングステップ（Ｓ１４）と、
前記スケール位置決定ステップにおいて決定された前記複数箇所それぞれにおける前記スケールの上下各位置と前記ポインティングステップにおいて指定された上下各位置とに基づき前記監視対象の上下方向の原寸法を算出する原寸法算出ステップ（Ｓ１５、Ｓ１６）と、
前記ポインティングステップにおいて指定された上下各位置に対応した大きさのスケール画像を前記原寸法算出ステップにおいて算出された原寸法の数値情報と共に生成するスケール画像生成ステップ（Ｓ４）と、
前記生成されたスケール画像と前記原寸法の数値情報とを前記撮像画像に合成して出力する合成出力ステップ（Ｓ５）とを、
有したことを特徴とする。

本発明によれば、ポインティング手段により指定された上下位置に基づいて監視対象の高さを表示するので、監視カメラにより撮像された監視映像の中から所望の監視対象のみの高さを表示することができる。また、監視画面上の各位置の上下方向のスケールを遠近法の消失点に基づいてあらかじめ算出するので、簡単な方法で、監視カメラにより撮像された監視映像の中から所望の監視対象のみの高さを表示することができる。すなわち、ポインタを、画面上の被測定対象物の位置に移動させると、被写体の実際の寸法を表す目盛りがスケールとなるが、これは、操作員の指示に従った位置にのみ表示される。撮影された映像に映る人物のうちの、容貌や服装、身長などの身体的特徴を具体的に把握したいと要求される人物にのみ適用される。同時に１つの画面に映っている他の、特に注目を要しない人物については、身長やその人物の位置などの情報は表示されることがないため、その余分な情報に視界を妨げられることはなくなる。

以下、図面を参照して本発明の実施の形態について説明する。
＜第１の実施の形態＞
図１は本発明に係る監視装置を適用した映像監視システムの一実施の形態を示すブロック図である。

図１に示す例では、監視カメラ１ａ〜１ｄで監視対象を撮影してモニタディスプレイ２ａ、２ｂ（やハードコピー装置２１）で表示することにより、警備員は監視カメラ１ａ〜１ｄで撮影された映像をモニタディスプレイ２ａ、２ｂで監視する。３は付加機能を実現する装置であり、複数の付加機能が必要な場合、複数の装置で構成されることも多い。例えば付加機能３は、監視カメラが複数台ある場合には、マトリックススイッチャ（複数の映像のうち、任意の映像のみを選択する装置）や画面分割ユニット（１画面を分割し、そこに複数の監視カメラの映像を同時に表示させる装置）で構成される。また、監視員が常駐できないような場合や、監視映像を記録として残したい場合は、付加機能３にビデオテープレコーダ３１やディスクレコーダ３２も用いる。操作卓２２は付加機能３の制御（例えば複数のうちのどの映像を選ぶかの指示や、画面分割の状態の切り替え、レコーダの録画、再生、停止、早送りや巻き戻しなど）や、監視カメラ１ａ〜１ｄの遠隔制御（向きの制御やフォーカシング）のための、ユーザインタフェースである。操作卓２２の例を図２に示す。

次に、監視カメラ１ａ〜１ｄの出力からの監視映像から、任意の被写体の上下方向の原寸法（被写体が直立している人物の場合、身長）を算出する方法を説明する。通常の操作において、警備員が監視映像に着目したい人物を見つけた場合、監視カメラがＰＴＺ（PAN（パン）…左右、TILT（チルト）…上下、ZOOM（ズーム）…拡大の略）制御可能なカメラ（以下、「ＰＴＺカメラ」と記載；例を図３に示す）であれば、その人物が監視画面に大きく映るよう操作卓２２からＰＴＺ制御を行う。この操作は、自動化される場合も多い。ＰＴＺカメラの多くは、外部からの信号入力をトリガとして、あらかじめ設定された方向とズームを合わせる機能を持つ。万引防止センサや、自動販売機やパチンコ店の遊戯機器の内部もしくは近傍に設置されたセンサ（例えば機器のこじ開けセンサ）、あるいは窓の防犯センサなどから、異常を知らせる信号がある場合、その信号をＰＴＺカメラに入力し、それをトリガとして、センサの位置に応じた視野にカメラが自動的に追従する。

図４に示すように固定点Ｐ（地上高ｈ）に設置されたカメラ１があるとき、人物Ａ−Ａ’が、カメラ１から地上におろした垂線と地表の交点Ｐ’からどれくらいの距離ａを歩行しているかは、カメラの設置角や視野角などから∠ＡＰＰ’の角度αが分かれば、次式（１）で計算できる
ａ＝ｈ・tanα …（１）
また、人物の頭頂部とカメラを結ぶ線と、カメラから下ろした垂線のなす∠Ａ’ＰＰ’の角度βが分かれば、人物の身長ｘも次式（２）で計算できる。
ｂ＝ｈ・tanβ
ｈ：ｂ＝ｘ：ｂ−ａ（∵△Ｐ’ＰＢ∽Ａ’ＡＢ）
∴ｘ＝ｈ・（ｂ−ａ）／ｂ
＝ｈ・（tanβ−tanα）／tanβ …（２）

多くの場合、カメラの高さｈは固定で、設置時に決められる。角度α、βはＰＴＺカメラの制御状態で決まるので、それを把握すればよい。また、ＰＴＺ制御が不能なカメラ（以下、「固定カメラ」と記載）では、角度α、βは設置時に決まる。なお、角度α、βは、撮像板のサイズやレンズの視野（焦点距離）から算出可能である。特許文献３にそれが説明されているので、ここでは説明を省略する。

本発明を実施する際に必要なカメラ１の構成のうち、ＰＴＺカメラの構成を図５に示す。撮像部１１はカメラとしての撮像機能であり、映像信号１８を出力する。ＰＴＺ制御機構１２は外部からの制御信号１５の指示に応じて、撮像部１１の向きや、撮像部１１のレンズのズームの状態を制御する。これが、ＰＴＺカメラとしての最低限の構成要素である。身長を知るには、（２）式の例では、角度α、βと高さｈを把握しなければならない。これらは、ＰＴＺカメラそのものが設置された高さと傾き、そして、その内部で、撮像部１１がどのような角度に制御され、その視野がどのようにズーミングされているかから把握できるので、それらの情報、すなわち、ＰＴＺ制御の状態とカメラ１の設置高の付加情報１６を映像信号１８に重畳して出力する。

付加情報１６を映像信号１８に重畳する方法としては、例えばアナログテレビジョンの文字多重放送のように、映像信号１８のモニタディスプレイには表示されない垂直帰線期間に付加情報１６を重畳する方法。あるいは、映像信号１８がＪＰＥＧ方式のようなデジタル情報の場合、その規格に許容される拡張領域やコメント領域などに付加情報１６を載せる方法もある。付加情報１６が重畳された映像信号１９は、ビデオテープレコーダ３１やディスクレコーダ３２（図１）に録画保存することもでき、その再生出力から付加情報１６を取り出すことができれば、角度α、βとカメラ１の設置された高さｈを、すなわち、任意の被写体の高さを知るためのゲージの表示に必要な情報が得られる。

また、伝送路がＴＣＰ／ＩＰのようなプロトコルによるものの場合、意図的に映像そのものに情報を重畳させるのではなく、付加情報１６と映像信号１８を、論理的に全く異なるコネクションを張って送受信することも可能である。
さらにまた、付加情報１６を映像信号１８に重畳せず、映像信号１８のみがビデオテープレコーダ３１又はディスクレコーダ３２（図１）に録画保存される場合には、その映像情報の個々の時点と、付加情報１６の個々の時点付けを行う手段が必要である。例えば、付加情報には、タイムスタンプも合わせ、何らかの記録手段に、カメラ１ａ〜１ｄに対応付けたファイル（file-1a〜file-1d…）に保持しておく。カメラ１ｃのある時点の付加情報１６は、file-1cのその時点に対応するタイムスタンプを持つレコードを参照すればよい。

ここまで、被写体の高さを知るために、ＰＴＺカメラを用い、（２）式のような三角関数を用いる方法を例に挙げ説明してきた。固定カメラの場合には、第２の実施の形態に記載の映像のパースペクティブに基づいた方法における定数ｐとｙ₀を重畳してもよい。固定カメラの場合、ＰＴＺ制御信号１５ならびにＰＴＺ制御機構１２は存在しないので、代わりに定数ｐとｙ₀を保持するメモリをＰＴＺ制御機構１２の位置に持ってもよい。

映像信号１８への付加情報の重畳をカメラに内蔵する例を説明してきているが、図６に示すように、既に設置済みのＰＴＺカメラ１を利用する場合には、付加情報１６の重畳は外部機構１０で行うことになる。この図の例では、ＰＴＺカメラへ入力するＰＴＺ制御信号１５をトラップし、それを基にＰＴＺ機構の状態を推定した結果を外部機構１０内部のＰＴＺ状態保持部１３に保持する。その保持されている状態を付加情報１６として映像信号１８に重畳する。なお、三角関数を用いる方法やパースペクティブに基づいた方法、あるいは、ここに記載しない他の方法による情報が混在する場合には、先に説明した付加情報１６や、あるいは定数ｐとｙ₀などの情報の他に、情報の記載形式を識別するためのフォーマット識別子も併せて重畳してもよい。

また、図４は便宜的に地面（床面）を水平に描いている。屋内環境では、床面が水平な場合が多いが、屋外の監視では、山の斜面や坂道など、地面が水平とは限らない。しかし、（２）式は、ほぼそのまま成り立つ。これについて、図７を用いて説明する。地面が傾きθで傾いている場合、地表と垂直をなすような線分Ｐ−Ｐ’（長さｈ）を考えれば、Ｐ’−Ａ間の距離ａについては図４と同様に計算できる。ｈとｘの関係は（２）式の通り。△ＰＰ”Ｐ’∽△ＡＡ’Ａ”なので、Ａ地点の人物の身長ｘ’は、
ｘ’＝ｈ’・（tanβ−tanα）／tanβ
となる。

カメラ１の設置高（図４のｈ、図７のｈ’）は、ほとんどの場合、設置工事のときに決まり、既知であるものとする。例えば、エレベータ三脚、クレーン雲台などによりカメラの設置高が変わることは、監視映像の場合、ほとんどない。もし、カメラの設置高を変える場合は、電子的な遠隔制御に頼ることが多く、その高さは、その遠隔制御のための情報から推定できる。

また、角度βは、図８において、カメラのチルト角をθとすれば、
β＝θ＋δ
＝θ＋tan^-1（ｐ／ｆ）
となり、チルト角θと、撮像板５上での見かけ上の大きさｐ、レンズ４の焦点距離ｆから求められる。角度αについても同様にして求められる。

さて、監視対象となるのが、多くの人が集まる公共の場である場合、監視映像には、図９に示すように大勢の人物が映ることになる。身体的特徴として、身長に着目すると、本当に知りたいのは、そこに映る全員の身長ではなく、特定の人物１００の身長である。そこで、本発明では、監視画像を表示する際に、操作者が図１０（ａ）に示すように監視対象の上端にポインタ２６を移動してマウスボタンを押し、次いで図１０（ｂ）に示すようにマウスボタンを押したままポインタ２６を移動して刻々変わる時点でのポインタ位置と図１０（ａ）に示す位置を対角線とするボックスを表示する。そして、操作者が図１０（ｃ）に示すように監視対象の下端にポインタ２６を移動してマウスボタンを離すと、ボックスの高さを計算し、図１０（ｄ）に示すように、計算した高さ（身長）を示す数字（１６５ｃｍ）をスケールとして監視対象のボックスの隣に表示する。また、数字を表示する代わりに、図１１に示すように身長ゲージを表示するようにしてもよい。身長の算出は、既に述べた方法や、他の既知の方法を用いてもよい。また、図１２は目盛りの下端がポインタ２６を兼ねている例を示す。

図１３は、ステップ４において図１０（ｄ）に示すスケールや図１１に示す身長ゲージが表示されるまでの、一連の流れである。この処理は、図１の操作卓２２に設けられているボタンやスイッチ類により起動される。また、この処理がパーソナルコンピュータ上で実施される場合は、キーボードやマウスの操作により起動されてもよい。この例では、ステップＳ１で、カメラの設置高とＰＴＺ状態を把握しているが、既に述べたとおり、第２の実施の形態（後述）に記載の映像のパースペクティブに基づいた方法における定数ｐとｙ₀の把握でもよい。ステップＳ２は、操作卓２２のジョイスティックや、マウスなどのポインティングデバイスでの入力を促すプロンプティングで、例えば図１０のように、対象物の上端と下端を把握できるような入力を促す。上端と下端は、オペレータの手作業でポインティングデバイスから指示してもよいが、動体検出やオブジェクト認識など、既知の手段で個々の人物を映像から切り出すことが可能な場合、その人物のどこか一部を選択するだけで、その全身を把握するような、ユーザインタフェースも構築可能になる。

ステップＳ３で入力操作が有りと判断されると、ステップＳ４へ進む。ステップＳ４では、図４に示した距離ａが分かれば、その位置に存在する被写体を映す撮像板の個々の画素について、それぞれの実際の大きさを推定できるので、それに基づきステップＳ５において身長を示す数字やゲージを表示させる。図４の演算内容が少し異なるが、基本的には同じフローで処理される。なお、これらは、図１の付加機能３で処理されるが、パーソナルコンピュータやワークステーションなどで構成されてもよく、監視映像そのものと、身長ゲージやカーソルの表示方法については、既知の一般的な方法を使えばよい。

また、以上の説明は、被写体が人物であり、その身長を把握することを例に挙げて説明してきたが、これは、平らな床面に置かれた任意の物体の高さと読み替えることができる。また、撮影された画像の画素が正方形である場合は、被写体を構成する個々の画素の高さ方向の実際の寸法と、横方向の実際の寸法は一致するので、高さだけでなく幅の把握と表示も可能である。撮影された画像の画素が正方形でない場合には、その画素の縦横比を単純に勘案し、幅を求めることができる。

＜第２の実施の形態＞
図１４は監視映像を模式的に描いた例を示し、図１４を用いて本発明の第２の実施の形態の原理を説明する。この図において、遠い箇所と近い箇所の２箇所に全く同じ身長の人物が映っているものとする。２箇所の人物と床面の接点、すなわち、足が床についている点の画面上の垂直座標をｙ_aとｙ_b、画面上での見かけ上のこの人物の身長をｈ_a、ｈ_b（例えば単位はピクセル、あるいは走査線本数）、この画面のパース（パースペクティブ＝透視法：遠近法）の消失点（必ずしも撮影された監視映像の画面上にあるとは限らない）の垂直座標をｙ₀とすると、
ｈ_a：ｈ_b＝（ｙ_a−ｙ₀）：（ｙ_b−ｙ₀） …（３）
と、線形に比例する。この人物が、任意の点に移動したとき、監視映像画面上で、足を付けている点の垂直座標をｙとしたとき、見かけ上の画面上での身長ｈは、
ｈ＝ｐ・（ｙ−ｙ₀） …（４）
ここで、ｐとｙ₀は定数。

ここで、カメラの位置（設置高）や向き（パンやチルトの角度）、ズームの状態（レンズの焦点距離）が、通常の運用状態では変化せず固定的に利用される監視カメラを、特に「固定カメラ」と呼ぶ。すなわち、固定カメラが撮影する映像のパースは、設置時に決められる。パースが固定されれば、定数ｐとｙ₀も一意に決まる。この２つの定数ｐ、ｙ₀を、固定カメラのパースを決め終えた時点で求める作業を、ここでは「キャリブレーション」と呼ぶことにする。

キャリブレーション、すなわち、定数ｐとｙ₀を求める手順を説明する。図１５（ａ）に示すように、まず、任意の地点に、一定の長さの棒２４ａを床面に垂直に設置し、図１４における監視映像画面の座標ｙ_aと見かけ上の長さｈ_aを測る。次に図１５（ｂ）に示すように、棒の設置箇所を変え（棒２４ｂ）、図１４における監視映像画面で座標ｙ_bと見かけ上の長さｈ_bを測る。
（３）、（４）の関係から、定数ｐとｙ₀は、
ｐ＝（ｈ_a−ｈ_b）／（ｙ_a−ｙ_b） …（５）
ｙ₀＝ｙ_a−ｈ_a／ｐ
＝ｙ_b−ｈ_b／ｐ
と求められる。

この例では、２地点での測定を基準にして定数ｐとｙ₀を把握する方法を記したが、例えば測定点を増やし、直線回帰分析のような統計的手法により、定数ｐとｙ₀を把握してもよい。上述したキャリブレーションを、監視画像を目視しながらの手作業で行うことは原理的には可能であるが、現実的でない。そこで、監視画像を表示する際に、監視画像に合わせて、図１５に示すようにマウスやジョイスティックなどのポインティングデバイスの操作により任意の点を指すポインタ２５を表示し、そのポインタ位置から監視画像上のｙ_a、ｙ_bと、見かけ上の長さｈ_a、ｈ_bを測るような、インタラクティビティをもったソフトウェア処理を介することが考えられる。

図１６、図１７を参照してこのキャリブレーションのソフトウェア処理について説明する。このソフトウェア処理は呼び出されると、ステップＳ１１において監視画面と共に、図１５に示すように、ｙ_aの入力を促すプロンプティングメッセージと共にポインタ２５を表示させ、次いでステップＳ１２では図１７に詳しく示すキャリブレーション入力サブルーチンを呼び出す。このサブルーチンでは、オペレータ（設置工事者や保守作業員など）が任意の地点に一定の長さの棒２４ａを床面に垂直に設置し（ステップＳ２１）、監視映像画面の座標ｙ_aを測るために、ポインティングデバイスの操作によりポインタ２５を棒２４ａの下端（ポインタ２５ａ）に移動し、ポインティングデバイスのボタン（例えばマウスボタン）を操作する（ステップＳ２２）。これにより、キャリブレーションのソフトウェア処理は座標ｙ＝ｙ_aを把握できる（ステップＳ２３）。

このソフトウェアは、次に、棒２４ａの上端（ポインタ２５ｂ）にポインタ２５を移動しボタン操作を行う旨のメッセージをプロンプティングした後に（ステップＳ２４）、オペレータからの操作待ち状態に入る（ステップＳ２５）。オペレータがポインタ２５を棒２４ａの上端（ポインタ２５ｂ）に移動し、ボタン操作を行うと、キャリブレーションのソフトウェア処理は、入力された座標ｙ’と、既に把握している座標ｙ＝ｙ_aから長さｈ＝ｙ’−ｙ（ｈ_a＝ｙ’−ｙ_a）を把握できる（ステップＳ２７、図１６のステップＳ１３）。次に棒２４ｂについて同様の処理を繰り返し（図１６のステップＳ１４、Ｓ１５）、棒２４ｂの座標ｙ_bから長さｈ_bをキャリブレーションのソフトウェア処理に把握させる（ステップＳ１６）。キャリブレーションのソフトウェア処理は、（５）式や直線回帰分析などにより定数ｐとｙ₀を求めることができる（ステップＳ１７）。（３）式の演算をソフトウェア手段により実現する例について説明する。ソフトウェア手段は、例えば図１８に模式的に示したような監視画像と監視画像上にポインタ２６を表示する際に、ポインタ２６の垂直座標を（３）式にあてはめ、画面上の見かけ上の長さｈで身長ゲージを表示する。これは、キャリブレーションの際に、実際の高さが１６５cmの棒を使っていれば、それと同じ長さに相当するスケールとなる。

上記処理により、図１８に示すように、オペレータは、異なる距離に位置する複数の人物から、身長を推定したい人物の足元にポインタ２６、２６’、２６”を合わせることにより、身長の推定の補助となるスケールを画面表示として得ることができる。図１６に示したゲージが、実際の高さ１６５cmでキャリブレートされているとき、監視カメラ１の光軸が水平に近い状態に設置されていれば、例えば１７５cmのゲージは、（５）式の結果を１７０／１６５倍することで、近似的に表すことができる。これにより、図１４に示すように、身長を推定したい人物の足元にポインタ２６を合わせることで、スケールを表示することもできる。

ここで、監視カメラ１の光軸が床面に垂直に近くなるほど、近似精度は劣化し、実用的ではなくなる。そこで、上記説明では、図１５の棒２４ａの下端（ポインタ２５ａ）と上端（ポインタ２５ｂ）、そして棒２４ｂの下端（ポインタ２６ａ）と上端（ポインタ２６ｂ）のみの画面上の座標を測ったが、さらに、棒２４ａの中間位置（ポインタ２５ｃ、２５ｄ）を測ることとする。例えば床面からの高さを、上端のポインタ２５ｂが１７５cm、中間位置のポインタ２５ｃが１７０cm、ポインタ２５ｄが１６５cmとする。まず、同様に、ポインタ２５ａ、２５ｂとポインタ２６ａ、２６ｂから、高さ１７５cmでの定数ｐと消失点の垂直座標ｙ₀が求められる。

次に、高さ１７０cmでの定数p'を求めるために、ポインタ２５ｃの垂直座標を測る。方法は、上記説明と同様の手段を用いることができ、ポインタ２５ｃの座標ｙ_a'と長さｈ_a'を把握できる。既に、消失点ｙ₀は分かっており、そこでの被写体は、見かけ上、大きさが０となるため、（５）式を変形し、高さ１７０cmでの定数p'は、
p’＝（ｈ_a'−０）／（ｙ_a'−ｙ₀）
＝ｈ_a'／（ｙ_a'−ｙ₀）
となり、ポインタ２５ｃに相当する棒２４ｂの位置の測定は不要である。ポインタ２５ｄについても同様である。このようにして、監視カメラ１の光軸が床面に対し、垂直に近くなっても、図１８に示すように実用的なゲージを表示できる。

上記説明では、オペレータの操作により、画面上に、監視カメラ１が捉えた任意の人物の身長を推定する手段を記したが、オペレータの介在なく、あるいは、画面上への表示をすることなく、これらの処理を機械化することも可能である。例えば、パターン抽出／認識手段により、映像の中の人物を機械的に抽出し、その人物の身長を把握したい場合にも、本発明のアルゴリズムを応用できる。例えばキャリブレーションの段階では、それに用いる固定長の棒を、特徴的な色彩、等間隔の赤と白で塗りわけた棒をオペレータが設置する。撮像された映像上に、赤と白が縦に連なった状態を、パターン抽出／認識手段が機械的に検出でき、その座標データを把握できれば、前記した一連のポインタ表示とボタン操作の一連の手順を省くことができる。オペレータは機械からの指示に従い、キャリブレーションのための棒状の基準を、任意の少なくとも２点に移動しながら設置すればよい。もちろん、この場合、少なくとも２本のキャリブレーション用の棒を用意し、同時にその座標と高さを把握することも可能であろう。また、身長の把握時には、例えば、前後のフレーム（映画のコマに相当）を比較することで、動きのある領域と、その画面上の座標を知ることができる。その座標を基に、動きのある物体の高さを類推することが可能である。もちろん、高さを測ろうとする被写体の自動検出手段は、その他のパターン認識手法に頼ってもよい。

符号の説明

１、１ａ〜１ｄ監視カメラ
２ａ、２ｂモニタディスプレイ
３付加機能
４レンズ
５撮像板
１０外部機構
１１撮像部
１２ＰＴＺ制御機構
１３ＰＴＺ状態保持部
１５ＰＴＺ制御信号
１６付加情報
１８、１９映像信号
２１ハードコピー装置
２２操作卓
２４ａ、２４ｂ棒
２５、２５ａ〜２５ｄ、２６、２６’、２６”、２６ａ、２６ｂポインタ
３１ビデオテープレコーダ
３２ディスクレコーダ
１００特定の人物

Claims

監視カメラの撮像画像における所望の監視対象の上下方向の原寸法を算出し、この原寸法の数値情報を前記撮像画像と共に出力する監視装置であって、
前記撮像画像における前記所望の監視対象の上下各位置を指定するポインティング手段と、
前記監視カメラの地上からの設置高情報と前記ポインティング手段で指定された上下各位置とに基づき前記監視対象の上下方向の原寸法を算出する原寸法算出手段と、
前記ポインティング手段で指定された上下各位置に対応した大きさのスケール画像を前記原寸法算出手段で算出された原寸法の数値情報と共に生成するスケール画像生成手段と、
前記生成されたスケール画像と前記原寸法の数値情報とを前記撮像画像に合成して出力する合成出力手段とを、
備えた構成の監視装置。
監視カメラの撮像画像における所望の監視対象の上下方向の原寸法を算出し、この原寸法の数値情報を前記撮像画像と共に出力する監視装置であって、
前記撮像画像内の前記監視カメラからの距離の異なる複数箇所それぞれにおける特定のスケールの上下各位置を遠近法の消失点に基づき決定するスケール位置決定手段と、
前記撮像画像における前記所望の監視対象の上下各位置を指定するポインティング手段と、
前記スケール位置決定手段で決定された前記複数箇所それぞれにおける前記スケールの上下各位置と前記ポインティング手段で指定された上下各位置とに基づき前記監視対象の上下方向の原寸法を算出する原寸法算出手段と、
前記ポインティング手段で指定された上下各位置に対応した大きさのスケール画像を前記原寸法算出手段で算出された原寸法の数値情報と共に生成するスケール画像生成手段と、
前記生成されたスケール画像と前記原寸法の数値情報とを前記撮像画像に合成して出力する合成出力手段とを、
備えた構成の監視装置。
監視カメラの撮像画像における所望の監視対象の上下方向の原寸法を算出し、この原寸法の数値情報を前記撮像画像と共に出力する監視方法であって、
前記撮像画像における前記所望の監視対象の上下各位置をポインティングデバイスによって指定するポインティングステップと、
前記監視カメラの地上からの設置高情報と前記ポインティングステップにおいて指定された上下各位置とに基づき前記監視対象の上下方向の原寸法を算出する原寸法算出ステップと、
前記ポインティングステップにおいて指定された上下各位置に対応した大きさのスケール画像を前記原寸法算出ステップにおいて算出された原寸法の数値情報と共に生成するスケール画像生成ステップと、
前記生成されたスケール画像と前記原寸法の数値情報とを前記撮像画像に合成して出力する合成出力ステップとを、
有した監視方法。
監視カメラの撮像画像における所望の監視対象の上下方向の原寸法を算出し、この原寸法の数値情報を前記撮像画像と共に出力する監視方法であって、
前記撮像画像内の前記監視カメラからの距離の異なる複数箇所それぞれにおける特定のスケールの上下各位置を遠近法の消失点に基づき決定するスケール位置決定ステップと、
前記撮像画像における前記所望の監視対象の上下各位置をポインティングデバイスによって指定するポインティングステップと、
前記スケール位置決定ステップにおいて決定された前記複数箇所それぞれにおける前記スケールの上下各位置と前記ポインティングステップにおいて指定された上下各位置とに基づき前記監視対象の上下方向の原寸法を算出する原寸法算出ステップと、
前記ポインティングステップにおいて指定された上下各位置に対応した大きさのスケール画像を前記原寸法算出ステップにおいて算出された原寸法の数値情報と共に生成するスケール画像生成ステップと、
前記生成されたスケール画像と前記原寸法の数値情報とを前記撮像画像に合成して出力する合成出力ステップとを、
有した監視方法。