Movatterモバイル変換


[0]ホーム

URL:


JP2000322417A - Image filing apparatus and method, and storage medium - Google Patents

Image filing apparatus and method, and storage medium

Info

Publication number
JP2000322417A
JP2000322417AJP11126398AJP12639899AJP2000322417AJP 2000322417 AJP2000322417 AJP 2000322417AJP 11126398 AJP11126398 AJP 11126398AJP 12639899 AJP12639899 AJP 12639899AJP 2000322417 AJP2000322417 AJP 2000322417A
Authority
JP
Japan
Prior art keywords
image
character
storing
character code
image data
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Withdrawn
Application number
JP11126398A
Other languages
Japanese (ja)
Inventor
Tomotoshi Kanatsu
知俊 金津
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon IncfiledCriticalCanon Inc
Priority to JP11126398ApriorityCriticalpatent/JP2000322417A/en
Publication of JP2000322417ApublicationCriticalpatent/JP2000322417A/en
Withdrawnlegal-statusCriticalCurrent

Links

Landscapes

Abstract

Translated fromJapanese

(57)【要約】【課題】 文書画像をファイリングして所望とする文字
列で検索させたとき、その文字列が文書画像中のどの位
置の文字列画像に対応するかを明示する。【解決手段】 原稿画像を読み取り、その中のテキスト
領域中の文字画像を認識する。そして、読み取って得ら
れた原稿画像データ、認識して得られた文字コード、及
び、認識対象となった文字画像の位置情報を記憶する。
そして、検索時には、与えられた検索文字列に一致する
文字列を探し出し、その文字列を有する画像を表示す
る。且つ、表示する画像中の該当する文字列画像部分を
強調表示する。
(57) [Summary] [PROBLEMS] When a document image is filed and searched for a desired character string, it is specified which character string image in the document image corresponds to the character string. A document image is read, and a character image in a text area in the document image is recognized. Then, the document image data obtained by reading, the character code obtained by recognition, and the position information of the character image to be recognized are stored.
Then, at the time of searching, a character string that matches the given search character string is searched for, and an image having the character string is displayed. In addition, the corresponding character string image portion in the displayed image is highlighted.

Description

Translated fromJapanese
【発明の詳細な説明】DETAILED DESCRIPTION OF THE INVENTION

【0001】[0001]

【発明の属する技術分野】本発明は画像ファイリング装
置及び方法及び記憶媒体に関するものである。
The present invention relates to an image filing apparatus and method, and a storage medium.

【0002】[0002]

【従来の技術】紙の文書をスキャナで光学信号から電気
信号に変換する文書の電子化は、今日ではごく一般的に
行われている。特に、近年の文字認識技術の発展によ
り、文書を単なる画像データとしてではなく、その内容
までも計算機に可読な形でコード化することが可能にな
った。
2. Description of the Related Art Computerization of a document in which a paper document is converted from an optical signal into an electric signal by a scanner is very common today. In particular, with the development of character recognition technology in recent years, it has become possible to encode a document not only as image data but also its contents in a form readable by a computer.

【0003】その技術を応用すると、紙で与えられた文
書中から、ある特定の単語、文字列に関連する情報をピ
ックアップするために、これまで人手を介して入力して
いた作業が不要になると共に、与えられた文書内の全て
の文字コード列が検索対象として使用できるようにもな
る。
[0003] When the technology is applied, in order to pick up information related to a specific word or character string from a document given on paper, an operation that has been manually input in the past becomes unnecessary. At the same time, all character code strings in a given document can be used as search targets.

【0004】図5は、文書画像を入力して、その中に記
載された文字コード列を得る、いわゆる文字認識ソフト
ウェアの実行画面の例である。ディスプレイ上のマルチ
ウィンドウ表示を用い、左側に入力された文書画像のビ
ットマップ表示、右側に認識出力された、文書内の文字
コード列のテキスト表示がなされている。図例では更
に、テキスト表示の内容に対し、「レイアウト」という
文字列の検索が行なわれており、検出された部分が反転
で強調表示されていることを示している。この検出結果
から、文書中の所望の文字列を索引として取得すること
ができる。
FIG. 5 shows an example of a so-called character recognition software execution screen in which a document image is input to obtain a character code string described therein. Using a multi-window display on the display, a bitmap display of a document image input on the left side and a text display of a character code string in the document recognized and output on the right side are performed. In the example of the figure, furthermore, a search for a character string “layout” is performed on the contents of the text display, and the detected portion is highlighted and highlighted. From this detection result, a desired character string in the document can be obtained as an index.

【0005】しかし、現在の文字認識技術では、比較的
状態のよい印刷文書を対象にしてさえも100%の完全
な認識率を得るのは難しい。したがって、前記のテキス
ト表示部に表示された文字コード列は、元の文書の情報
を完全に正しく再現しているとは限らない。さらに、文
書には図、写真等、テキスト表示部には現れない情報が
含まれていることもある。よって、情報を正しく得るた
めには、図5の例では、テキスト表示ではなく、画像デ
ータ表示部から、検索結果の文字列に対応する部分を見
つけて情報を参照する必要がある。
However, with the current character recognition technology, it is difficult to obtain a perfect recognition rate of 100% even for a printed document having a relatively good condition. Therefore, the character code string displayed on the text display section does not always completely and accurately reproduce the information of the original document. Further, the document may include information that does not appear in the text display section, such as a figure or a photograph. Therefore, in order to obtain the information correctly, in the example of FIG. 5, it is necessary to find a part corresponding to the character string of the search result from the image data display unit and refer to the information instead of the text display.

【0006】[0006]

【発明が解決しようとする課題】前述の例では、テキス
ト表示部に示された検索の結果から、画像表示部の画像
データの対応づけは、オペレータが行わなければならな
い。特に、文書が多数の段組からなっていたり、複雑な
文字配置になっている場合、さらに、複数ページからな
る大量の文書から検索を行った場合など、テキスト表示
部の文字列に対応する部分を表示画像から目視で探索す
る手間は非常に大きかった。
In the above-described example, the operator must associate the image data in the image display unit with the search result shown in the text display unit. The part corresponding to the character string in the text display area, especially when the document is composed of many columns or has a complicated character arrangement, or when a search is performed from a large number of documents consisting of multiple pages. Was very time-consuming to search for from the displayed image.

【0007】本発明はかかる問題点に鑑みなされたもの
であり、文書画像をファイリングして所望とする文字列
で検索させたとき、その文字列が文書画像中のどの位置
の文字列画像に対応するかを明示することを可能ならし
める画像ファイリング装置及び方法及び記憶媒体を提供
しようとするものである。
The present invention has been made in view of such a problem. When a document image is filed and searched for a desired character string, the character string corresponds to a character string image at any position in the document image. It is an object of the present invention to provide an image filing apparatus, a method, and a storage medium, which make it possible to specify whether to do so.

【0008】[0008]

【課題を解決するための手段】この課題を解決するた
め、例えば本発明の画像ファイリング装置は以下の構成
を備える。すなわち、原稿画像を読み取り記憶保存する
画像ファイリング装置であって、読み取って得られた原
稿画像データ中のテキスト領域中の文字画像を認識する
文字認識手段と、認識して得られた文字コード及び認識
された文字画像の前記原稿画像データ中における位置情
報を、前記原稿画像データと関連づけて保存する保存手
段と、入力された文字コード列を検索文字コード列と
し、前記保存手段に保存された文字コード群の中から検
索する検索手段と、該検索手段によって一致する文字コ
ード列を含む画像を前記保存手段で保存された中から抽
出し、表示する画像表示手段と、該表示手段で表示され
る画像中の、検索された文字コード群のそれぞれの位置
情報に基づく領域を強調表示する強調表示手段とを備え
る。
In order to solve this problem, for example, an image filing apparatus according to the present invention has the following arrangement. That is, an image filing apparatus for reading and storing a document image, a character recognizing means for recognizing a character image in a text area in the read and obtained document image data, and a character code and a recognition device for recognizing the character image. Storage means for storing the position information of the input character image in the original image data in association with the original image data; and a character code stored in the storage means, wherein the input character code string is used as a search character code string. Search means for searching from a group, image display means for extracting and displaying an image containing a character code string matched by the search means from the storage means, and an image displayed by the display means And highlighting means for highlighting an area based on the position information of each of the searched character code groups.

【0009】[0009]

【発明の実施の形態】以下、添付図面に従って本発明に
かかる実施形態を詳細に説明する。
Embodiments of the present invention will be described below in detail with reference to the accompanying drawings.

【0010】図1は本発明の第一の実施例の構成を示す
ブロック図である。
FIG. 1 is a block diagram showing the configuration of the first embodiment of the present invention.

【0011】101は原稿を光電変換により画像データ
に変換する、スキャナ等の入力装置、102は画像デー
タ、およびオペレータ操作の表示インタフェースとなる
ディスプレイ装置、103はオペレータ操作の入力イン
タフェースであるキーボード、マウス等の入力装置、1
04は画像データやテキスト文字を紙に印刷する印刷装
置である。
Reference numeral 101 denotes an input device, such as a scanner, for converting a document into image data by photoelectric conversion, 102, a display device as a display interface for image data and operator operation, and 103, a keyboard and mouse as input interfaces for operator operation. Input devices such as 1
A printing device 04 prints image data and text characters on paper.

【0012】105は文書画像をテキスト領域、図領
域、表領域といった性質の異るブロックに分割する領域
分割部、106はテキスト領域部の文字を認識して文字
コード列とする文字認識部、107は文字コード列か
ら、オペレータの指示した検索文字列を検索する、文字
列検索部である。
Reference numeral 105 denotes an area dividing unit which divides a document image into blocks having different properties such as a text area, a figure area, and a table area; 106, a character recognition unit which recognizes characters in the text area to generate a character code string; Is a character string search unit for searching a character code string for a search character string specified by the operator.

【0013】108は105,106,107の動作を
制御しながら、102,103,104,105と入出
力を行い実施例全体を制御する中央制御装置(以下、C
PU)である。109メモリはCPU108が行う制御
プログラム、および取り扱われる画像や文字コードなど
を収める、RAM、ハードデイスク等の記憶装置であ
る。
Reference numeral 108 denotes a central control unit (hereinafter referred to as C) which controls the operations of the entire embodiment by inputting / outputting data to / from 102, 103, 104 and 105 while controlling the operations of 105, 106 and 107.
PU). The memory 109 is a storage device such as a RAM or a hard disk for storing a control program executed by the CPU 108 and images and character codes to be handled.

【0014】本発明の第1の実施例の動作を、図2のフ
ローチャートを用いて説明する。
The operation of the first embodiment of the present invention will be described with reference to the flowchart of FIG.

【0015】先ず、ステップS201にて、原稿文書
(紙)をスキャナ等を用いて画像データへと変換する。
手動、あるいはオートドキュメントフィーダなどを用い
て、複数枚を入力した場合は、枚数と同じ個別の画像デ
ータが生成され、それぞれに与えられた個別の画像ID
を割り当て、入力順にメモリ109に保存していく。
First, in step S201, an original document (paper) is converted into image data using a scanner or the like.
When a plurality of sheets are input manually or using an automatic document feeder, the same individual image data as the number of sheets is generated, and the individual image ID given to each of them is provided.
Are assigned and stored in the memory 109 in the order of input.

【0016】全ての原稿画像データの保存が終わると、
ステップS202に進んで、メモリ109に格納された
中の未処理の画像データを入力順に1つ選択する。次い
で、ステップS203に進み、選択された画像データに
対しテキスト領域、図領域、表領域といった性質の異る
ブロックに分割する。
When all original image data has been saved,
In step S202, one unprocessed image data stored in the memory 109 is selected in the order of input. Next, the process proceeds to step S203, where the selected image data is divided into blocks having different properties such as a text region, a drawing region, and a table region.

【0017】この処理の内容を図3を用いて説明する。
選択された画像データは、その領域識別処理を行って、
性質の異なる矩形領域(ブロック)に分割し、各ブロッ
クについてそのブロックがテキスト領域であるのか、図
形領域であるのかを判断する。判断する手法としては、
本実施形態の場合、領域の黒画素の密集度などを用いて
行ったが、勿論、これ以外の公知技術を用いてもよい。
The contents of this processing will be described with reference to FIG.
The selected image data is subjected to its area identification processing,
It is divided into rectangular areas (blocks) having different properties, and for each block, it is determined whether the block is a text area or a graphic area. As a method to judge,
In the case of the present embodiment, the determination is performed using the density of black pixels in the region, but of course, other known techniques may be used.

【0018】ステップS204では、こうして判別され
たブロックの中で、テキスト領域として判別されたブロ
ックのすべてに対し文字認識処理を行い、結果を文字コ
ード列としてメモリに保存する。文字認識処理そのもの
は公知のものを用いるものとするが、実施形態では、認
識対象の切り出そうとする文字イメージの原稿画像中の
どの位置にあるのかを示す位置情報及びその大ききなど
の情報が各文字に伴なわれて記憶していく。
In step S204, a character recognition process is performed on all of the blocks determined as text regions in the blocks determined in this manner, and the result is stored in a memory as a character code string. Although the character recognition processing itself uses a known process, in the embodiment, position information indicating the position in the document image of the character image to be cut out of the recognition target and information such as its size are shown. Is stored along with each character.

【0019】こうして得られた文字コード列のデータの
例を図4に示す。なお、図示の左端の「文字」は文字コ
ードに対応する文字が如何なるものであるのかを示して
いるだけであり、実際はそれ以外の文字コード、その文
字コードが存在する画像ID、そして座標位置とサイズ
情報が記憶されることになる。また、文字イメージの位
置情報はその文字の切り出し位置の左下位置を(x、
y)形式で保存し、その位置から垂直及び水平方向のド
ット数をサイズ情報として記憶するようにした。
FIG. 4 shows an example of the data of the character code string thus obtained. Note that the “character” at the left end of the figure merely indicates what the character corresponding to the character code is, and in fact, other character codes, an image ID in which the character code exists, and a coordinate position. Size information will be stored. Further, the position information of the character image indicates the lower left position of the cutout position of the character (x,
y) format, and the number of dots in the vertical and horizontal directions from that position is stored as size information.

【0020】図2に戻って、上記のようにして文字認識
処理を行うが、未処理の画像データがある場合はステッ
プS202に戻り、すべての画像を処理していく。
Returning to FIG. 2, the character recognition process is performed as described above. If there is unprocessed image data, the process returns to step S202 to process all images.

【0021】以上の結果、スキャナ101で全ての原稿
に対応する画像データが特有のIDで記憶管理されると
共に、各画像中のテキストブロックの認識結果である文
字コードが、どの画像のものであるかを示す情報(I
D)とその座標位置及び大きさと共に関連づけられて保
存されることになる。
As a result, the image data corresponding to all the originals is stored and managed by the scanner 101 with a unique ID, and the character code which is the recognition result of the text block in each image is that of the image. Information (I
D) and its coordinate position and size are stored in association with each other.

【0022】次いで、ステップS206に処理が進む
と、オペレータが、キーボードやマウス等を用いて検索
指示を行い、検索文字列を入力して検索処理を行わせる
と、ステップS207に進んで、その検索文字列に合致
する文字コード群を、メモリ109に保存されている文
字コード群の中から探し出す。
Next, when the process proceeds to step S206, the operator issues a search instruction using a keyboard, a mouse, or the like, inputs a search character string, and performs a search process. When the operator proceeds to step S207, the process proceeds to step S207. A character code group that matches the character string is searched for from the character code groups stored in the memory 109.

【0023】ステップS208では、文字コード列中の
検出された文字列と対応するIDを持つ画像を画像表示
装置に表示する。このとき、検索文字列と一致する文字
コードに付随する座標データ及びそのサイズ情報を得る
ことができるので、それらの情報に基づいて、表示され
た画像中の該当する文字画像領域の強調表示させる。
In step S208, an image having an ID corresponding to the detected character string in the character code string is displayed on the image display device. At this time, coordinate data and size information associated with the character code that matches the search character string can be obtained. Based on the information, the corresponding character image area in the displayed image is highlighted.

【0024】図6は、検索文字列として「レイアウト」
を設定して上記処理を行った例を示している。図示の如
く、検索処理を行ったとき、レイアウトなる文字画像部
分がハイライト表示され、その画像が検索条件に一致し
たこと、及び、どの位置の文字画像が一致したかが一目
瞭然とさせることができる。
FIG. 6 shows "layout" as a search character string.
Is set and the above processing is performed. As shown in the drawing, when a search process is performed, a character image portion of a layout is highlighted, and it is possible to make it clear at a glance that the image matches the search condition and which position of the character image matches. .

【0025】なお、強調表示には、反転表示に限るもの
ではなく、文字部分の背景がまわりの背景とは異なる色
にしたり、アンダーラインを施したりしても良い。
The highlighted display is not limited to the inverted display, and the background of the character portion may be different from the surrounding background or may be underlined.

【0026】また、検索文字列に一致する文字列が複数
の画像で検出された場合には、まず先頭の文字列に対応
する画像を表示する。そして、図示の操作ウインドウ6
00の上下のボタンをマウス等で操作することで、次の
画像、前の画像へと切り替えて表示する。画像の切り換
わりが行われたとき、その画像中の一致した文字画像を
強調表示するのは勿論である。
When a character string that matches the search character string is detected in a plurality of images, first, the image corresponding to the first character string is displayed. Then, the operation window 6 shown in FIG.
By operating the upper and lower buttons of 00 with a mouse or the like, the next image and the previous image are switched and displayed. When the image is switched, it is a matter of course that the matching character image in the image is highlighted.

【0027】こうして、更に別の文字列の検索を行うと
の指示があると、処理はステップS206に戻り、上記
処理を再度行う。また、検索終了の指示があると、本処
理を終える。
In this way, if there is an instruction to search for another character string, the process returns to step S206, and the above process is performed again. If there is an instruction to end the search, the process ends.

【0028】なお、図2のフローチャートは、一連の処
理をまとめてたものであり、実際は、ステップS201
〜S205と、ステップS206〜ステップS209は
それぞれ独立して起動できるものである。
Note that the flowchart of FIG. 2 summarizes a series of processes.
To S205 and steps S206 to S209 can be started independently.

【0029】以上説明したように本実施形態によれば、
操作者からすれば、文書画像をファイリングしていって
データベースを構築できると共に、あたかもキーボード
等から入力した文字列を検索文字列として検索させ、該
当する文字画像を有する文書画像を検索することが可能
となる。しかも、そのとき、文書画像中のどの位置の文
字列画像が検索に一致したかが一目瞭然とさせることも
可能になる。
As described above, according to the present embodiment,
From the operator's point of view, it is possible to construct a database by filing document images, and to search for a character string input from a keyboard or the like as a search character string, and to search for a document image having the corresponding character image. Becomes Moreover, at this time, it is possible to make it clear at a glance which character string image in the document image matches the search.

【0030】先に説明したように、従来は、文字認識し
て得られたテキストウインドウを別個に表示して、その
中で検索していたのに対し、本実施形態の処理にしたが
えば、テキストウインドウを表示するスペースも不要に
なり、表示スペースを有効利用することも可能になる。
As described above, conventionally, a text window obtained by character recognition is separately displayed and searched therein, but according to the processing of the present embodiment, Space for displaying the text window is not required, and the display space can be effectively used.

【0031】なお、上記実施形態では、紙の文書を画像
データ化して文字認識を行い、その文字コード列に対す
る検索を行って、結果を画像データ中の文字列強調とし
て、ディスプレイに表示したが、画像データを紙に印刷
できるプリンタ等の印刷装置を用い、検索結果の文字列
への強調修飾を含んだ画像データをプリントアウトして
もよい。
In the above-described embodiment, a paper document is converted into image data, character recognition is performed, a search is performed on the character code string, and the result is displayed on the display as character string emphasis in the image data. A printing device such as a printer capable of printing image data on paper may be used to print out the image data including the emphasis modification to the character string of the search result.

【0032】その場合、紙の文書中にある任意の検索文
字列に関連する情報を得るために、オペレータは元文書
と同じ形式で、かつ検索結果文字列が強調印刷された紙
の文書を得ることができ、それをチェックするだけで所
望の情報を容易に参照できるようになる。よって検索に
よる情報収集作業の効率が向上する。
In this case, in order to obtain information relating to an arbitrary search character string in the paper document, the operator obtains a paper document in the same format as the original document and in which the search result character string is emphasized and printed. The user can easily refer to desired information simply by checking it. Therefore, the efficiency of information collection work by search is improved.

【0033】また、本発明は、複数の機器(例えばホス
トコンピュータ、インタフェイス機器、リーダ、プリン
タなど)から構成されるシステムに適用しても、一つの
機器からなる装置に適用してもよい。また、ファイリン
グ装置により作成されたデータベースをネットワーク上
のサーバに設け、クライアント側から検索するシステム
に適用しても構わない。
The present invention may be applied to a system including a plurality of devices (for example, a host computer, an interface device, a reader, a printer, etc.), or may be applied to an apparatus including a single device. Further, a database created by the filing device may be provided in a server on a network and applied to a system for searching from a client side.

【0034】また、本発明の目的は、前述した実施形態
の機能を実現するソフトウェアのプログラムコードを記
録した記憶媒体(または記録媒体)を、システムあるい
は装置に供給し、そのシステムあるいは装置のコンピュ
ータ(またはCPUやMPU)が記憶媒体に格納されたプログ
ラムコードを読み出し実行することによっても、達成さ
れることは言うまでもない。この場合、記憶媒体から読
み出されたプログラムコード自体が前述した実施形態の
機能を実現することになり、そのプログラムコードを記
憶した記憶媒体は本発明を構成することになる。また、
コンピュータが読み出したプログラムコードを実行する
ことにより、前述した実施形態の機能が実現されるだけ
でなく、そのプログラムコードの指示に基づき、コンピ
ュータ上で稼働しているオペレーティングシステム(OS)
などが実際の処理の一部または全部を行い、その処理に
よって前述した実施形態の機能が実現される場合も含ま
れることは言うまでもない。
Further, an object of the present invention is to supply a storage medium (or a recording medium) storing a program code of software for realizing the functions of the above-described embodiments to a system or an apparatus, and to provide a computer (or a computer) of the system or the apparatus. It is needless to say that the present invention can also be achieved by a CPU or an MPU) reading and executing the program code stored in the storage medium. In this case, the program code itself read from the storage medium implements the functions of the above-described embodiment, and the storage medium storing the program code constitutes the present invention. Also,
When the computer executes the readout program code, not only the functions of the above-described embodiments are realized, but also the operating system (OS) running on the computer based on the instructions of the program code.
It is needless to say that a case in which the functions of the above-described embodiments are implemented by performing part or all of the actual processing.

【0035】さらに、記憶媒体から読み出されたプログ
ラムコードが、コンピュータに挿入された機能拡張カー
ドやコンピュータに接続された機能拡張ユニットに備わ
るメモリに書込まれた後、そのプログラムコードの指示
に基づき、その機能拡張カードや機能拡張ユニットに備
わるCPUなどが実際の処理の一部または全部を行い、そ
の処理によって前述した実施形態の機能が実現される場
合も含まれることは言うまでもない。
Further, after the program code read from the storage medium is written into a memory provided in a function expansion card inserted into the computer or a function expansion unit connected to the computer, the program code is read based on the instruction of the program code. Needless to say, the CPU included in the function expansion card or the function expansion unit performs part or all of the actual processing, and the processing realizes the functions of the above-described embodiments.

【0036】[0036]

【発明の効果】以上説明したように本発明によれば、文
書画像をファイリングして所望とする文字列で検索させ
たとき、その文字列が文書画像中のどの位置の文字列画
像に対応するかを明示することが可能になる。
As described above, according to the present invention, when a document image is filed and searched for a desired character string, the character string corresponds to a character string image at any position in the document image. Can be specified.

【図面の簡単な説明】[Brief description of the drawings]

【図1】実施形態の装置のブロック構成図である。FIG. 1 is a block diagram of an apparatus according to an embodiment.

【図2】実施形態の処理手順を示すフローチャートであ
る。
FIG. 2 is a flowchart illustrating a processing procedure according to the embodiment.

【図3】実施形態における領域分割の例を示す図であ
る。
FIG. 3 is a diagram illustrating an example of area division in the embodiment.

【図4】実施形態における文字認識結果の情報の構造を
示す図である。
FIG. 4 is a diagram illustrating a structure of information of a character recognition result in the embodiment.

【図5】従来の文字認識ソフトウェアを用いた文字列検
索の例を示す図である。
FIG. 5 is a diagram illustrating an example of a character string search using conventional character recognition software.

【図6】実施形態における文字列検索結果の一例を示す
図である。
FIG. 6 is a diagram illustrating an example of a character string search result according to the embodiment.

Claims (5)

Translated fromJapanese
【特許請求の範囲】[Claims]【請求項1】 原稿画像を読み取り記憶保存する画像フ
ァイリング装置であって、 読み取って得られた原稿画像データ中のテキスト領域中
の文字画像を認識する文字認識手段と、 認識して得られた文字コード及び認識された文字画像の
前記原稿画像データ中における位置情報を、前記原稿画
像データと関連づけて保存する保存手段と、 入力された文字コード列を検索文字コード列とし、前記
保存手段に保存された文字コード群の中から検索する検
索手段と、 該検索手段によって一致する文字コード列を含む画像を
前記保存手段で保存された中から抽出し、表示する画像
表示手段と、 該表示手段で表示される画像中の、検索された文字コー
ド群のそれぞれの位置情報に基づく領域を強調表示する
強調表示手段とを備えることを特徴とする画像ファイリ
ング装置。
1. An image filing apparatus for reading and storing a document image, a character recognizing means for recognizing a character image in a text area in the document image data obtained by reading, and a character obtained by recognizing the character image. A storage unit for storing the position information of the code and the recognized character image in the document image data in association with the document image data; and storing the input character code string as a search character code string and storing the character code string in the storage means. Searching means for searching from a group of character codes obtained, an image display means for extracting and displaying an image including a character code string matched by the searching means from the storage means, and displaying on the display means And highlighting means for highlighting an area based on the position information of each of the searched character code groups in the image to be searched. Airingu apparatus.
【請求項2】 前記保存手段で保存する位置情報には、
文字画像のサイズ情報が含まれることを特徴とする請求
項第1項に記載の画像ファイリング装置。
2. The location information stored by the storage means includes:
2. The image filing apparatus according to claim 1, wherein size information of the character image is included.
【請求項3】 前記強調表示手段は、文字画像の位置と
サイズ情報に基づいて、該当する文字画像を反転して表
示する手段であることを特徴とする請求項第2項に記載
の画像ファイリング装置。
3. The image filing apparatus according to claim 2, wherein said highlighting means is means for inverting and displaying a corresponding character image based on the position and size information of the character image. apparatus.
【請求項4】 原稿画像を読み取り記憶保存する画像フ
ァイリング方法であって、 読み取って得られた原稿画像データ中のテキスト領域中
の文字画像を認識する文字認識工程と、 認識して得られた文字コード及び認識された文字画像の
前記原稿画像データ中における位置情報を、前記原稿画
像データと関連づけて保存する保存工程と、 入力された文字コード列を検索文字コード列とし、前記
保存工程によって保存された文字コード群の中から検索
する検索工程と、 該検索工程によって一致する文字コード列を含む画像を
前記保存工程によって保存された中から抽出し、表示す
る画像表示工程と、 該画像表示工程によって表示される画像中の、検索され
た文字コード群のそれぞれの位置情報に基づく領域を強
調表示する強調表示工程とを備えることを特徴とする画
像ファイリング方法。
4. An image filing method for reading and storing an original image, comprising: a character recognizing step of recognizing a character image in a text area in the read original image data; and a character obtained by recognizing the character image. A storage step of storing the position information of the code and the recognized character image in the document image data in association with the document image data; and storing the input character code string as a search character code string, A retrieval step of retrieving from the group of character codes retrieved, an image display step of extracting and displaying an image including a character code string that matches in the retrieval step from among those stored in the storage step, and Highlighting step of highlighting an area based on the position information of each of the searched character code groups in the displayed image. Image filing wherein the.
【請求項5】 コンピュータが読み込み実行するプログ
ラムコードを格納する記憶媒体であって、 読み取って得られた原稿画像データ中のテキスト領域中
の文字画像を認識する文字認識手段と、 認識して得られた文字コード及び認識された文字画像の
前記原稿画像データ中における位置情報を、前記原稿画
像データと関連づけて保存する保存手段と、 入力された文字コード列を検索文字コード列とし、前記
保存手段に保存された文字コード群の中から検索する検
索手段と、 該検索手段によって一致する文字コード列を含む画像を
前記保存手段で保存された中から抽出し、表示する画像
表示手段と、 該表示手段で表示される画像中の、検索された文字コー
ド群のそれぞれの位置情報に基づく領域を強調表示する
強調表示手段として機能するプログラムコードを格納す
る記憶媒体。
5. A storage medium for storing a program code to be read and executed by a computer, comprising: character recognition means for recognizing a character image in a text area in original image data obtained by reading; Storage means for storing the character code and the position information of the recognized character image in the document image data in association with the document image data; and the input character code string as a search character code string, Search means for searching from among the stored character code groups; image display means for extracting and displaying an image containing a character code string matched by the search means from among the stored by the storage means; Functioning as highlighting means for highlighting an area based on the position information of each of the searched character code groups in the image displayed by. Storage medium storing gram code.
JP11126398A1999-05-061999-05-06 Image filing apparatus and method, and storage mediumWithdrawnJP2000322417A (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
JP11126398AJP2000322417A (en)1999-05-061999-05-06 Image filing apparatus and method, and storage medium

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
JP11126398AJP2000322417A (en)1999-05-061999-05-06 Image filing apparatus and method, and storage medium

Publications (1)

Publication NumberPublication Date
JP2000322417Atrue JP2000322417A (en)2000-11-24

Family

ID=14934174

Family Applications (1)

Application NumberTitlePriority DateFiling Date
JP11126398AWithdrawnJP2000322417A (en)1999-05-061999-05-06 Image filing apparatus and method, and storage medium

Country Status (1)

CountryLink
JP (1)JP2000322417A (en)

Cited By (10)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP2007058605A (en)*2005-08-242007-03-08Ricoh Co Ltd Document management system
WO2009005021A1 (en)2007-06-292009-01-08Canon Kabushiki KaishaImage processing apparatus, image processing method, and computer program
WO2009005019A1 (en)2007-06-292009-01-08Canon Kabushiki KaishaImage processing apparatus, image processing method, and computer program
EP2071493A2 (en)2007-12-122009-06-17Canon Kabushiki KaishaImage processing device, image processing method, and program and recording medium thereof
JP2010267174A (en)*2009-05-182010-11-25Nec Casio Mobile Communications LtdTerminal device and program
JP2010286882A (en)*2009-06-092010-12-24Mitsubishi Electric Corp PROGRAMMABLE DISPLAY, DOCUMENT DISPLAY METHOD, PROGRAM FOR EXECUTING THE METHOD, RECORDING MEDIUM CONTAINING THE SAME, KEYWORD POSITION INFORMATION CREATION METHOD, PROGRAM FOR EXECUTING THE METHOD, AND RECORDING MEDIUM CONTAINING THE SAME
KR101018310B1 (en)2008-02-192011-03-04캐논 가부시끼가이샤 Electronic document generating device, electronic document generating method, and storage medium
JP2019109704A (en)*2017-12-182019-07-04トッパン・フォームズ株式会社Document markup apparatus, document markup method, and program
JP2019211811A (en)*2018-05-312019-12-12富士ゼロックス株式会社Image processing apparatus and program
CN113435166A (en)*2021-06-092021-09-24深圳市世强元件网络有限公司Underlining method and system, computer device and readable storage medium

Cited By (20)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP2007058605A (en)*2005-08-242007-03-08Ricoh Co Ltd Document management system
RU2437152C2 (en)*2007-06-292011-12-20Кэнон Кабусики КайсяDevice to process images, method and computer programme to process images
EP2162859A4 (en)*2007-06-292010-07-28Canon Kk IMAGE PROCESSING APPARATUS, IMAGE PROCESSING METHOD, AND COMPUTER PROGRAM
US8532388B2 (en)2007-06-292013-09-10Canon Kabushiki KaishaImage processing apparatus, image processing method, and computer program
WO2009005021A1 (en)2007-06-292009-01-08Canon Kabushiki KaishaImage processing apparatus, image processing method, and computer program
EP2162839A4 (en)*2007-06-292010-07-28Canon KkImage processing apparatus, image processing method, and computer program
US8077971B2 (en)2007-06-292011-12-13Canon Kabushiki KaishaImage processing apparatus, image processing method, and computer program
US8503773B2 (en)2007-06-292013-08-06Canon Kabushiki KaishaGlyph selection and electronic document generation
KR101128602B1 (en)2007-06-292012-03-23캐논 가부시끼가이샤Image processing apparatus, image processing method, and computer-readable storage medium
WO2009005019A1 (en)2007-06-292009-01-08Canon Kabushiki KaishaImage processing apparatus, image processing method, and computer program
EP2400454A1 (en)2007-06-292011-12-28Canon Kabushiki KaishaImage processing apparatus, image processing method, and computer program
EP2071493A3 (en)*2007-12-122013-08-14Canon Kabushiki KaishaImage processing device, image processing method, and program and recording medium thereof
EP2071493A2 (en)2007-12-122009-06-17Canon Kabushiki KaishaImage processing device, image processing method, and program and recording medium thereof
KR101018310B1 (en)2008-02-192011-03-04캐논 가부시끼가이샤 Electronic document generating device, electronic document generating method, and storage medium
JP2010267174A (en)*2009-05-182010-11-25Nec Casio Mobile Communications LtdTerminal device and program
JP2010286882A (en)*2009-06-092010-12-24Mitsubishi Electric Corp PROGRAMMABLE DISPLAY, DOCUMENT DISPLAY METHOD, PROGRAM FOR EXECUTING THE METHOD, RECORDING MEDIUM CONTAINING THE SAME, KEYWORD POSITION INFORMATION CREATION METHOD, PROGRAM FOR EXECUTING THE METHOD, AND RECORDING MEDIUM CONTAINING THE SAME
JP2019109704A (en)*2017-12-182019-07-04トッパン・フォームズ株式会社Document markup apparatus, document markup method, and program
JP2019211811A (en)*2018-05-312019-12-12富士ゼロックス株式会社Image processing apparatus and program
CN113435166A (en)*2021-06-092021-09-24深圳市世强元件网络有限公司Underlining method and system, computer device and readable storage medium
CN113435166B (en)*2021-06-092024-03-19深圳市世强元件网络有限公司Underline method and system, computer device and readable storage medium

Similar Documents

PublicationPublication DateTitle
JP5042562B2 (en) Image processing apparatus, handwritten information recognition method, handwritten information recognition program
JP4785655B2 (en) Document processing apparatus and document processing method
JP3683925B2 (en) Electronic filing device
JP2008129793A (en) Document processing system, apparatus and method, and recording medium recording program
JP2015187846A (en)Document processing system and document processor
JP2000322417A (en) Image filing apparatus and method, and storage medium
JP2008108114A (en) Document processing apparatus and document processing method
JP2740335B2 (en) Table reader with automatic cell attribute determination function
US5854860A (en)Image filing apparatus having a character recognition function
JP4136282B2 (en) Image processing apparatus, image processing method, and storage medium
JP5089524B2 (en) Document processing apparatus, document processing system, document processing method, and document processing program
JPH05303619A (en)Electronic scrap book
JP2006221569A (en) Document processing system, document processing method, program, and storage medium
JP4143245B2 (en) Image processing method and apparatus, and storage medium
JPH07114610A (en)Input device and method for information processing system
JPH08161350A (en) Electronic filing method and apparatus
US12348691B2 (en)Determine whether OCR is to be performed for optimizing optical character recognition process
JP3424942B2 (en) Bilingual image forming device
JPH11187231A (en) Image retrieval apparatus and image retrieval method
JPH11203402A (en) Image processing apparatus and image processing method
JP2956743B2 (en) Centralized character recognition system and character recognition device
JP2993880B2 (en) Electronic file device
JPH1040238A (en) Document processing system and fixed document creation method applied to the system
JPH0678119A (en)Picture filing device and picture reading and processing device
JPH11306321A (en) Document management apparatus, document management method, and recording medium recording document management program

Legal Events

DateCodeTitleDescription
A300Withdrawal of application because of no request for examination

Free format text:JAPANESE INTERMEDIATE CODE: A300

Effective date:20060801


[8]ページ先頭

©2009-2025 Movatter.jp