





本発明は、画像処理装置、画像処理方法、及びプログラムに関する。 The present invention relates to an image processing device, an image processing method, and a program.
例えば、特許文献1には、画像データにおける、文字列が記載された箇所を複数特定する特定部と、特定された複数の箇所の夫々について、画像データにおける位置、および記載された文字のサイズを含むレイアウト情報を取得するレイアウト情報取得部と、複数の箇所の夫々について、他の箇所との位置関係および他の箇所とのサイズ関係に基づいて、画像データに含まれ得る所定の属性を有する文字列としての尤度を算出し、尤度に基づいて、所定の属性を有する文字列が記載された箇所を推定する推定部とを備えた情報処理装置が開示されている。 For example, Patent Literature 1 discloses a specification part that specifies a plurality of places where a character string is described in image data, and for each of the specified places, the position in the image data and the size of the described characters. a layout information acquisition unit that acquires layout information including characters having predetermined attributes that can be included in image data based on the positional relationship with other locations and the size relationship with other locations for each of a plurality of locations; An information processing device is disclosed that includes an estimation unit that calculates a likelihood as a string and estimates a location where a character string having a predetermined attribute is written based on the likelihood.
また、特許文献2には、原稿画像Ikから抽出されたページ情報に従って原稿画像Ikにファイル名を付与するファイル管理装置が開示されている。 Further, Japanese Patent Application Laid-Open No. 2002-200001 discloses a file management device that assigns a file name to a document image Ik according to page information extracted from the document image Ik.
また、特許文献3には、原稿を光学的に読み取って画像データを取得する画像読取部10と、取得された画像データにおいて複数の文字の集まりからなる文字ブロック及び当該文字ブロックに含まれる文字列を認識する文字列認識部102と、認識された各文字列について文字サイズ、行数、面積及び原稿における配置位置を特定する文字列外観特定部103と、特定された情報に基づいて原稿のタイプを判別する原稿タイプ判別部104と、認識された各文字列について原稿タイプ判別部104により判別された原稿タイプに応じた基準に準じた複数の評価項目で加重評価を行う文字列評価部105と、認識された文字列のうち文字列評価部105による評価点が高い文字列を画像データのファイル名候補として選出するファイル名候補選出部106とを備える原稿読取装置1が開示されている。 Further, Patent Document 3 describes an image reading unit 10 for optically reading a document to acquire image data, a character block formed of a group of characters in the acquired image data, and a character string included in the character block. a character string recognition unit 102 that recognizes the character string, a character string appearance identification unit 103 that identifies the character size, the number of lines, the area and the arrangement position in the document for each recognized character string, and the type of the document based on the identified information and a character string evaluation unit 105 for weighted evaluation of each recognized character string using a plurality of evaluation items according to the criteria corresponding to the document type determined by the document type determination unit 104. , and a file name candidate selection unit 106 that selects a character string having a high evaluation score by a character string evaluation unit 105 among recognized character strings as a file name candidate for image data.
より高い精度で、画像データからタイトルを抽出する画像処理装置を提供することを目的とする。 An object of the present invention is to provide an image processing device that extracts a title from image data with higher accuracy.
本発明に係る画像処理装置は、光学的に読み取られた画像データから、画像の内容に関する情報を抽出するコンテンツ抽出部と、前記コンテンツ抽出部により抽出された情報に応じて、タイトルを決定するための決定ロジックを選択するロジック選択部と、前記ロジック選択部により選択された決定ロジックに基づいて、前記画像データのタイトルを決定するタイトル決定部とを有する。 An image processing apparatus according to the present invention includes a content extraction unit for extracting information about content of an image from optically read image data, and determining a title according to the information extracted by the content extraction unit. and a title determination unit for determining the title of the image data based on the determination logic selected by the logic selection unit.
好適には、前記決定ロジックは、前記画像の内容からタイトルを抽出するためのロジックであり、前記タイトル決定部は、選択された前記決定ロジックに従って、前記画像データから、タイトルの要素を抽出する。 Preferably, the determination logic is logic for extracting a title from the content of the image, and the title determination unit extracts title elements from the image data according to the selected determination logic.
好適には、前記コンテンツ抽出部は、前記画像データから、単語に関する情報、文体、文字種、文字列の外観に関する情報、色の分布、及び、文字サイズの分布、の少なくとも一つを抽出し、前記ロジック選択部は、前記コンテンツ抽出部により抽出された、単語に関する情報、文体、文字種、文字列の外観に関する情報、色の分布、及び、文字サイズの分布、の少なくとも一つに基づいて、決定ロジックを選択する。 Preferably, the content extraction unit extracts at least one of information on words, style of writing, type of characters, information on appearance of character strings, color distribution, and character size distribution from the image data, The logic selection unit performs decision logic based on at least one of information on words, style of writing, type of characters, information on appearance of character strings, color distribution, and character size distribution extracted by the content extraction unit. to select.
好適には、前記コンテンツ抽出部は、前記画像データから、既定の単語が出現する出現頻度、又は、既定の単語が出現した出現位置を抽出し、前記ロジック選択部は、前記コンテンツ抽出部により抽出された、既定の単語が出現する出現頻度、又は、既定の単語が出現した出現位置に基づいて、決定ロジックを選択する。 Preferably, the content extraction unit extracts from the image data the frequency of appearance of a predetermined word or the appearance position of the predetermined word, and the logic selection unit extracts by the content extraction unit A decision logic is selected based on the frequency of occurrence of the predetermined word or the position of occurrence of the predetermined word.
好適には、前記ロジック選択部は、既定の単語が出現する出現頻度、及び、既定の単語が出現した出現位置を入力データとした機械学習モデルを用いて、決定ロジックを選択する。 Preferably, the logic selection unit selects the decision logic by using a machine learning model whose input data are the frequency of appearance of a predetermined word and the appearance position of the predetermined word.
好適には、前記タイトル決定部により決定されたタイトルを含むファイル名を、前記画像データのデータファイルに付与するファイル名付与部をさらに有する。 Preferably, the apparatus further includes a file name assigning unit that assigns a file name including the title determined by the title determining unit to the data file of the image data.
好適には、前記決定ロジックには、画像の内容に基づいて複数のカテゴリー名の中から、採用するカテゴリーを選択する決定ロジックが含まれている。 Preferably, the decision logic includes decision logic for selecting a category to adopt from among a plurality of category names based on image content.
また、本発明に係る画像処理方法は、光学的に読み取られた画像データから、画像の内容に関する情報を抽出するコンテンツ抽出ステップと、前記コンテンツ抽出ステップにより抽出された情報に応じて、タイトルを決定するための決定ロジックを選択するロジック選択ステップと、前記ロジック選択ステップにより選択された決定ロジックに基づいて、前記画像データのタイトルを決定するタイトル決定ステップとを有する。 Further, an image processing method according to the present invention includes a content extraction step of extracting information about the content of an image from optically read image data, and determining a title according to the information extracted by the content extraction step. and a title determination step of determining the title of the image data based on the determination logic selected by the logic selection step.
また、本発明に係るプログラムは、光学的に読み取られた画像データから、画像の内容に関する情報を抽出するコンテンツ抽出ステップと、前記コンテンツ抽出ステップにより抽出された情報に応じて、タイトルを決定するための決定ロジックを選択するロジック選択ステップと、前記ロジック選択ステップにより選択された決定ロジックに基づいて、前記画像データのタイトルを決定するタイトル決定ステップとをコンピュータに実行させる。 Further, a program according to the present invention includes a content extraction step of extracting information about the content of an image from optically read image data, and determining a title according to the information extracted by the content extraction step. and a title determination step of determining the title of the image data based on the determination logic selected by the logic selection step.
より高い精度で、画像データからタイトルを抽出することができる。 Titles can be extracted from image data with higher accuracy.
図1は、画像処理システム1の全体構成を例示する図である。
図1に例示するように、画像処理システム1は、画像処理装置2及びスキャナ装置4を含み、ケーブル7を介して互いに接続している。なお、本例では、USBケーブルなどのケーブル7で接続する形態を具体例として説明するが、これに限定されるものではなく、例えば、無線により接続してもよい。また、スキャナ装置4の筐体内に、画像処理装置2の機能が内蔵されていてもよい。
画像処理装置2は、コンピュータ端末であり、スキャナ装置4により読み取られた画像データを処理する。具体的には、画像処理装置2は、スキャナ装置4により連続的に読み取られた画像データに関して、タイトルを決定し、決定されたタイトルを含むファイル名を付与する。
スキャナ装置4は、光学式の画像読取装置である。本例のスキャナ装置4は、原稿台にセットされた原稿を1枚ずつ送る自動原稿送り装置を含み、原稿台にセットされた原稿から、画像データを生成し、生成された画像データのデータファイルを画像処理装置2に転送する。FIG. 1 is a diagram illustrating the overall configuration of an image processing system 1. As shown in FIG.
As illustrated in FIG. 1, an image processing system 1 includes an image processing device 2 and a scanner device 4, which are connected to each other via a cable 7. FIG. In this example, a form of connection using a cable 7 such as a USB cable will be described as a specific example, but the present invention is not limited to this, and may be connected wirelessly, for example. Further, the functions of the image processing device 2 may be incorporated in the housing of the scanner device 4 .
The image processing device 2 is a computer terminal and processes image data read by the scanner device 4 . Specifically, the image processing device 2 determines titles for the image data continuously read by the scanner device 4, and assigns file names including the determined titles.
The scanner device 4 is an optical image reading device. The scanner device 4 of this example includes an automatic document feeder that feeds the originals set on the original platen one by one, generates image data from the originals set on the original platen, and creates a data file of the generated image data. is transferred to the image processing device 2 .
上記構成において、スキャナ装置4が原稿をスキャンし、画像処理装置2が、スキャン文書の内容を容易に把握するためにその文書のタイトルを自動で抽出し、それを含むファイル名を付与する場合がある。
この場合、論文や報告書などのオーソドックスな文書であれば上部中央付近に大きな文字で書かれることが多く、タイトルを抽出することは容易だった。しかし、文書にはさまざまな種類があり、プレゼン資料や冊子、パンフレット、新聞などでは、適切にタイトルを抽出できないことが多かった。例えば、図2に例示するプレゼン資料のケースでは、原稿上部の大きな文字をタイトル候補として優先するため、資料名(図中の「20XX年新製品のご紹介」)ではなく、会社名(図中の「ITコーポレーション」)を誤って抽出してしまう。原稿が新聞紙や会報等である場合も同様である。In the above configuration, there is a case where the scanner device 4 scans a document, and the image processing device 2 automatically extracts the title of the document in order to easily grasp the contents of the scanned document, and gives a file name including the title. be.
In this case, orthodox documents such as papers and reports are often written in large characters near the top center, making it easy to extract the title. However, there are various types of documents, and in many cases titles cannot be appropriately extracted from presentation materials, booklets, pamphlets, newspapers, and the like. For example, in the case of the presentation material shown in Fig. 2, the company name ( "IT Corporation") is mistakenly extracted. The same applies when the manuscript is a newspaper, bulletin, or the like.
そこで、本実施形態の画像処理システム1では、タイトル決定に用いる決定ロジックを画像コンテンツに応じて切り替えることにより、画像コンテンツに適したタイトルの抽出が可能になる。すなわち、1種類のロジックでは種々のコンテンツに対応できないため、画像処理装置2は、複数の決定ロジックの中から、画像内容に応じた決定ロジックを選択し、選択した決定ロジックでタイトルを決定する。 Therefore, in the image processing system 1 of the present embodiment, by switching the determination logic used for title determination according to the image content, it is possible to extract a title suitable for the image content. That is, since one kind of logic cannot cope with various contents, the image processing device 2 selects a decision logic corresponding to the image content from a plurality of decision logics, and decides the title with the selected decision logic.
図3は、画像処理装置2のハードウェア構成を例示する図である。
図3に例示するように、画像処理装置2は、CPU200、メモリ202、HDD204、ネットワークインタフェース206(ネットワークIF206)、表示装置208、及び、入力装置210を有し、これらの構成はバス212を介して互いに接続している。
CPU200は、例えば、中央演算装置である。
メモリ202は、例えば、揮発性メモリであり、主記憶装置として機能する。
HDD204は、例えば、ハードディスクドライブ装置であり、不揮発性の記録装置としてコンピュータプログラム(例えば、図4の画像処理プログラム3)やその他のデータファイルを格納する。
ネットワークIF206は、有線又は無線で通信するためのインタフェースであり、例えば、スキャナ装置4との通信を実現する。
表示装置208は、例えば、液晶ディスプレイである。
入力装置210は、例えば、キーボード及びマウスである。FIG. 3 is a diagram illustrating the hardware configuration of the image processing device 2. As shown in FIG.
As illustrated in FIG. 3, the image processing apparatus 2 has a
The
The HDD 204 is, for example, a hard disk drive device, and stores computer programs (eg, the image processing program 3 in FIG. 4) and other data files as a non-volatile recording device.
The network IF 206 is an interface for wired or wireless communication, and realizes communication with the scanner device 4, for example.
The
図4は、画像処理装置2の機能構成を例示する図である。
図4に例示するように、画像処理装置2には、画像処理プログラム3がインストールされている。
画像処理プログラム3は、コンテンツ抽出部300、ロジック選択部310、タイトル決定部320、及びファイル名付与部330を有する。
なお、画像処理プログラム3の一部又は全部は、ASICなどのハードウェアにより実現されてもよく、また、OS(Operating System)の機能を一部借用して実現されてもよい。FIG. 4 is a diagram illustrating the functional configuration of the image processing device 2. As shown in FIG.
As illustrated in FIG. 4, the image processing program 3 is installed in the image processing device 2 .
The image processing program 3 has a
Part or all of the image processing program 3 may be realized by hardware such as ASIC, or may be realized by partially borrowing functions of an OS (Operating System).
画像処理プログラム3において、コンテンツ抽出部300は、光学的に読み取られた画像データから、画像の内容に関する情報を抽出する。抽出される情報は、例えば、単語に関する情報、文体、文字種、文字列の外観に関する情報、色の分布、及び、文字サイズの分布などである。より具体的には、コンテンツ抽出部300は、画像データに対して文字認識処理を施して、既定の単語が出現する出現頻度、及び、既定の単語が出現した出現位置を抽出する。 In the image processing program 3, the
ロジック選択部310は、コンテンツ抽出部300により抽出された情報に応じて、タイトルを決定するための決定ロジックを選択する。例えば、ロジック選択部310は、単語に関する情報、文体、文字種、文字列の外観に関する情報、色の分布、及び、文字サイズの分布、の少なくとも一つに基づいて、複数の決定ロジックの中から、採用する決定ロジックを選択する。 The
タイトル決定部320は、ロジック選択部310により選択された決定ロジックに基づいて、画像データのタイトルを決定する。例えば、タイトル決定部320は、ロジック選択部310により選択された決定ロジックにより指定された画像領域の文字列を、タイトルの要素として抽出し、抽出された文字列を用いてタイトルを決定する。 The
ファイル名付与部330は、タイトル決定部320により決定されたタイトルを含むファイル名を、画像データのデータファイルに付与する。例えば、ファイル名付与部330は、タイトル決定部320により決定されたタイトルと、スキャンした日付とを配列してファイル名とする。 The file
図5は、画像処理システム1における全体動作(S10)を説明するフローチャートである。
図5に例示するように、ステップ100(S100)において、スキャナ装置4は、原稿台にセットされた原稿を読取位置までフィードして、原稿から画像を読み取り、読み取られた画像データを画像処理装置2に送信する。
画像処理装置2のコンテンツ抽出部300(図4)は、スキャナ装置4から受信した画像データから、画像の内容に関する情報を抽出し、抽出された情報に基づいて、画像コンテンツを識別する。抽出される情報は、例えば、OCR処理により抽出された、既定の単語の出現頻度、既定の単語の記載位置、単語や文をベクトル表現により意味の数値化(word2vec、sec2vecなど)、文体の種類(~ですます調、~ましょう調、~だ断定調、など)、文字種の含有割合(漢字、かな、カナ、数字、アルファベットなど)、及び、レイアウトや色など画像情報などである。学校関係や地域関係、各趣味関係などでは登場しやすい単語の頻度傾向があり、また、会報や定期的な文書や帳票などでは、特定の位置に同じ単語が記載されることが多く、さらには、各々のコンテンツジャンルにより、文体は揃っていることが多いので、上記の抽出情報によってコンテンツの識別が可能になる。FIG. 5 is a flow chart for explaining the overall operation (S10) in the image processing system 1. As shown in FIG.
As illustrated in FIG. 5, at step 100 (S100), the scanner device 4 feeds the document set on the document platen to the reading position, reads an image from the document, and transfers the read image data to the image processing device. 2.
The content extraction unit 300 (FIG. 4) of the image processing device 2 extracts information about the content of the image from the image data received from the scanner device 4, and identifies the image content based on the extracted information. The information to be extracted includes, for example, the appearance frequency of predetermined words extracted by OCR processing, the description position of predetermined words, the digitization of the meaning of words and sentences by vector representation (word2vec, sec2vec, etc.), the type of writing style. (~ desu masu tone, ~ masho tone, ~ da da jitsu tone, etc.), content ratio of character types (kanji, kana, kana, numbers, alphabet, etc.), and image information such as layout and color. There is a tendency for the frequency of words that are likely to appear in school-related, community-related, and hobby-related topics. Since writing styles are often the same depending on each content genre, it is possible to identify the content based on the extracted information.
ステップ105(S105)において、ロジック選択部310は、コンテンツ抽出部300により識別されたコンテンツに応じて、タイトルを決定するための決定ロジックを選択する。例えば、図6に例示するように、コンテンツ分類(ビジネス文書、地域行政文書、子供学校関係文書など)に応じた決定ロジックが用意されている。例えば、図6のビジネス文書用決定ロジック、地域行政文書用決定ロジック、及び、子供学校関係用決定ロジックは、コンテンツの識別が成功した場合に、適用されるものであり、カテゴリ選択型決定ロジックは、コンテンツの識別ができなかった場合に、適用されるものであり、画像の内容に基づいて複数のカテゴリー名の中から、いずれかのカテゴリーを選択し、選択されたカテゴリーに対応する領域の文字列をタイトルとするロジックである。 At step 105 (S105), the
ステップ110(S110)において、タイトル決定部320は、ロジック選択部310により選択された決定ロジックに基づいて、画像データのタイトルを決定する。例えば、タイトル決定部320は、決定ロジックにより指定された画像領域の文字列及び特徴を抽出し、抽出された特徴と、決定ロジックで定義された重み付け係数とに基づいて、抽出された各文字列のタイトルらしさを示すスコアを算出する。スコアの算出に用いる特徴は、例えば、抽出された文字列の大きさ絶対値、文字列の大きさ比(周囲の文字サイズとの比)、原稿中の文字列の位置、文字列周囲の余白、文字列に含まれる特定キーワード、文字列の色、及び、文字列の装飾(ボールド、下線付き、枠や飾りでの囲い、等)である。タイトル決定部320は、スコアの最も高い文字列をタイトルに決定する。 At step 110 ( S<b>110 ), the
ステップ115(S115)において、ファイル名付与部330は、タイトル決定部320により決定されたタイトルと、スキャンした日付とを配列してファイル名とし、スキャナ装置4から受信した画像データのデータファイルに、ファイル名を自動付与する。 At step 115 (S115), the file
以上説明したように、本実施形態の画像処理システム1によれば、スキャナ装置4によりスキャンされた画像データについて、画像の内容に応じて決定ロジックを選択し、選択された決定ロジックを用いて画像データからタイトルを抽出する。これにより、文書の分類に適した決定ロジックでタイトルを抽出できるため、タイトル抽出の精度向上が期待できる。その結果、スキャン画像に対して適切なファイル名が自動的に付与され、ユーザが文書ファイルを探す際の効率が上がる。 As described above, according to the image processing system 1 of the present embodiment, for image data scanned by the scanner device 4, a determination logic is selected according to the content of the image, and the image is processed using the selected determination logic. Extract titles from data. As a result, the title can be extracted with a decision logic suitable for document classification, so an improvement in the accuracy of title extraction can be expected. As a result, an appropriate file name is automatically assigned to the scanned image, and the user's efficiency in searching for the document file increases.
(コンテンツ識別処理の変形例)
次に、上記実施形態の変形例を説明する。まず、コンテンツ抽出部300によるコンテンツ識別処理の変形例を説明する。
コンテンツ抽出部300は、機械学習の学習モデルを用いて、スキャン画像のコンテンツを識別してもよい。すなわち、コンテンツ抽出部300は、画像データから特徴を抽出し、抽出された特徴と、学習モデルとに基づいて、コンテンツを識別する。学習モデルは、例えば、例えば、ナイーブベイズ、ロジスティック回帰、SVM (Support Vector Machine)、又は、ランダムフォレストなどであり、複数のサンプル原稿を用意して、予め学習モデルを用いて識別の特徴境界面を算出しておく。(Modified example of content identification processing)
Next, a modification of the above embodiment will be described. First, a modified example of content identification processing by the
The
また、コンテンツ抽出部300は、上記の方法と、BERT(Bidirectional Encoder Representations from Transformers)やトピックモデルなどの高度な言語処理によるコンテンツ分類、文字列の位置やサイズ、罫線などのレイアウト情報でのコンテンツ分類、又は、写真やイラストから物体認識でのコンテンツ分類を組み合わせてもよい。より高精度なコンテンツ識別が期待できる。
例えば、写真やイラストの物体認識を行う場合、パスタ、ステーキ、オムライスなどが認識された場合に、料理系コンテンツであり、犬、猫、熱帯魚、カメレオンなどが認識された場合に、ペット系のコンテンツであり、テント、焚火、寝袋、ランタンなどが認識された場合に、キャンプ系コンテンツであり、フェラーリ、コルベット、ホンダNSXなどが認識された場合に、スポーツカー系のコンテンツであると分類できる。In addition, the
For example, when recognizing objects in photos and illustrations, pasta, steak, omelet rice, etc. are recognized as food-related content, and dogs, cats, tropical fish, chameleons, etc. are recognized as pet-related content. When tents, bonfires, sleeping bags, lanterns, etc. are recognized, it can be classified as camping content, and when Ferrari, Corvette, Honda NSX, etc. are recognized, it can be classified as sports car content.
また、コンテンツ抽出部300は、画像データにおける色分布やレイアウトなどの画像特徴に基づいてコンテンツを分類してもよい。画像特徴としては、例えば、原稿上の色分布特徴(画像を小領域に分割し、領域ごとの使用色数をカウントしたもの)、色ごと画素数の分布特徴(色ごとに、記載された画素数をカウントしたもの)、文字位置の分布特徴(画像を小領域に分割し、領域ごとの文字数をカウントしたもの)、文字サイズの分布特徴(文字サイズごとに、記載された文字数をカウントしたもの)、文字列の行方向特徴(文字列の縦横方向を分け、それぞれの文字数をカウントしたもの)、又は、多段組の特徴(ひと固まりの文字列から、段組み数を推定したもの)などがある。 Also, the
(タイトル決定処理の変形例)
次に、タイトル決定部320によるタイトル決定処理の変形例を説明する。
タイトル決定部320は、機械学習も学習モデルを用いて、タイトルを決定してもよい。例えば、タイトル決定部320は、機械学習を用いてスコア計算を行う。機械学習に使うモデルは、例えば、ナイーブベイズ、ロジスティック回帰、SVM、ランダムフォレストなどである。複数のサンプル原稿を用意し、上記学習モデルを用いて原稿中の各文字列がタイトルか否かを判定する判定器を作成する。そのタイトル判定器は、タイトルか否かの判定結果と、タイトルらしさのスコアを出力する。タイトル抽出時には、タイトル決定部320が、原稿中の複数の各文字列に対して、上記タイトル判定器を使用しタイトルか否かを判定し、タイトルと判定された文字列の中から最もタイトルらしさのスコアが高かった文字列をタイトルとして出力する。
また、モデルの学習は、コンテンツの分類ごとに行う。コンテンツごとの学習は、上記特徴量の重みパラメータをコンテンツごとに調整することを意味する。コンテンツの分類ごとに複数のサンプル原稿を用意し、上記学習モデルを用いてタイトルか否かを学習させる。結果、コンテンツの分類ごとに最適化されたタイトル抽出器が仕上がる。(Modified example of title determination processing)
Next, a modified example of title determination processing by the
The
In addition, model learning is performed for each content classification. Learning for each content means adjusting the weight parameter of the feature amount for each content. A plurality of sample manuscripts are prepared for each content classification, and the learning model is used to learn whether or not it is a title. The result is a title extractor optimized for each content classification.
タイトル決定部320及びファイル名付与部330は、コンテンツごとに抽出およびタイトル生成エンジンを切り替えてもよい。タイトル決定部320及びファイル名付与部330は、コンテンツごとに適したタイトル抽出ロジックを適用し、抽出エンジンを切り替える。具体的には、ビジネス文書ではレイアウトベースのタイトル抽出エンジンを使用する。請求書の場合、タイトル決定部320及びファイル名付与部330は、請求元会社名や支払期限など項目抽出ベースのタイトル抽出エンジンを使用し、抽出された項目値を連結しファイル名とする。会報の場合は、タイトル決定部320及びファイル名付与部330は、レイアウトベースで会報名を抽出した上、項目抽出ベースで発行日や号数を抽出し、それらを連結しファイル名とする。小説書籍などは会報と同様に、タイトル決定部320及びファイル名付与部330は、レイアウトベースで書籍タイトルを抽出した上、項目抽出ベースで著者や出版社を抽出し、それらを連結しファイル名とする。 The
(その他の変形例)
上記実施形態では、タイトル決定部320により決定されたタイトルをファイル名の一部として利用する形態を説明したが、これに限定されるものではなく、例えば、検索キーワードとして利用してもよい。(Other modifications)
In the above embodiment, the title determined by the
1…画像処理システム
2…画像処理装置
3…画像処理プログラム
4…スキャナ装置
300…コンテンツ抽出部
310…ロジック選択部
320…タイトル決定部
330…ファイル名付与部REFERENCE SIGNS LIST 1 image processing system 2 image processing device 3 image processing program 4
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021102506AJP2023001657A (en) | 2021-06-21 | 2021-06-21 | Image processing device, image processing method, and program |
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2021102506AJP2023001657A (en) | 2021-06-21 | 2021-06-21 | Image processing device, image processing method, and program |
| Publication Number | Publication Date |
|---|---|
| JP2023001657Atrue JP2023001657A (en) | 2023-01-06 |
| JP2023001657A5 JP2023001657A5 (en) | 2024-05-07 |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2021102506APendingJP2023001657A (en) | 2021-06-21 | 2021-06-21 | Image processing device, image processing method, and program |
| Country | Link |
|---|---|
| JP (1) | JP2023001657A (en) |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003058556A (en)* | 2001-08-16 | 2003-02-28 | Ricoh Co Ltd | Title extraction method, extraction program, and title extraction device for document image |
| JP2010287178A (en)* | 2009-06-15 | 2010-12-24 | Sharp Corp | Image processing apparatus, image reading apparatus, multifunction machine, image processing method, program, and recording medium |
| JP2012015896A (en)* | 2010-07-02 | 2012-01-19 | Riso Kagaku Corp | Image processing apparatus |
| JP2017010582A (en)* | 2016-09-12 | 2017-01-12 | 富士フイルム株式会社 | Keyword setting method, program and apparatus |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2003058556A (en)* | 2001-08-16 | 2003-02-28 | Ricoh Co Ltd | Title extraction method, extraction program, and title extraction device for document image |
| JP2010287178A (en)* | 2009-06-15 | 2010-12-24 | Sharp Corp | Image processing apparatus, image reading apparatus, multifunction machine, image processing method, program, and recording medium |
| JP2012015896A (en)* | 2010-07-02 | 2012-01-19 | Riso Kagaku Corp | Image processing apparatus |
| JP2017010582A (en)* | 2016-09-12 | 2017-01-12 | 富士フイルム株式会社 | Keyword setting method, program and apparatus |
| Publication | Publication Date | Title |
|---|---|---|
| Cheng et al. | M6doc: A large-scale multi-format, multi-type, multi-layout, multi-language, multi-annotation category dataset for modern document layout analysis | |
| US5860075A (en) | Document data filing apparatus for generating visual attribute values of document data to be filed | |
| US8726178B2 (en) | Device, method, and computer program product for information retrieval | |
| US9514216B2 (en) | Automatic classification of segmented portions of web pages | |
| JP3298676B2 (en) | How to access perceivable information segments | |
| US9454696B2 (en) | Dynamically generating table of contents for printable or scanned content | |
| CN102611815A (en) | Image processing apparatus, image processing system and image processing method | |
| US10572528B2 (en) | System and method for automatic detection and clustering of articles using multimedia information | |
| JP2007164648A (en) | Similar image search device, similar image search method, program, and information recording medium | |
| JP4783802B2 (en) | Method and apparatus for outputting advertisement to printed matter | |
| JP2002063215A (en) | Document display method and system, computer program, recording medium | |
| JP2010072842A (en) | Image processing apparatus and image processing method | |
| US20090180126A1 (en) | Information processing apparatus, method of generating document, and computer-readable recording medium | |
| US20070116362A1 (en) | Method and device for the structural analysis of a document | |
| JP7086424B1 (en) | Patent text generator, patent text generator, and patent text generator | |
| JP2008129793A (en) | Document processing system, apparatus and method, and recording medium recording program | |
| US20130339002A1 (en) | Image processing device, image processing method and non-transitory computer readable recording medium | |
| US11657367B2 (en) | Workflow support apparatus, workflow support system, and non-transitory computer readable medium storing program | |
| JP2007172077A (en) | Image search system, method thereof, and program thereof | |
| JP2010218249A (en) | Document image processing apparatus, document image processing method, and document image processing program | |
| JP2024084371A (en) | Information processing device, information processing system, information processing method, and program | |
| KR101951910B1 (en) | An E-book Production System Using Automatic Placement Of Illustration And Text | |
| JP6856916B1 (en) | Information processing equipment, information processing methods and information processing programs | |
| JP2023001657A (en) | Image processing device, image processing method, and program | |
| JP2004334341A (en) | Document search device, document search method, and recording medium |
| Date | Code | Title | Description |
|---|---|---|---|
| RD07 | Notification of extinguishment of power of attorney | Free format text:JAPANESE INTERMEDIATE CODE: A7427 Effective date:20221118 | |
| A521 | Request for written amendment filed | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20221227 | |
| RD02 | Notification of acceptance of power of attorney | Free format text:JAPANESE INTERMEDIATE CODE: A7422 Effective date:20240405 | |
| A521 | Request for written amendment filed | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20240424 | |
| A621 | Written request for application examination | Free format text:JAPANESE INTERMEDIATE CODE: A621 Effective date:20240514 | |
| A977 | Report on retrieval | Free format text:JAPANESE INTERMEDIATE CODE: A971007 Effective date:20250207 | |
| A131 | Notification of reasons for refusal | Free format text:JAPANESE INTERMEDIATE CODE: A131 Effective date:20250212 | |
| A521 | Request for written amendment filed | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20250410 | |
| A02 | Decision of refusal | Free format text:JAPANESE INTERMEDIATE CODE: A02 Effective date:20250520 |