Movatterモバイル変換


[0]ホーム

URL:


JPH02210586A - Table area separator - Google Patents

Table area separator

Info

Publication number
JPH02210586A
JPH02210586AJP63171729AJP17172988AJPH02210586AJP H02210586 AJPH02210586 AJP H02210586AJP 63171729 AJP63171729 AJP 63171729AJP 17172988 AJP17172988 AJP 17172988AJP H02210586 AJPH02210586 AJP H02210586A
Authority
JP
Japan
Prior art keywords
table area
image
coordinates
image memory
extracting
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
JP63171729A
Other languages
Japanese (ja)
Other versions
JP2890306B2 (en
Inventor
Noboru Shimizu
昇 清水
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fujifilm Business Innovation Corp
Original Assignee
Fuji Xerox Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Fuji Xerox Co LtdfiledCriticalFuji Xerox Co Ltd
Priority to JP63171729ApriorityCriticalpatent/JP2890306B2/en
Publication of JPH02210586ApublicationCriticalpatent/JPH02210586A/en
Application grantedgrantedCritical
Publication of JP2890306B2publicationCriticalpatent/JP2890306B2/en
Anticipated expirationlegal-statusCritical
Expired - Fee Relatedlegal-statusCriticalCurrent

Links

Landscapes

Abstract

PURPOSE:To extract a whole table are including characters in a table as well by extracting line segments, which are the elements of the table, by extracting long black picture element strings, detecting the coordinates of starting points and ending points in the respective line segments, determining the diagonal coordinates of a rectangle expressing the table area from those coordinates and extracting the table area according to the diagonal coordinates. CONSTITUTION:A picture input means 1 is provided to digitize and input a picture including the table and a first image memory 2 is provided to store the input picture. Then, a line segment extracting means 3 is provided to extract the black picture element strings to be continued for more than a fixed threshold value, which is determined in advance in horizontal and vertical direction, and a second image memory 4 is provided to store the extracted black picture element string. A rectangle coordinate detecting means 5 is provided to detect the coordinates of the rectangle, which expresses the table area, based on the black picture element string stored in the second image memory 4 and a table area extracting means 6 is provided to extract the table area from the first image memory 2 according to the detected coordinates of the rectangle expressing the table area. Thus, document picture recognition or document edition can be efficiently executed and the table are including the characters as well can be extracted.

Description

Translated fromJapanese

【発明の詳細な説明】(産業上の利用分野)本発明は人間による認識のためのマーク付は等が行なわ
れていない一般の文書を認識するための文書画像認識に
おいて、文字、図、表、写真などが混在する文書から表
領域を分離する装置に関するものである。
Detailed Description of the Invention (Field of Industrial Application) The present invention is applicable to document image recognition for recognizing general documents that are not marked for human recognition. The present invention relates to a device that separates table areas from documents containing photographs and the like.

(従来の技術)従来の文字・図形分離処理は、文字と図形を分離するの
みである。つまり第2図に示すように、表を含んだ文書
画像70に対しては表の線と文字(表領域外の文字(本
文文字と見出し文字など)と表領域内の文字の両方を含
む)を分離して、文字画像71と線画像72とに分離抽
出するのみで、表内の文字を含んだ表領域を分離して、
文字領域画像73と表領域画像74とに分離抽出するこ
とはできなかった。
(Prior Art) Conventional character/figure separation processing only separates characters and figures. In other words, as shown in FIG. 2, for a document image 70 that includes a table, the lines and characters of the table (including both characters outside the table area (body text, heading characters, etc.) and characters inside the table area) By simply separating and extracting the character image 71 and line image 72, the table area containing the characters in the table can be separated,
It was not possible to separate and extract the character area image 73 and the table area image 74.

このような従来技術においては、表内の文字を、含んだ
表領域を抽出できないことによって、以下のような問題
点があった。
This conventional technique has the following problems because it is not possible to extract a table area that includes characters in a table.

■文書画像認識では、文字認識の際に本文領域と表内の
文字が区別できないために、文脈を用いた効率的な文字
認識を行なうことができない。
(2) In document image recognition, it is not possible to distinguish between text areas and characters in tables during character recognition, making it impossible to perform efficient character recognition using context.

0表においては、同一行(列)には同じ文字、同じ意味
の文字、あるいは反対の意味の文字などが使用されるこ
とが多いが、このような表の構造的な意味を用いて効率
的に文字認識を行なうことはできない。
In tables, the same characters, characters with the same meaning, or characters with opposite meanings are often used in the same row (column). cannot perform character recognition.

■文書編集では、表の線のみに対する編集ができるのみ
で、意味を持つ表領域に対する編集ができない。
■When editing documents, you can only edit table lines, but you cannot edit meaningful table areas.

(発明が解決しようとする課題)本発明は、文書画像認識や文書編集を効率的に行なうの
に文字をも含んだ表領域の抽出ができるようにすること
を目的とするものである。
(Problems to be Solved by the Invention) An object of the present invention is to make it possible to extract a table area including characters in order to efficiently perform document image recognition and document editing.

(課題を解決するための手段)本発明は、表を含む画像をデジタル化して入力する画像
入力手段と、入力画像を記憶する第1のイメージメモリ
と、水平または垂直方向に予め定めた一定の閾値以上に
わたり連続する黒画素列を抽出する線分抽出手段と、そ
の抽出された黒画素列を格納する第2のイメージメモリ
と、その第2のイメージメモリに格納した黒画素列に基
づき表領域を表わす矩形の座標を検出する矩形座標検出
手段と、その検出した表領域を表す矩形の座標により第
1のイメージメモリから表領域を抽出する表領域抽出手
段とを備えた表領域分離装置である。
(Means for Solving the Problems) The present invention includes an image input means for digitizing and inputting an image including a table, a first image memory for storing the input image, and a predetermined fixed amount in the horizontal or vertical direction. A line segment extraction means for extracting a continuous black pixel string over a threshold value, a second image memory for storing the extracted black pixel string, and a table area based on the black pixel string stored in the second image memory. A table area separation device comprising rectangle coordinate detection means for detecting the coordinates of a rectangle representing the table area, and table area extraction means for extracting the table area from the first image memory based on the coordinates of the rectangle representing the detected table area. .

(作用)本発明は、画像入力手段から表を含む一般文書すなわち
人間による処理のためのマーク付は等が行なわれ°てい
ない文書をデジタル入力し、その原画像を第1のイメー
ジメモリに格納しておき、その原画像に対して線分抽出
手段により水平方向または垂直方向に長く連続する黒画
素列を抽出し、その抽出した黒画像素列つまり水平方向
線分のみになった画像と垂直方向線分のみになった画像
を第2のイメージメモリに格納し、矩形座標検出手段に
おいて両画像に存在する各線分の始点と終点を検出し、
表領域の有無を確認し、そして、表領域を表わす対角座
標を求め、次に表領域抽出手段において矩形座標検出手
段からの表領域を表す前記座標を用い、第1イメージメ
モリに格納されている原画像から表領域画像と文字領域
画像(表領域外の画像)を分離する。
(Operation) The present invention digitally inputs a general document including a table, that is, a document that has not been marked for human processing, from an image input means, and stores the original image in a first image memory. Then, a long continuous black pixel string in the horizontal or vertical direction is extracted from the original image using a line segment extraction means, and the extracted black pixel string, that is, an image containing only horizontal line segments, is vertically The image containing only directional line segments is stored in a second image memory, and the rectangular coordinate detection means detects the start and end points of each line segment existing in both images,
The presence or absence of a table area is confirmed, and the diagonal coordinates representing the table area are determined. Next, the table area extraction means uses the coordinates representing the table area from the rectangular coordinate detection means, and the coordinates representing the table area are stored in the first image memory. Separate the table area image and character area image (image outside the table area) from the original image.

(実施例)第1図は本発明の一実施例を示すもので、この表領域分
離装置は、画像入力部1、第1のイメージメモリ2、長
ランレングス抽出部3、イメージメモリ4、矩形座標検
出部5、および表領域抽出部6からなっている。
(Embodiment) FIG. 1 shows an embodiment of the present invention, and this table area separation device includes an image input section 1, a first image memory 2, a long run length extraction section 3, an image memory 4, a rectangular It consists of a coordinate detection section 5 and a table area extraction section 6.

画像入力部lは、本文文字や表を含む文書画像を入力す
る。たとえば、第2図(a)原画像70を2値デジタル
データとして入力する。
The image input unit 1 inputs a document image including text characters and tables. For example, the original image 70 in FIG. 2(a) is input as binary digital data.

第1のイメージメモリ2は、入力した2値デジタルデー
タを記憶しておく。
The first image memory 2 stores input binary digital data.

長ランレングス抽出部3は、第1のイメージメモリ内の
予め定めた一定の閾値以上の長ランレングス(=長く連
続する黒画素列)を水平および垂直方向走査することに
より、取り出す。
The long run length extraction unit 3 extracts long run lengths (= long continuous black pixel rows) in the first image memory that are equal to or larger than a predetermined threshold value by scanning in the horizontal and vertical directions.

水平方向の長ランレングスの黒画素列の取り出し方法を
第3図を用いて説明する。第3図(a)は原画像の一部
分であり、四角の一個が1ドツトに対応し、斜線部分が
黒画像、白い部分が白画素、縦の太線がメモリ内のバイ
ト単位を示している。
A method for extracting a long horizontal run length black pixel column will be explained with reference to FIG. FIG. 3(a) shows a part of the original image, where one square corresponds to one dot, the diagonal line area is a black image, the white area is a white pixel, and the thick vertical line is a byte unit in the memory.

この画像に対して、水平方向に走査し、閾値(この例で
は10ドツト)以上の黒ランを取り出す。
This image is scanned in the horizontal direction, and black runs exceeding a threshold value (10 dots in this example) are extracted.

結果は第3図(b)のようになる。垂直方向の長ランレ
ングスの黒画素列の取り出し方法を第4図を用いて示す
。第4図(a)は、原画像の一部である。本実施例にお
けるメモリはバイト単位でアクセスを行なうものを用い
たので、垂直方向に走査するには第4図(a)のままで
は水平方向の走査と違い、1ドツトの読み出し毎にその
ドツトを含む1バイト全体が読み出されることになる。
The result is as shown in Figure 3(b). A method for extracting a black pixel column with a long vertical run length will be shown with reference to FIG. FIG. 4(a) is a part of the original image. Since the memory used in this embodiment is accessed in byte units, when scanning in the vertical direction, as shown in FIG. 4(a), unlike horizontal scanning, each dot is read out. The entire 1 byte containing the data will be read.

つまり、水平方向の走査では8ドツトを1回のアクセス
で読み出すことができるのに対し、第4図(a)の配列
のままで垂直方向の走査を行なうと8ドツトの読み出し
にメモリに対し8回のアクセスが必要となり、走査に時
間を要することになる。
In other words, when scanning in the horizontal direction, 8 dots can be read out in one access, whereas when scanning in the vertical direction with the arrangement shown in FIG. This requires multiple accesses, and scanning takes time.

そこで、垂直方向の走査も水平方向の走査と同じように
できるように、第4図(b)に示すとおり原画像を90
度回転した画像をメモリ上に作成する。その90度回転
した画像に対して、水平方向と同じ処理を行なう。
Therefore, in order to perform vertical scanning in the same way as horizontal scanning, the original image was
Creates a rotated image in memory. The same processing as in the horizontal direction is performed on the 90 degree rotated image.

この処理によって、第2のイメージメモリ4には、第5
図に示すように水平方向線分のみの画像(a)と垂直方
向線分のみの画像(b)が2面できあがる。ただし、垂
直方向線分のみの画像は90度回転したままの画像であ
る。
Through this process, the fifth image is stored in the second image memory 4.
As shown in the figure, two images are created: an image (a) containing only horizontal line segments and an image (b) containing only vertical line segments. However, an image of only vertical line segments is an image rotated by 90 degrees.

第2のイメージメモリ4内の2つの画像に対して、矩形
座標検出部5では、表の対角座標(左上座標と右下座標
または右上座標と左下座標)を検出する。具体的には、
まず、第5図(a)に示すような水平方向のみの画像に
対して、同図77の走査方向(ここでは77の方向とす
る。逆でもよい。)で、走査して水平方向線分75の始
点、終点のXN y座標を求める。第5図(b)に示す
ような垂直方向のみの画像に対しても同様に、77の走
査方向で線分76の始点、終点のXX y座標を求める
。ただし、この際の座標系は第5図(b)のように90
度回転したものとなっている。
For the two images in the second image memory 4, the rectangular coordinate detection unit 5 detects the diagonal coordinates (upper left coordinate and lower right coordinate, or upper right coordinate and lower left coordinate) of the table. in particular,
First, an image only in the horizontal direction as shown in FIG. 5(a) is scanned in the scanning direction 77 in FIG. Find the XNy coordinates of the starting point and ending point of 75. Similarly, for an image only in the vertical direction as shown in FIG. 5(b), the XX and y coordinates of the starting point and ending point of the line segment 76 are determined in the scanning direction 77. However, the coordinate system at this time is 90° as shown in Figure 5(b).
It has been rotated a degree.

水平/垂直方向線分のXI ’J座標から、線分75と
76が互いに交差することを確認(この確認はアンダー
ライン等の表を構成していない線分を取り除くためであ
る)シ、交差している線分のみについて、水平方向線分
の始点で最小のX座標xIllと、終点で最大のX座標
X、を求め、垂直方向線分の終点で最小のy座標y。と
、始点で最大のy座標y1を求める。これによって、表
の左上座標(XO%yg) 、右下座標(x7、y、)
が求まる。
Check that line segments 75 and 76 intersect each other from the XI 'J coordinates of the horizontal/vertical line segments (this check is to remove line segments that do not constitute a table, such as underlines). Find the minimum X coordinate xIll at the starting point of the horizontal line segment, the maximum X coordinate X at the end point, and the minimum y coordinate y at the end point of the vertical line segment. Then, find the maximum y-coordinate y1 at the starting point. With this, the upper left coordinates (XO%yg) and lower right coordinates (x7, y,) of the table
is found.

ここで、左上座標と右上座標を簡易に線群75の最初に
みつかった水平線の始点のX1y座標と、最後に見つか
った水平線の終点のXN y座標から求めなかったのは
、第6図のように開いている表(周りが水平/垂直線で
囲まれていない表)にも対処できるようにしたためであ
る。
Here, the reason why the upper left and upper right coordinates were not simply calculated from the X1y coordinate of the starting point of the first horizontal line found in the line group 75 and the XNy coordinate of the ending point of the last horizontal line found is as shown in Figure 6. This is so that it can also be used for tables that are open (tables that are not surrounded by horizontal/vertical lines).

表領域抽出部6では、矩形座標検出部5より渡された左
上座標(Xolyo)と右上座標(Xl、yl)から、
その座標に対応する第1のイメージメモリ2の矩形領域
を切り出し、第2図(e)のような表内の文字を含んだ
表領域74を抽出できる。また、矩形座標内を白く塗り
つぶすことによって第2図(d)のような表領域外の画
像73を得ることができる。
In the table area extraction unit 6, from the upper left coordinate (Xolyo) and upper right coordinate (Xl, yl) passed from the rectangle coordinate detection unit 5,
A rectangular area of the first image memory 2 corresponding to the coordinates is cut out, and a table area 74 containing characters in the table as shown in FIG. 2(e) can be extracted. Furthermore, by filling the inside of the rectangular coordinates with white, an image 73 outside the table area as shown in FIG. 2(d) can be obtained.

本発明の上記実施例においては、バイト単位でアクセス
可能なメモリを用い、長ランレングス抽出部3で画像を
90度回転させることによって、垂直方向も効率よ(走
査しているが、これをビット単位でめアクセスが可能な
メモリを用いることによって、第5図(b)のように回
転した座標系を用いな(でも垂直方向も水平方向と同じ
に効率よく走査することができる。
In the above embodiment of the present invention, by using a memory that can be accessed in bytes and rotating the image by 90 degrees in the long run length extraction unit 3, the vertical direction is also efficiently scanned. By using a memory that can be accessed in units, it is possible to scan in the vertical direction as efficiently as in the horizontal direction (even without using a rotated coordinate system as shown in FIG. 5(b)).

また、抽出の対象とする表の構造を規定すること、たと
えば、表はかならず水平/垂直線で閉じていることなど
を限定することによって、垂直方向の線分取り出しを省
略してしまうなどの簡略化を行なうことできる。たとえ
ば、アンダーラインがなく、閉じた表を対象とするなら
ば、1番上にある水平線の始点のXN y座標と1番下
にある水平線の終点のXN y座標を求めることのみに
よって、表領域の抽出が可能である。
In addition, by specifying the structure of the table to be extracted, for example, by restricting the table to always be closed with horizontal/vertical lines, it is possible to omit the extraction of vertical line segments. It is possible to carry out transformations. For example, if the target is a closed table with no underlining, the table area can be It is possible to extract

(発明の効果)以上のように、本発明は、長い黒画素列を抽出すること
によって表の要素である線分を抽出し、各線分の始点と
終点の座標を検出し、それらの座標から表領域を表す矩
形の対角座標を決定し、その対角座標により表領域を抽
出するように構成したので、従来技術のように表の線分
のみを抽出するのとは異なり、表内の文字をも含む表領
域全体を抽出することが可能である。従って、本発明を
文書画像認識の前処理に用いた場合には、文書画像の認
識を高効率に行なうために必要な条件を備えた分離され
た表領域と文字領域を提供でき、極めて有用である。
(Effects of the Invention) As described above, the present invention extracts line segments that are elements of a table by extracting a long black pixel string, detects the coordinates of the start point and end point of each line segment, and The diagonal coordinates of the rectangle representing the table area are determined, and the table area is extracted using the diagonal coordinates. It is possible to extract the entire tablespace including characters. Therefore, when the present invention is used for preprocessing of document image recognition, it is possible to provide a separated table area and character area that have the necessary conditions for highly efficient document image recognition, which is extremely useful. be.

また、本発明は、長い黒画素列を抽出し、各黒画素列の
その始点と終点の座標を検出し比較するという簡易な演
算処理によって表領域を抽出するので、装置の構成を簡
単にすることができると共に、処理の高速化を実現する
ことができる。
Furthermore, the present invention simplifies the configuration of the device because the table area is extracted through simple arithmetic processing of extracting a long black pixel string, detecting and comparing the coordinates of the start and end points of each black pixel string. In addition, it is possible to realize faster processing.

【図面の簡単な説明】[Brief explanation of the drawing]

第1図は、本発明の一実施例を示すブロック図である。第2図は文字と表の分離の態様を説明するための図であ
り、同図(a)は原入力画像、(b)は従来手法゛によ
る文字画像、(C)は従来手法による線画像、(d)は
文字領域画像、(e)は表領域画像の例を示す図である
。第3図は、水平方向に長い黒画素列を取り出すための説
明図である。第5図は、長い黒画素列から表領域の矩形座標を抽出す
るための説明図である。第6図は、開いた表(表の四方が水平/垂直線で囲まれ
ていない表)の−例を示す図である。■・・・画像入力部、2・・・第1のイメージメモリ、
3・・・長ランレングス抽出部、4・・・第2のイメー
ジメモリ、5・・・矩形座標検出部、6・・・表領域抽
出部、70・・・原画像、71・・・従来手法による文
字画像、72・・・従来手法による線画像、73・・・
本発明による文字領域画像、74・・・本発明による表
領域画像、75・・・水平方向線分、76・・・垂直方
向線分、77・・・走査方向。=12−第2図(b)(c)第図(a)第図(a)手続1?11正書(方式)昭和63年10月24日特許庁長官 吉 1)文 毅 殿事件の表示発明の名称特願昭83−171729号表領域分離装置補正をする者事件との関係住  所名   称代表者
FIG. 1 is a block diagram showing one embodiment of the present invention. FIG. 2 is a diagram for explaining the mode of separating characters and tables, in which (a) is the original input image, (b) is a character image obtained by the conventional method, and (C) is a line image obtained by the conventional method. , (d) is a diagram showing an example of a character area image, and (e) is a diagram showing an example of a table area image. FIG. 3 is an explanatory diagram for extracting a horizontally long black pixel row. FIG. 5 is an explanatory diagram for extracting rectangular coordinates of a table area from a long black pixel string. FIG. 6 is a diagram showing an example of an open table (a table whose four sides are not surrounded by horizontal/vertical lines). ■...Image input section, 2...First image memory,
3... Long run length extraction unit, 4... Second image memory, 5... Rectangular coordinate detection unit, 6... Table area extraction unit, 70... Original image, 71... Conventional Character image by method, 72...Line image by conventional method, 73...
Character area image according to the present invention, 74...Table area image according to the present invention, 75...Horizontal line segment, 76...Vertical line segment, 77...Scanning direction. =12- Figure 2 (b) (c) Figure (a) Figure (a) Procedure 1? 11 official text (method) October 24, 1988 Director General of the Patent Office Yoshi 1) Indication of Moon Yi case Name of the invention Japanese Patent Application No. 83-171729 Person who amends table area separation device Relationship to the case Address Name Representative

Claims (1)

Translated fromJapanese
【特許請求の範囲】表を含む画像をデジタル化して入力する画像入力手段と
、入力画像を記憶する第1のイメージメモリと、水平また
は垂直方向に予め定めた一定の閾値以上にわたり連続す
る黒画素列を抽出する線分抽出手段と、その抽出された黒画素列を格納する第2のイメージメモ
リと、第2のイメージメモリに格納した黒画素列に基づき表領
域を表わす矩形の座標を検出する矩形座標検出手段と、その検出した表領域を表す矩形の座標により第1のイメ
ージメモリから表領域を抽出する表領域抽出手段とを備えたことを特徴とする表領域分離装置。
[Claims] Image input means for digitizing and inputting an image including a table; a first image memory for storing the input image; and black pixels that are continuous over a predetermined threshold in the horizontal or vertical direction. a line segment extraction means for extracting a column; a second image memory for storing the extracted black pixel column; and detecting the coordinates of a rectangle representing a table area based on the black pixel column stored in the second image memory. A table area separation device comprising: rectangular coordinate detecting means; and table area extracting means for extracting a table area from a first image memory based on the rectangular coordinates representing the detected table area.
JP63171729A1988-07-121988-07-12 Table space separation apparatus and table space separation methodExpired - Fee RelatedJP2890306B2 (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
JP63171729AJP2890306B2 (en)1988-07-121988-07-12 Table space separation apparatus and table space separation method

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
JP63171729AJP2890306B2 (en)1988-07-121988-07-12 Table space separation apparatus and table space separation method

Publications (2)

Publication NumberPublication Date
JPH02210586Atrue JPH02210586A (en)1990-08-21
JP2890306B2 JP2890306B2 (en)1999-05-10

Family

ID=15928595

Family Applications (1)

Application NumberTitlePriority DateFiling Date
JP63171729AExpired - Fee RelatedJP2890306B2 (en)1988-07-121988-07-12 Table space separation apparatus and table space separation method

Country Status (1)

CountryLink
JP (1)JP2890306B2 (en)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP2001076154A (en)*1999-08-232001-03-23Xerox CorpMethod for segmenting digital image and digital image processor
US8452104B2 (en)2010-08-092013-05-28Fuji Xerox Co., Ltd.Image determination apparatus, computer readable medium storing program, and method
US8483482B2 (en)2009-07-102013-07-09Fuji Xerox Co., Ltd.Image processing device, image processing method and computer-readable medium
US8542931B2 (en)2009-02-052013-09-24Fuji Xerox Co., Ltd.Ruled line extraction technique based on comparision results and indentifying noise based on line thickness
US10699110B2 (en)2017-01-262020-06-30Ricoh Company, Ltd.Image processing apparatus, image processing method, and non-transitory recording medium storing program for causing computer to execute image processing method
CN113343815A (en)*2021-05-312021-09-03北森云计算有限公司Method for identifying form in PDF (Portable document Format) and other format documents

Citations (1)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JPS57211674A (en)*1981-06-231982-12-25Ricoh Co LtdFrame recognizing method

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JPS57211674A (en)*1981-06-231982-12-25Ricoh Co LtdFrame recognizing method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JP2001076154A (en)*1999-08-232001-03-23Xerox CorpMethod for segmenting digital image and digital image processor
US8542931B2 (en)2009-02-052013-09-24Fuji Xerox Co., Ltd.Ruled line extraction technique based on comparision results and indentifying noise based on line thickness
US8483482B2 (en)2009-07-102013-07-09Fuji Xerox Co., Ltd.Image processing device, image processing method and computer-readable medium
US8452104B2 (en)2010-08-092013-05-28Fuji Xerox Co., Ltd.Image determination apparatus, computer readable medium storing program, and method
US10699110B2 (en)2017-01-262020-06-30Ricoh Company, Ltd.Image processing apparatus, image processing method, and non-transitory recording medium storing program for causing computer to execute image processing method
CN113343815A (en)*2021-05-312021-09-03北森云计算有限公司Method for identifying form in PDF (Portable document Format) and other format documents
CN113343815B (en)*2021-05-312022-06-07北森云计算有限公司Method for identifying form in PDF (Portable document Format) and other format documents

Also Published As

Publication numberPublication date
JP2890306B2 (en)1999-05-10

Similar Documents

PublicationPublication DateTitle
EP0739521B1 (en)Method of splitting handwritten input
CN114004204B (en) Table structure reconstruction and text extraction method and system based on computer vision
US5075895A (en)Method and apparatus for recognizing table area formed in binary image of document
JPH039489A (en) Tablespace identification method
JP2001358925A (en)Unit and method for image processing and recording medium
JPH0721310A (en) Document recognition device
US4769849A (en)Method and apparatus for separating overlapping patterns
JPH02210586A (en)Table area separator
JPH08180068A (en) Electronic filing equipment
JP3171626B2 (en) Character recognition processing area / processing condition specification method
JPH06187489A (en)Character recognizing device
JPH0548510B2 (en)
JPH0490083A (en) character recognition device
JPH01137385A (en)Character recognizing device
JPH07160810A (en) Character recognition device
JPS61175875A (en)Document reading device
JPH0697470B2 (en) Character string extractor
JPH117493A (en) Character recognition processor
JPS62197881A (en)Vertical or horizontal writing deciding system for document image
JP2803735B2 (en) Character recognition device including ruled lines
JP2507949B2 (en) Character / graphic area determination device
JPS6343788B2 (en)
JPH0259979A (en) Document image processing device
JPH01201789A (en) character reading device
JPH02166583A (en) character recognition device

Legal Events

DateCodeTitleDescription
LAPSCancellation because of no payment of annual fees

[8]ページ先頭

©2009-2025 Movatter.jp