Movatterモバイル変換


[0]ホーム

URL:


JPS6043556B2 - character reading device - Google Patents

character reading device

Info

Publication number
JPS6043556B2
JPS6043556B2JP55177472AJP17747280AJPS6043556B2JP S6043556 B2JPS6043556 B2JP S6043556B2JP 55177472 AJP55177472 AJP 55177472AJP 17747280 AJP17747280 AJP 17747280AJP S6043556 B2JPS6043556 B2JP S6043556B2
Authority
JP
Japan
Prior art keywords
character
candidate
determination
candidate character
recognition
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired
Application number
JP55177472A
Other languages
Japanese (ja)
Other versions
JPS57100567A (en
Inventor
正人 須田
好勝 中村
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Toshiba Corp
Original Assignee
Tokyo Shibaura Electric Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tokyo Shibaura Electric Co LtdfiledCriticalTokyo Shibaura Electric Co Ltd
Priority to JP55177472ApriorityCriticalpatent/JPS6043556B2/en
Publication of JPS57100567ApublicationCriticalpatent/JPS57100567A/en
Publication of JPS6043556B2publicationCriticalpatent/JPS6043556B2/en
Expiredlegal-statusCriticalCurrent

Links

Classifications

Landscapes

Description

Translated fromJapanese

【発明の詳細な説明】 本発明は読取り文字に対する認識判定不能の回復や読
取りエラーの訂正を簡易に行い得る信頼性の高い文字読
取装置に関する。
DETAILED DESCRIPTION OF THE INVENTION The present invention relates to a highly reliable character reading device that can easily recover from unrecognizability of read characters and correct reading errors.

近時、帳票等に印字された文字マークを自動読取りし
て認識する文字読取装置が広く普及している。
2. Description of the Related Art In recent years, character reading devices that automatically read and recognize character marks printed on forms and the like have been widely used.

またこの種の装置では、一般に読取り判定が不能な文字
に対しては再度の読取りを行わしめることによる回復措
置が講ぜられるようになつている。然乍、読取りエラー
や判定誤りに対しては再読取り等の回復措置が講じられ
ることが殆んどないので、誤判定認識結果がそのまま出
力される不具合があつた。そこで従来より、文字読取り
情報を多値レベルで量子化したり、文字パターンに対”
するビット数を増して処理精度を高めたり、あるいは文
字パターンを構造的に解析、更には誤り訂正符号を併用
する等の工夫が試みられている。このような対策を講じ
ることによつて読取りエラーを著しく低減し得るが、逆
に処理形態が高度て複雑化することが否めなかつた。ま
たこれに伴つて装置構成が複雑化して高価になる故、汎
用性に欠けると云う問題が生じた。また読取り判定不能
に対する回復措置として同一文字を再読取りするにして
もその再読取り制御が煩雑であり、その期間における認
識処理が中断する合ので読取り認識効率が悪くなる等の
問題も生じた。本発明はこのような事情を考慮してなさ
れたもので、その目的とするところは、読取り文字に対
する認識判定不能の回復や読取りエラーの訂正を簡易に
且つ効果的に行い得る信頼性が高く実用性に富んだ文字
読取装置を提供することにある。
Furthermore, in this type of device, recovery measures are generally taken for characters whose reading cannot be determined by re-reading them. However, since recovery measures such as re-reading are rarely taken in response to reading errors or judgment errors, there is a problem in that the erroneous judgment recognition results are output as they are. Therefore, conventional methods have been used to quantize character reading information at a multilevel level, and to
Attempts have been made to improve processing accuracy by increasing the number of bits to be processed, to analyze character patterns structurally, and to use error correction codes in combination. By taking such measures, reading errors can be significantly reduced, but on the contrary, it cannot be denied that the processing form becomes sophisticated and complicated. Further, as a result, the device configuration has become complicated and expensive, resulting in a lack of versatility. Furthermore, even if the same character is re-read as a recovery measure against inability to determine reading, the re-reading control is complicated, and the recognition process is interrupted during that period, resulting in problems such as poor reading recognition efficiency. The present invention has been made in consideration of these circumstances, and its purpose is to provide a highly reliable and practical method that can easily and effectively recover from unrecognizable characters and correct reading errors. The object of the present invention is to provide a character reading device that is rich in character.

即ち本発明は同一文字情報に対する読取りを予め複数回
繰返し行つてその読取り情報に対する前処理認識によつ
て候補文字とその類似度情報をそれぞれ求めてメモリに
格納し、これらの情報を用いて逐次前記文字情報に対す
る総合的な認識処理を、例えば類似度情報の比較処理お
よび認識候補文字データの多数決論理処理によつて行な
うことによつて上記した目的を効果的に達成したもので
ある。以下、図面を参照して本発明の一実施例につき説
明する。
That is, in the present invention, the same character information is repeatedly read a plurality of times in advance, candidate characters and their similarity information are obtained by preprocessing recognition of the read information, and stored in a memory. The above object is effectively achieved by performing comprehensive recognition processing on character information, for example, through comparison processing of similarity information and majority logic processing of recognition candidate character data. Hereinafter, one embodiment of the present invention will be described with reference to the drawings.

第1図は実施例装置の概略構成をブロック化して示した
ものである。
FIG. 1 is a block diagram showing the schematic configuration of an embodiment apparatus.

帳票等の記録媒体に印字された文字情報は、光電変換部
1によつて光学的に検出され、光電変換されて電気信号
として出力される。この電気信号は例えば第2図aに示
すように文字情報の濃度に相当したレベルを有するもの
であり、量子化回路2に供給される。量子化回路2は第
2図a中レベルTHで示す如き像信号に対する量子化レ
ベルを設定しており、このレベルTOにて上記像信号を
同図bに示す如く2値化して量子化している。この量子
化処理は文字情報のパターン全体について行われ、これ
によつて文字パターンが抽出されている。しかして一文
字について前記光電変換部1にて検出され、量子化回路
2を介して量子化された文字パターンの情報は前処理回
路3に導かれて前処理認識される。この前処理回路3は
パターンマッチングやパターン解析等によつて上記読取
り文字に対する候補文字データを求めるもので、従来よ
り種々提唱される各種認一識装置の前処理回路にて構成
される。しかして前処理回路3では、各種の候補文字に
対する文字パターンの類似度計算を行つて、その類似度
結果から第1候補文字データおよび第2候補文字データ
を求め、それらの類似度データと共にメモリ4に書込ん
でいる。この前処理認識と、その認識結果のメモリ4へ
の書込みは、前記記録媒体に印字記録された一行分の文
字情報に対して順次行われる。この一行分の文字読取り
が終了したとき、再度繰返してこの一行分に対する文字
読取りが前記量子化回路2における量子化レベルを変え
て行われ、これによつて同一文字に対する読取りが複数
回繰返して行われる。そして、各認識結果のデー・夕は
、前記一行分の複数の文字にそれぞれ対応して設定され
たメモリ4の所定のアドレスエリアに順次書込まれて保
持される。一方、このメモリ4に格納された認識結果デ
ータは各文字にそれぞれ対応して読取されて編集判定部
5に供給される。
Character information printed on a recording medium such as a form is optically detected by a photoelectric conversion unit 1, photoelectrically converted, and output as an electrical signal. This electrical signal has a level corresponding to the density of character information, for example, as shown in FIG. 2a, and is supplied to the quantization circuit 2. The quantization circuit 2 sets a quantization level for the image signal as shown by level TH in FIG. 2a, and binarizes and quantizes the image signal at this level TO as shown in FIG. 2b. . This quantization process is performed on the entire pattern of character information, thereby extracting the character pattern. Information on a character pattern detected by the photoelectric conversion unit 1 and quantized by the quantization circuit 2 for one character is led to a preprocessing circuit 3 and subjected to preprocessing and recognition. This preprocessing circuit 3 obtains candidate character data for the read character by pattern matching, pattern analysis, etc., and is constituted by preprocessing circuits of various recognition devices that have been proposed in the past. The preprocessing circuit 3 calculates the similarity of character patterns for various candidate characters, obtains first candidate character data and second candidate character data from the similarity results, and stores them together with the similarity data in the memory 3. is written in. This preprocess recognition and the writing of the recognition results into the memory 4 are performed sequentially for one line of character information printed and recorded on the recording medium. When the character reading for one line is completed, character reading for this one line is repeated again by changing the quantization level in the quantization circuit 2, and as a result, reading for the same character is repeated multiple times. be exposed. The data of each recognition result is sequentially written and held in a predetermined address area of the memory 4 set corresponding to each of the plurality of characters for one line. On the other hand, the recognition result data stored in the memory 4 is read corresponding to each character and supplied to the edit determination section 5.

この編集判定部5では、一次判定部6にて上記同一文字
に対する認識結果データからその類似度情報の比較処理
を主体とする一次判定処理を実行し、これによつて求め
られた認識結果(途中結果)をバッファ7に一時的に格
”納している。しかるのちこのバッファ7に格納された
データを参照して2次判定部8は上記結果データに基づ
く認識処理を、例えば多数決論理処理にて更に行つてい
る。この2次判定部7による判定結果は合成回路9に供
給されると共に、3次判定部10に供給されており、こ
の3次判定部10にて再度の認識判定処理がなされてい
る。前記合成回路9はこの第3次判定部10の判定結果
と前記第2次判定部8の判定結果とを選択的に抽出して
バッファ11に最終判定結果として格納している。即ち
、2次判定によつて十分信頼性の高い判定結果が得られ
たとき、その判定結果がバッファ11に格納され、ある
いは上記判定結果の信頼性が十分に確保されない場合に
は、3次判定部10により得られた判定結果が最終結果
としてバッファ11に格納されることになる。次に上述
した装置による文字読取認識の具体例につき説明する。
In this editing judgment unit 5, a primary judgment unit 6 executes a primary judgment process mainly consisting of a comparison process of similarity information from the recognition result data for the same character, and the recognition result obtained thereby (in the middle The result) is temporarily stored in a buffer 7. Then, referring to the data stored in this buffer 7, the secondary judgment unit 8 performs recognition processing based on the result data, for example, in majority logic processing. The determination result by the secondary determination section 7 is supplied to the synthesis circuit 9 and also to the tertiary determination section 10, where the recognition determination process is performed again. The synthesis circuit 9 selectively extracts the judgment result of the tertiary judgment section 10 and the judgment result of the second judgment section 8 and stores them in the buffer 11 as the final judgment result. That is, when a sufficiently reliable judgment result is obtained by the secondary judgment, the judgment result is stored in the buffer 11, or if the reliability of the judgment result is not sufficiently ensured, the tertiary judgment is performed. The determination result obtained by the unit 10 is stored as the final result in the buffer 11. Next, a specific example of character reading recognition by the above-mentioned apparatus will be explained.

第3図は文字読取りに供される帳票12を示すもので、
この帳票12の所定の印字領域13に文字マーク14が
印字記録されている。ここでは1行の文字マーク14に
つき例示してあるが複数行からなるものであつてもよい
。しかしてこれらの文字マーク14は、例えは左側文字
より順次光電変換されて検出され、前処理認識回路3に
より得られた上記文字マーク14に対する認識データが
メモリ4の所定のデータエリアに順次格納される。この
文字の読取り入力は一行分の文字マーク14に亘つて複
数回繰返して、例えば4回行われることは先に説明した
通りである。第4図はメモリ4に格納された認識データ
とこれらの認識データを用いた文字に対する認識判定処
理の手順を示したものである。即ち光電検出され量子化
された文字読取りデータは、前処理認識回路3において
パターンマッチング法等による前処理認識に供される。
この前処理認識によつて読取り文字パターンの複数の類
似した候補文字に対する各類似度がそれぞれ算出される
。これらの類似度情報に基づいて、上記読取り文字パタ
ーンに対する第1候補文字および第2候補文字がそれぞ
れ認識データとして選出される。第1候補文字は、類似
度が最大値となるものとして求められ、第2候補文字と
して類似度が次大値となるものが求られる。この具体例
にあつては、第1番目に読取られたRAョなる文字に対
して、最大類似度値(3563)より第1候補文字RA
Jが選出され、次大類似度値(2331)より第2候補
文字RBJが選出される。そして、これらの候補文字情
報がその類似度値と共にメモリ4の所定のアドレスに格
納される。次に第2番目に読取られたRBJなる文字に
対しては、最大類似度値(4691)より第1候一補文
字0BJが選出され、次大類似度値(3021)より第
2候補文字R8Jが選出される。このようにして一行に
亘る各文字についてはそれぞれ前処理認識がなされ、行
最後の文字Rzョに対して最大類似度値(3316)よ
り第1候補文字Rz,j.次.大類似度値(261E)
より第2候補文字R2ョがそれぞれ選出される。そして
、これらの候補文字情報がその類似度値と共に前記メモ
リ4の所定のアドレスに順次規則的に格納される。従つ
てメモリ4の所定のアドレスエリアには第4図中(1)
!に示すように各候補文字情報がその類似度値と共に順
次格納されることになる。その後、前記文字マーク13
に対して、前記量子化回路12による量子化レベルを変
えて再度読取りが行われる。
Figure 3 shows the form 12 used for character reading.
A character mark 14 is printed and recorded in a predetermined print area 13 of this form 12. Here, one line of character mark 14 is shown as an example, but it may consist of multiple lines. These character marks 14 are sequentially photoelectrically converted and detected, for example starting from the left character, and the recognition data for the character marks 14 obtained by the preprocessing recognition circuit 3 are sequentially stored in a predetermined data area of the memory 4. Ru. As described above, this character reading input is repeated multiple times over one line of character marks 14, for example four times. FIG. 4 shows the recognition data stored in the memory 4 and the procedure for character recognition determination processing using these recognition data. That is, the photoelectrically detected and quantized character reading data is subjected to preprocessing recognition using a pattern matching method or the like in the preprocessing recognition circuit 3.
Through this preprocessing recognition, each degree of similarity for a plurality of similar candidate characters of the read character pattern is calculated. Based on these similarity information, a first candidate character and a second candidate character for the read character pattern are respectively selected as recognition data. The first candidate character is determined to have the maximum similarity value, and the second candidate character is determined to be the character with the next highest similarity value. In this specific example, for the first character read RA, the first candidate character RA is selected based on the maximum similarity value (3563).
J is selected, and the second candidate character RBJ is selected based on the degree of similarity value (2331). The candidate character information is then stored at a predetermined address in the memory 4 together with its similarity value. Next, for the second read character RBJ, the first candidate character 0BJ is selected from the maximum similarity value (4691), and the second candidate character R8J is selected from the maximum similarity value (3021). is selected. In this way, each character on a line is preprocessed and recognized, and the first candidate character Rz,j. Next. Great similarity value (261E)
Then, the second candidate character R2 is selected. These candidate character information and their similarity values are sequentially and regularly stored at predetermined addresses in the memory 4. Therefore, in the predetermined address area of memory 4, (1) in FIG.
! As shown in , each candidate character information is sequentially stored together with its similarity value. After that, the character mark 13
Then, the quantization level by the quantization circuit 12 is changed and reading is performed again.

この場合、第1番目の文字・RAョに対して第1候補文
字RAョが最大類似度(3F′76)として求められ、
第2候補文字R7Jが次大類似度値(1706)として
求められ、先の第1回目の読取り時と異つて認識される
ことがある。このような異りに拘りなく、2回目の読取
りの全文字に対してそれぞれ前処理認識して前記メモリ
4の所定のアドレスエリアに順次第4図中(■)に示す
ように格納する。このアドレスエリアは先のアドレスエ
リアに対応したもので、読取り文字に対して所定のアド
レス関係が設定されていることは云うまでもない。そし
て、このような文字読取り認識が、2回目・3回目と繰
返して行われ、各候補文字情報とその類似度値が(■)
,(■)にノそれぞれ示すようにアドレス対応したメモ
リ4の所定のエリアに順次格納される。次に、上記の如
くメモリ4に格納された候補文字情報およびその類似度
値に基づいて、1次・2次・3次判定による読取り文字
の認識判定処理が.行われる。
In this case, the first candidate character RAyo is determined as the maximum similarity (3F'76) to the first character RAyo,
The second candidate character R7J is determined as the next-largest similarity value (1706) and may be recognized differently from the first reading. Irrespective of such differences, all the characters read for the second time are preprocessed and recognized, and stored in the predetermined address areas of the memory 4 in order as shown in (■) in FIG. This address area corresponds to the previous address area, and it goes without saying that a predetermined address relationship is set for the read characters. Then, such character reading recognition is repeated for the second and third time, and each candidate character information and its similarity value are (■)
, (■), they are sequentially stored in predetermined areas of the memory 4 corresponding to the addresses. Next, based on the candidate character information and its similarity value stored in the memory 4 as described above, recognition and determination processing of the read character is performed using primary, secondary, and tertiary determination. It will be done.

先ず1次判定部6は、各文字に対する第1および第2候
補文字の各類似度値を参照して第1候補文字を抽出する
か否かを判定する。即ち、第1回目の読取りにおける第
1番目の文字RAjに対しては、第1候補文字RAjの
類似度値(3563)と第2候補文字RBJの類似度値
(2331)との差が大なる為、これを類似性無しと判
定して第1候補文字RAJを抽出し、これをバッファ7
の所定アドレスに(■)に示す如く格納する。また第2
回目の読取りにおける最終文字RzJに対するように第
1候補文字Rzョの類似度値(35F′1)と第2候補
文字R2ョの類似度値(3596)とが非常に近接して
いる場合、これを判定不能として不能マーク1?ョをバ
ッファ7の所定アドレスに格納する。このような1次判
定が全候補文字に対してそれぞれ行われ、これにより抽
出された1次候補判定文字情報がアドレス対応してバッ
ファ7に順次格納される。この場合、その類似度値や類
似度差等の情報も併せて格納するようにしておいてもよ
い。しかるのちバッファ7に格納された途中結果である
1次候補判定文字情報に基づいて、2次判定部8による
2次判定が行われることになる。
First, the primary determination unit 6 determines whether or not to extract the first candidate character by referring to each similarity value of the first and second candidate characters for each character. That is, for the first character RAj in the first reading, the difference between the similarity value (3563) of the first candidate character RAj and the similarity value (2331) of the second candidate character RBJ is large. Therefore, it is determined that there is no similarity, the first candidate character RAJ is extracted, and this is stored in buffer 7.
The data is stored at a predetermined address as shown in (■). Also the second
If the similarity value (35F'1) of the first candidate character Rzo and the similarity value (3596) of the second candidate character R2 are very close to each other, as with the final character RzJ in the second reading, this Impossibility mark 1 as undeterminable? The file is stored at a predetermined address in the buffer 7. Such primary determination is performed for all candidate characters, and the extracted primary candidate determination character information is sequentially stored in the buffer 7 in correspondence with the address. In this case, information such as the similarity value and similarity difference may also be stored. Thereafter, the secondary determination unit 8 performs a secondary determination based on the primary candidate determination character information that is an intermediate result stored in the buffer 7.

この2次判定は、同一文字に対して繰返し求められた候
補文字の多数決論理により行われる。即ち、同一文字に
対して選択抽出された1次候補文字のうち同じものが幾
つあるかにより2次判定している。例えばこの場合、4
個の候補文字が全て同じであつたり、あるいはそのうち
の3個が同じく1個のみが異つているときには、多数を
占める候補文字を2次候補文字、つまりこの場合には最
終判定した候補文字としてバッファ11に格納する。ま
た逆に4個の候補文字が相互に異なる場合、4個の候補
文字が全て不能マーク情報である場合には判定不能マー
ク(?)をバッファ11に格納する。更には、第1候補
文字が2つづつ同じものであつたり、判定不能マークが
含まれている場合には前記バッファ11に一時的に判定
不能マーク(?)が格納される。これにより、バッファ
11には(■)に示すように判定結果が格納される。こ
のような判定不能マーク(?)が付された読取り文字に
対して、3次判定部10が3次判定を行うことになる。
この3次判定は、基本的には2次判定と同様な論理によ
つて行われるものであるが、ここでは類似度値を有効に
利用して判定に大きく寄与させることにより行われる。
即ち、メモリ4に格納された候補文字情報に対して判定
不能処理を更に厳しくして行う。具体的には最大類似度
値と次大類似度値の差分値が更に大きいものだけを候補
判定文字情報として取出す等して、その判定不能認識処
理を行わしめる。これによつて例えは第3回目の読取り
における第2番目の文字に対して第1候補文字としてR
DJが抽出されたところ、今度は判定不能として判断さ
れることになる。また第4回目の読取りにおける第2番
目の文字に対しても判定不能なる判断結果が付されるこ
とになる。この結果3次判定部10は、その文字に対し
て、1Bョなる候補文字が2個、判定不能マーク2個か
ら、その最終候補文字がRBョであると云う結果を導き
出す。そしてこの結果をバツーフア11に供給して、先
の判定不能情報と置換して格納する。このような3次判
定が、2次判定により判定不能判断された各文字に対し
てはそれぞれ行われ、最終的にはバッファ11には第4
図中(■)に示すように最終判定候補文字が格納され.
ることになる。尚、3次判定によつても判定不能が解消
されない場合も生じるが、このとき、前記不能判定のレ
ベルを変えて再度3次判定を行うようにしてもよく、ま
た判定不能としてそのまま出力して警報を発するように
してもよい。かくして−3次判定によつて途中バッファ
の判定結果が訂正されていくので信頼性の高い文字認識
判定結果を得ることが可能となる。かくして上述したよ
うに同一文字に対して予め複数回繰返して読取りを行い
、それらの各量子化データから候補文字認識を行つて認
識結果をメモリに格納したのち、これらの認識結果に従
つて1次・2次・3次と多段階に亘つて上記文字に対す
る認識処理を行うことによつて、判定不能文字に対する
回復を非常に効果的に行い得る。
This secondary determination is performed by majority logic of candidate characters repeatedly determined for the same character. That is, a secondary determination is made based on how many of the primary candidate characters selected and extracted for the same character are the same. For example, in this case, 4
If all of the candidate characters are the same, or if three of them are the same and only one is different, the candidate character that occupies the majority is buffered as the secondary candidate character, that is, in this case, the final candidate character. 11. On the other hand, if the four candidate characters are different from each other, and all of the four candidate characters are impossible mark information, an undeterminable mark (?) is stored in the buffer 11. Furthermore, if two of the first candidate characters are the same or if an undeterminable mark is included, an undeterminable mark (?) is temporarily stored in the buffer 11. As a result, the determination result is stored in the buffer 11 as shown in (■). The tertiary determination unit 10 performs tertiary determination on the read characters with such undeterminable marks (?) attached.
This tertiary determination is basically performed using the same logic as the secondary determination, but here it is performed by effectively utilizing the similarity value to make a large contribution to the determination.
That is, the candidate character information stored in the memory 4 is subjected to more severe undeterminable processing. Specifically, only those characters for which the difference value between the maximum similarity value and the next-largest similarity value is larger are extracted as candidate determination character information, and the undeterminable recognition process is performed. This makes the example R as the first candidate character for the second character in the third reading.
When DJ is extracted, it is determined that it cannot be determined this time. Further, the second character in the fourth reading is also given an undeterminable determination result. As a result, the tertiary determination unit 10 derives the result that the final candidate character is RB YO based on the two candidate characters 1B YO and the two undeterminable marks for that character. This result is then supplied to the Batufur 11, where it is replaced with the previous undeterminable information and stored. Such a tertiary determination is performed for each character that is determined to be undeterminable in the secondary determination, and finally the buffer 11 contains the fourth character.
As shown in the figure (■), the final judgment candidate characters are stored.
That will happen. Incidentally, there may be cases where the undeterminable condition is not resolved even with the tertiary determination, but in this case, the level of the undeterminable determination may be changed and the tertiary determination may be performed again, or the undeterminable condition may be output as is. An alarm may be issued. In this way, since the determination result of the intermediate buffer is corrected by the -3rd order determination, it becomes possible to obtain a highly reliable character recognition determination result. Thus, as described above, the same character is read multiple times in advance, candidate characters are recognized from each of these quantized data, and the recognition results are stored in memory. - By performing recognition processing on the above-mentioned characters in multiple stages such as secondary and tertiary, recovery from unidentifiable characters can be performed very effectively.

しかも読取り誤認識に対しても判定不能と判断したり、
あ゛るいは正規の認識状態に回復することができるので
、文字読取り入力された情報を用いた情報処理を効果的
に行うことができる。その上、従来のように判定不能文
字だけを選択的に抽出して再読取りするような制御の煩
雑性もなく、認識処理を円滑に行い得る。しかも候補文
字情報の途中結果を逐次有効利用する合ので総合的に判
断資料が多くなり、信頼性の高い文字認識処理に基づく
文字の読取り入力が可能となる。また装置のシステム構
成がさほど複雑化することもなく、制御系統の構成も簡
単である等の絶大なる効果を奏する。尚、本発明は上記
実施例にのみ限定されるものではない。例えば同一文字
に対する繰返し読取り回数や、一行文字等は仕様に応じ
て定めればよいものであり、類似度値も各種の類似法に
応じてそのアルゴリズムを定めればよい。また量子化レ
ベルは、背景レベルを参酌して設定するようにすれば都
合がよい。また候補文字による文字認識判定のアルゴリ
ズムも仕様に応じて適宜定めればよいものであり、多数
決論理等も種々変形できる。要するに本発明はその要旨
を逸脱しない範囲で種々変形して実施することができる
。図面の簡単な説明図は本発明の一実施例を示すもので
、第1図は装置の概略構成図、第2図は光電変換信号と
その量子化出力を示す図、第3図は文字記録媒体の一例
を示す図、第4図は認識処理形態の一例を示す図である
Moreover, it is judged that it is impossible to judge even if there is a reading error recognition,
Otherwise, the normal recognition state can be restored, so information processing using the information input by character reading can be performed effectively. Moreover, the recognition process can be smoothly performed without the complicated control of selectively extracting only unidentifiable characters and rereading them as in the past. Moreover, since intermediate results of candidate character information are effectively used one after another, the number of judgment materials increases overall, and characters can be read and input based on highly reliable character recognition processing. Further, the system configuration of the device does not become very complicated, and the control system configuration is simple, which is a great advantage. Note that the present invention is not limited only to the above embodiments. For example, the number of repeated readings for the same character, single-line characters, etc. may be determined according to specifications, and the similarity value may also be determined by its algorithm according to various similarity methods. Further, it is convenient if the quantization level is set with consideration of the background level. Furthermore, the algorithm for determining character recognition based on candidate characters may be appropriately determined according to specifications, and the majority logic and the like can be modified in various ways. In short, the present invention can be implemented with various modifications without departing from the gist thereof. Brief explanatory diagrams of the drawings show one embodiment of the present invention, and FIG. 1 is a schematic diagram of the device, FIG. 2 is a diagram showing a photoelectric conversion signal and its quantized output, and FIG. 3 is a character recording diagram. FIG. 4 is a diagram showing an example of a medium, and FIG. 4 is a diagram showing an example of a recognition processing form.

1・・・光電変換部、2・・・量子化回路、3・・・前
処理認識回路、4・・・メモリ、5・・・編集判定部、
6・・・1次判定部、7・・・バッファ(途中結果)、
8・・・2次判定部、9・・・合成回路、10・・・バ
ッファ(最終結果)、11・・・3次判定部。
DESCRIPTION OF SYMBOLS 1... Photoelectric conversion unit, 2... Quantization circuit, 3... Preprocessing recognition circuit, 4... Memory, 5... Edit determination unit,
6... Primary determination section, 7... Buffer (interim result),
8... Secondary determination section, 9... Synthesis circuit, 10... Buffer (final result), 11... Tertiary determination section.

Claims (1)

Translated fromJapanese
【特許請求の範囲】1 印字文字情報を光学的に検出し電気信号として出力
する光電変換手段と、この光電変換手段より出力された
電気信号を複数の異る量子化レベルに従つて夫々2値化
することにより同一印字文字に対する複数の文字パター
ンとして出力する量子化手段と、この量子化手段より出
力された複数の文字パターンに対し予め定められた各種
の候補文字と類似度計算を行うことにより少くとも第1
候補文字、第2候補文字及びこれらの類似度値から成る
認識データを夫々の文字パターンに対して出力する前処
理認識手段と、この前処理認識手段より出力された夫々
の認識データに対し第1及び第2候補文字の類似度値を
比較判定することによりこの第1候補文字を前記複数の
文字パターン夫々に対して抽出するか否か判定する1次
判定手と、この1次判定手段により抽出された第1候補
文字に対し同一の第1候補文字が前記複数分において占
める多数決論理理判定により前記印字文字に該当する第
1候補文字を決定する2次判定手段とを具備したことを
特徴とする文字読取装置。2 2次判定手段の多数論理判定により前記印字文字に
該当する第1候補文字が決定されない場合、1次判定手
段は第1及び第2候補文字の類似度値の比較判定条件を
異らせてこの第1候補文字を抽出するか否か判定するも
のであり、2次判定手段は前記1次判定手段により抽出
された第1候補文字に対して多数決論理判定を繰返すこ
とにより前記印字文字に該当する第1候補文字を決定す
るものである特許請求の範囲第1項記載の文字読取装置
[Claims] 1. A photoelectric conversion means for optically detecting printed character information and outputting it as an electric signal, and converting the electric signal output from the photoelectric conversion means into binary values according to a plurality of different quantization levels. quantization means to output multiple character patterns for the same printed character by quantization, and similarity calculation with various predetermined candidate characters for the multiple character patterns output from this quantization means. at least the first
a preprocessing recognition means for outputting recognition data consisting of a candidate character, a second candidate character, and their similarity value for each character pattern; and a primary determination means for determining whether or not the first candidate character is extracted for each of the plurality of character patterns by comparing and determining similarity values of the second candidate character; and extraction by the first determination means. and a secondary determination means for determining a first candidate character corresponding to the printed character by a majority logical determination that the same first candidate character occupies the plurality of first candidate characters. character reading device. 2. If the first candidate character corresponding to the printed character is not determined by the majority logic determination of the secondary determination means, the primary determination means differs the comparison determination conditions of the similarity values of the first and second candidate characters. It is determined whether or not to extract this first candidate character, and the secondary determination means repeats majority logic determination on the first candidate character extracted by the first determination means to determine whether the first candidate character corresponds to the printed character. 2. The character reading device according to claim 1, wherein the character reading device determines a first candidate character to be read.
JP55177472A1980-12-161980-12-16 character reading deviceExpiredJPS6043556B2 (en)

Priority Applications (1)

Application NumberPriority DateFiling DateTitle
JP55177472AJPS6043556B2 (en)1980-12-161980-12-16 character reading device

Applications Claiming Priority (1)

Application NumberPriority DateFiling DateTitle
JP55177472AJPS6043556B2 (en)1980-12-161980-12-16 character reading device

Publications (2)

Publication NumberPublication Date
JPS57100567A JPS57100567A (en)1982-06-22
JPS6043556B2true JPS6043556B2 (en)1985-09-28

Family

ID=16031508

Family Applications (1)

Application NumberTitlePriority DateFiling Date
JP55177472AExpiredJPS6043556B2 (en)1980-12-161980-12-16 character reading device

Country Status (1)

CountryLink
JP (1)JPS6043556B2 (en)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication numberPriority datePublication dateAssigneeTitle
JPS62219091A (en)*1986-03-191987-09-26Fujitsu LtdCharacter recognizing and deciding system
JP2553608B2 (en)*1988-01-041996-11-13住友電気工業 株式会社 Optical character reader
JP6123265B2 (en)*2012-12-122017-05-10富士通株式会社 Information processing apparatus, vehicle identification method, and vehicle identification program

Also Published As

Publication numberPublication date
JPS57100567A (en)1982-06-22

Similar Documents

PublicationPublication DateTitle
JPH08255211A (en)Decoding device of two-cycle data signal
US4484348A (en)Figure recognizing system
JPS63158678A (en) Inter-word space detection method
JPS6140684A (en)Contour tracking device
US3637993A (en)Transition code recognition system
JPS6043556B2 (en) character reading device
JPH0430070B2 (en)
JPS62111369A (en) Symbol recognition method
JPS6136874A (en)Corrected character processing method for optical character reader
JP2902694B2 (en) Optical character reader
JPS62130362A (en) Disk media defect detection device
JPS60110091A (en)Character recognizing system
JPS5886668A (en)Ocr facsimile system
JP2001283536A (en) Method and apparatus for detecting synchronization signal
JPS5960690A (en)Binary coding device
JP3160458B2 (en) Character reading device and character reading method
JPH0426153B2 (en)
JPS6037649Y2 (en) character reading device
JPS5914078A (en) Form reading device
JPH03122786A (en)Optical character reader
JP2973898B2 (en) Character recognition method and device
JPS59103483A (en)System for discriminating binary value
JPS5897784A (en)Character discriminator
KR19990010213A (en) Character Recognition Method with Improved Matching Speed
JPS63273276A (en)Information recording medium and its reading system

[8]ページ先頭

©2009-2025 Movatter.jp