


Изобретение относится к области представления и распознавания данных на носителях информации, в частности к выполнению носителя информации, используемого с машинами и предназначенного для переноса информации с использованием записей различного вида. The invention relates to the field of presentation and recognition of data on storage media, in particular to the implementation of the storage medium used with machines and designed to transfer information using records of various kinds.
Известен форматированный носитель информации - печатный бланк для автоматизированного ввода в информационную систему, содержащий расположенные в тематической последовательности информационные поля, имеющие изолированные окна для внесения индивидуальной значащей информации (1). A well-known formatted storage medium is known - a printed form for automated input into an information system containing information fields arranged in a thematic sequence having isolated windows for entering individual meaningful information (1).
Недостатками этого носителя информации являются низкая точность распознавания, обусловленная выполнением всех окон в виде прямоугольников, ограниченных непрерывными линиями, и низкая надежность машинного считывания, обусловленная влиянием индивидуальных особенностей заполнения и обращения с документом. The disadvantages of this information carrier are low recognition accuracy due to the execution of all windows in the form of rectangles bounded by continuous lines, and low reliability of machine reading due to the influence of individual characteristics of filling and handling the document.
Известен также форматированный носитель информации - печатный бланк для автоматизированного ввода в информационную систему, содержащий расположенные в тематической последовательности информационные поля, имеющие рубрики постоянной тематической шрифтовой информации и по меньшей мере одно изолированное окно для внесения символа индивидуальной значащей информации, обособленное явными разделителями, имеющими визуальные характеристики, обеспечивающие нахождение окна для его заполнения (2). Also known is a formatted storage medium - a printed form for automated input into an information system, containing information fields arranged in a thematic sequence, having headings of constant thematic font information and at least one isolated window for entering a symbol of individual meaningful information, separated by explicit delimiters having visual characteristics providing the window to fill it (2).
Недостатками этого носителя информации также являются низкая точность считывания и распознавания, обусловленная выполнением заполняемых окон в виде прямоугольников, каждый из которых ограничен прерывистой линией, и низкая надежность машинного считывания, обусловленная влиянием индивидуальных особенностей заполнения и обращения с документом. The disadvantages of this information carrier are also the low accuracy of reading and recognition, due to the execution of filled windows in the form of rectangles, each of which is limited by a dashed line, and the low reliability of machine reading, due to the influence of individual characteristics of filling and handling the document.
Технической задачей изобретения является создание несложного, недорого и удобного для массового воспроизведения и распространения форматированного носителя информации, преимущественно печатного бланка для автоматизированного ввода в информационную систему, помехоустойчивого к реальным многочисленным искажениям, возникающим под влиянием индивидуальных особенностей заполнения и обращения с документом. An object of the invention is to create a simple, inexpensive and convenient for mass reproduction and distribution of a formatted information carrier, mainly a printed form for automated input into an information system, noise-resistant to real numerous distortions arising under the influence of individual characteristics of filling and handling a document.
Технический результат, обеспечивающий решение поставленной задачи, состоит в повышении точности и надежности распознавания, снижении требований к точности ориентации вносимых физическими лицами символов в окнах, снижении доли типографского брака в тираже, а также упрощении и сокращении времени заполнения и обработки. The technical result that provides a solution to the problem is to increase the accuracy and reliability of recognition, reduce the requirements for the accuracy of orientation of characters introduced by individuals in windows, reduce the proportion of printing defects in circulation, as well as simplify and reduce the time of filling and processing.
Сущность изобретения заключается в том, что в форматированном носителе информации, преимущественно печатном бланке для автоматизированного ввода в информационную систему, содержащем расположенные в тематической последовательности информационные поля, имеющие рубрики постоянной тематической шрифтовой информации и по меньшей мере одно изолированное окно для внесения символа индивидуальной значащей информации, обособленное явными разделителями, для достижения указанного технического результата по меньшей мере с двух сторон по меньшей мере одного окна разделители выполнены в виде промежутков, заполненных черно-белым растром, состоящим из печатных знаков, распределенных с интервалами между ними, не меньшими удвоенного максимального линейного размера знаков. The essence of the invention lies in the fact that in a formatted storage medium, mainly a printed form for automated input into an information system, containing information fields arranged in a thematic sequence, having headings of constant thematic font information and at least one insulated window for entering a symbol of individual meaningful information, separated by explicit delimiters, to achieve the specified technical result from at least two sides at least At least one window separators are made in the form of gaps filled with a black and white raster consisting of printed characters distributed at intervals between them no less than twice the maximum linear size of the characters.
Предпочтительно максимальный линейный размер печатных знаков черно-белого растра выбран из условия исключения проявления знака совместно с символом индивидуальной значащей информации, внесенным в это окно, например максимальный линейный размер печатных знаков черно-белого растра не превышает утроенного линейного размера элемента разложения сканера, предназначенного для считывания информации на бланке, и/или максимальный линейный размер печатных знаков черно-белого растра выбран из условия выполнения этих знаков с площадью, не превышающей 3х3 площади элемента разложения сканера, предназначенного для считывания информации на бланке. Preferably, the maximum linear size of the printed characters of the black-and-white raster is selected from the condition for excluding the appearance of the sign together with the individual significant information symbol entered in this window, for example, the maximum linear size of the printed characters of the black-and-white raster does not exceed the tripled linear size of the scanner decomposition element for reading information on the form, and / or the maximum linear size of the printed characters of the black-and-white raster is selected from the condition for the execution of these characters with an area not exceeding The higher 3x3 area of the scanner decomposition element, designed to read information on a form.
В качестве печатных знаков черно-белого растра могут быть нанесены штрихи, регулярно распределенные по строкам, а с разных сторон по меньшей мере одного окна разделители могут быть выполнены в виде промежутков разной ширины, заполненных черно-белым растром, состоящим из печатных знаков. As printed characters of a black-and-white raster, strokes can be applied regularly distributed in rows, and on different sides of at least one window, dividers can be made in the form of gaps of different widths, filled with a black-and-white raster consisting of printed characters.
Кроме того, носитель информации содержит по меньшей мере одно изолированное окно для внесения индивидуальной значащей информации, обособленное явными разделителями в виде линий. In addition, the storage medium contains at least one insulated window for entering individual meaningful information, separated by explicit separators in the form of lines.
При этом по меньшей мере одно изолированное окно предназначено для внесения символа индивидуальной значащей информации в виде метки произвольного вида и по меньшей мере одно изолированное окно, обособленное разделителями в виде промежутков, заполненных черно-белым растром, предназначено для внесения символа индивидуальной значащей информации в виде цифры или буквы, тематическая шрифтовая информация рубрик ориентирована горизонтально, окна для внесения символов индивидуальной значащей информации в виде метки имеют форму квадрата, а окна для внесения символов индивидуальной значащей информации в виде цифры или буквы имеют форму прямоугольника и ориентированы вертикально. At the same time, at least one isolated window is intended for entering a symbol of individual meaningful information in the form of a label of any kind, and at least one isolated window, separated by dividers in the form of gaps filled with a black and white raster, is intended for entering a symbol of individual meaningful information in the form of a digit or letters, thematic font information of the headings is oriented horizontally, windows for entering symbols of individual meaningful information in the form of a label have the shape of a square, and windows for entering symbols of individual meaningful information in the form of numbers or letters are rectangular and vertically oriented.
В обоснованных случаях с трех сторон по меньшей мере одного окна разделители могут быть выполнены в виде промежутков разной ширины, заполненных черно-белым растром, состоящим из печатных знаков, а с одной стороны - в виде прерывистой линии или последовательности печатных знаков. In justified cases, on three sides of at least one window, the dividers can be made in the form of gaps of different widths, filled with a black and white raster consisting of printed characters, and on the one hand in the form of a dashed line or sequence of printed characters.
На фиг. 1 и 2 изображены варианты исполнения форматированного носителя информации, выполненного в виде печатного бланка для автоматизированного ввода в информационную систему; на фиг.3 - увеличенное изображение окон. In FIG. 1 and 2 illustrate embodiments of a formatted information carrier made in the form of a printed form for automated input into an information system; figure 3 is an enlarged image of the windows.
Форматированный носитель информации (документ) представляет собой бланк с выраженной структурой, типичным примером которого может быть вопросник (опросный лист) переписи населения. A formatted storage medium (document) is a form with a pronounced structure, a typical example of which is a census questionnaire (questionnaire).
 Бланк содержит расположенные в тематической последовательности информационные поля 1, 2, 3, 4, 5, 6, 7, 8 (на чертеже обозначены восемь полей), имеющие рубрики 9, 10, 11, 12, 13, 14, 15, 16 постоянной тематической шрифтовой информации, и изолированные окна 17, 18, 19, 20 в форме прямоугольников для внесения символа индивидуальной значащей информации в виде цифры или буквы, обособленные на фиг.1 со всех, а на фиг.2 - с трех сторон явными разделителями в виде промежутков (не обозначены), заполненных черно-белым растром, состоящим из печатных знаков (не обозначены), регулярно (по определенному закону) распределенных с интервалами "Т" между ними в двух направлениях, не меньшими удвоенного максимального линейного размера знаков (см. фиг. 3), выбранного из условия исключения проявления знаков совместно с символами (не обозначены) индивидуальной значащей информации, внесенными в соответствующие окна 17-20. Разделители в виде промежутков, заполненных черно-белым растром (гильошированные мелкоточечные полосы), имеют визуальные характеристики, обеспечивающие нахождение окон 17-20 для заполнения. The form contains
При этом максимальный линейный размер печатных знаков черно-белого растра выполнен таким, что не превышает утроенного линейного размера элемента разложения сканера, предназначенного для считывания и распознавания информации на бланке, и выбран из условия выполнения знаков с площадью (на которую нанесена краска знака), не превышающей 3х3 площади элемента разложения (пикселя) упомянутого сканера. In this case, the maximum linear size of the printed characters of the black-and-white raster is such that it does not exceed the tripled linear size of the scanner decomposition element, intended for reading and recognition of information on the form, and is selected from the condition for performing characters with an area (on which the character is painted), not exceeding 3x3 area of the decomposition element (pixel) of the said scanner.
В качестве печатных знаков черно-белого растра могут быть нанесены знаки произвольной формы, например штрихи или точки любой правильной или неправильной формы, регулярно распределенные по строкам (рядам), а с разных сторон окон 17-20 разделители могут быть выполнены в виде промежутков (полос) разной ширины, заполненных черно-белым растром, состоящим из печатных знаков (фиг. 1). Ряды (строки) знаков в растре смещены друг относительно друга приблизительно на Т/2 - половину расстояния Т между двумя соседними знаками (фиг.3). Смежные (парные) окна на одном поле, т.е. относящиеся к информации, представляемой с помощью двух или более цифр (дата, год, номер региона), разделены промежутками, полностью заполненными черно-белым растром, состоящим из печатных знаков. As printed characters of a black-and-white raster, signs of arbitrary shape can be applied, for example, strokes or dots of any regular or irregular shape, regularly distributed across rows (rows), and on different sides of windows 17-20, separators can be made in the form of gaps (stripes) ) of different widths, filled with a black and white raster consisting of printed characters (Fig. 1). Rows (lines) of characters in the raster are offset relative to each other by approximately T / 2 - half the distance T between two adjacent characters (figure 3). Adjacent (paired) windows on one field, i.e. related to information presented using two or more digits (date, year, region number), separated by gaps completely filled with a black and white raster consisting of printed characters.
 Кроме того, носитель информации содержит изолированные окна 21, 22, 23, 24, 25 в форме квадратов для внесения индивидуальной значащей информации в виде меток, обособленные явными разделителями в виде промежутков (полос) разной ширины, заполненных черно-белым растром, состоящим из печатных знаков (фиг. 1) или в виде линий (фиг.2), и окна 26, 27, 28, предназначенные для словесной индивидуальной значащей информации, обособленные явными разделителями в виде линии. In addition, the storage medium contains
Тематическая шрифтовая информация (текст) рубрик 9-16 полей 1-8 ориентирована горизонтально, а окна 17-20 для внесения символов индивидуальной значащей информации в виде цифры или буквы имеют форму прямоугольника и ориентированы вертикально. Thematic font information (text) of sections 9-16 of fields 1-8 is oriented horizontally, and windows 17-20 for entering symbols of individual meaningful information in the form of numbers or letters are rectangular and vertically oriented.
С трех сторон окон 17-20 разделители могут быть выполнены в виде промежутков разной ширины, заполненных черно-белым растром, состоящим из печатных знаков, а с одной стороны - в виде прерывистой линии, состоящей из тех же или иных печатных знаков (фиг.2). On three sides of windows 17-20, the dividers can be made in the form of gaps of different widths, filled with a black and white raster consisting of printed characters, and on the one hand, in the form of a dashed line consisting of the same or other printed characters (Fig. 2 )
Обработка форматированного носителя информации состоит из двух основных процессов: нахождение полей (сегментация документа) и чтение информации. Эти процессы могут быть выполнены, если поля 1-8 и окна 17-28 полностью определены своими визуальными характеристиками. Processing a formatted storage medium consists of two main processes: finding fields (document segmentation) and reading information. These processes can be performed if fields 1-8 and windows 17-28 are fully defined by their visual characteristics.
Нахождение полей на бланке с однозначно определенным положением полей не представляет сложности. Finding fields on a form with a uniquely defined position of the fields is not difficult.
Задача чтения осложняется множеством факторов: помехами, смещением текста шрифтовой информации в полях, искажениями формы документа в процессе сканирования, неконтролируемыми дефектами в виде разрывов или типографской грязи, механическими повреждениями при складывании, а главное тем, что произвольно вносимые символы могут прилегать к разделителям окон и частично накладываться на них. The task of reading is complicated by many factors: interference, shifting the text of font information in the fields, distortion of the form of the document during scanning, uncontrolled defects in the form of gaps or typographic dirt, mechanical damage during folding, and most importantly, the fact that randomly entered characters can fit on the window dividers and partially overlap them.
При обработке окон 21-25, предназначенных для внесения символа индивидуальной значащей информации в виде метки произвольного вида, частичное наложение этой метки на разделитель во многих случаях не имеет существенного значения, так как при считывании факт наличия метки в окне будет скорее всего установлен и в этом случае. When processing windows 21-25 intended for entering a symbol of individual meaningful information in the form of a label of any kind, the partial overlapping of this label on the separator in many cases is not significant, since when reading the fact of the presence of a label in the window will most likely be established in this case.
Однако наложение на разделители внесенных в окна 17-20 символов индивидуальной значащей информации в виде цифр или букв привело бы к искажению информации, внесенной в бланк, как это и происходит с известными форматированными документами, где разделители выполнены в виде линии. В этом случае линии символа, касаясь, пересекаясь или накладываясь на линии разделителя, могли бы образовать ложное изображение, которое при реальных способах обработки будет считано ошибочно или не считано вообще. Избежать этого в известных аналогах не удается даже при значительном увеличении размеров окна. However, the imposition of individual meaningful information in the form of numbers or letters on the separators of the 17-20 characters entered in the windows would lead to a distortion of the information entered on the form, as is the case with well-known formatted documents, where the separators are made in the form of a line. In this case, the symbol lines, touching, intersecting or overlapping the separator lines, could form a false image, which with real processing methods would be read incorrectly or not at all. In known analogues, this cannot be avoided even with a significant increase in window size.
В настоящем техническом решении наложение линий символов на растр - т.е. на дискретно и, предпочтительно, регулярно распределенные в промежутке печатные знаки разделителя не приводит к существенному искажению значения этих символов и не препятствует правильному считыванию индивидуальной значащей информации в окнах 17-20. Поэтому в необходимых случаях размер окон 17-20 может быть несколько уменьшен. In the present technical solution, the superposition of symbol lines on a raster - i.e. on discretely and preferably regularly spaced apart printed characters of the separator does not lead to a significant distortion of the meaning of these symbols and does not prevent the correct reading of individual meaningful information in windows 17-20. Therefore, in necessary cases, the size of the windows 17-20 can be slightly reduced.
Неконтролируемые дефекты в виде разрывов или типографской грязи, механические повреждения при складывании, сравнимые с размерами печатных знаков растра и интервалов между ними, также не приводят к существенному искажению символов и не препятствуют правильному считыванию индивидуальной значащей информации, что позволяет сократить забракованную по указанным причинам часть тиража. Uncontrolled defects in the form of tears or typographic dirt, mechanical damage during folding, comparable to the size of the printed characters of the raster and the intervals between them, also do not lead to a significant distortion of the characters and do not interfere with the correct reading of individual meaningful information, which allows to reduce the portion of the printout rejected for these reasons .
Таким образом, создан несложный, недорогой и удобный для массового воспроизведения и распространения форматированный носитель информации, преимущественно печатный бланк для автоматизированного ввода в информационную систему, помехоустойчивый к реальным многочисленным искажениям, возникающим под влиянием индивидуальных особенностей заполнения и обращения с документом. Thus, a simple, inexpensive and convenient for mass reproduction and distribution formatted storage medium was created, mainly a printed form for automated input into an information system, noise-resistant to real numerous distortions arising under the influence of individual characteristics of filling and handling a document.
При этом повышены точность и надежность распознавания, снижены требований к точности ориентации вносимых физическими лицами символов в окнах, снижена доля документов, признаваемых недействительными по результатам автоматизированной обработки, снижена доля типографского брака в тираже, а также упрощены и ускорены заполнение и обработка документов. At the same time, the accuracy and reliability of recognition are increased, the requirements for the accuracy of orientation of symbols entered by individuals in windows are reduced, the proportion of documents recognized as invalid by the results of automated processing is reduced, the proportion of printing defects in circulation is reduced, and the filling and processing of documents is simplified and accelerated.
 Источники информации
 1. RU, 17643 (полезная модель), 2001.Sources of information
 1. RU, 17643 (utility model), 2001.
2. RU, 47713 (промышленный образец), 2000. 2. RU, 47713 (industrial design), 2000.
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| RU2001132314/09ARU2212055C2 (en) | 2001-11-30 | 2001-11-30 | Formatted data medium | 
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| RU2001132314/09ARU2212055C2 (en) | 2001-11-30 | 2001-11-30 | Formatted data medium | 
| Publication Number | Publication Date | 
|---|---|
| RU2212055C2true RU2212055C2 (en) | 2003-09-10 | 
| RU2001132314A RU2001132314A (en) | 2004-09-27 | 
| Application Number | Title | Priority Date | Filing Date | 
|---|---|---|---|
| RU2001132314/09ARU2212055C2 (en) | 2001-11-30 | 2001-11-30 | Formatted data medium | 
| Country | Link | 
|---|---|
| RU (1) | RU2212055C2 (en) | 
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US431049A (en)* | 1890-07-01 | Coin-operated picture-exhibitor | ||
| US5295434A (en)* | 1989-09-12 | 1994-03-22 | Toyo Seikan Kaisha, Ltd. | Process for making preliminarily printed formed body | 
| RU2136508C1 (en)* | 1994-09-09 | 1999-09-10 | Леонхард Курц ГмбХ унд Ко. | Visually identifiable optical member | 
| WO2001022358A1 (en)* | 1999-09-17 | 2001-03-29 | Silverbrook Research Pty Ltd | Business card as electronic mail token | 
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| US431049A (en)* | 1890-07-01 | Coin-operated picture-exhibitor | ||
| US5295434A (en)* | 1989-09-12 | 1994-03-22 | Toyo Seikan Kaisha, Ltd. | Process for making preliminarily printed formed body | 
| RU2136508C1 (en)* | 1994-09-09 | 1999-09-10 | Леонхард Курц ГмбХ унд Ко. | Visually identifiable optical member | 
| WO2001022358A1 (en)* | 1999-09-17 | 2001-03-29 | Silverbrook Research Pty Ltd | Business card as electronic mail token | 
| Title | 
|---|
| Система оптического распознавания текстов FineReader Версия 4.0: Руководство пользователя. - М.: ABBYY Software House (BIT Software, Inc.), 1998, с.59-63.* | 
| Publication | Publication Date | Title | 
|---|---|---|
| US5825015A (en) | Machine readable binary codes | |
| US5541396A (en) | Method of representing binary data | |
| AU2010234172B2 (en) | Two-dimensional array code | |
| CN109447216B (en) | Quick and accurate identification two-dimensional code | |
| US9330293B2 (en) | Article with visual code, visual code reading apparatus and information conveying method | |
| US20080311551A1 (en) | Testing Scoring System and Method | |
| US10395155B2 (en) | Billboard containing encoded information | |
| AU2010234173A1 (en) | Two-dimensional array code | |
| CN109522770B (en) | Quick-positioning two-dimensional code | |
| RU2212055C2 (en) | Formatted data medium | |
| CN104736347B (en) | Manufacture the apparatus and method for and safety label of safety label | |
| CN106355121A (en) | Answering system and answering method on basis of two-dimensional code information and directional locations | |
| US6330357B1 (en) | Extracting user data from a scanned image of a pre-printed form | |
| CN109740716B (en) | Two-dimensional code drawing method capable of achieving rapid and accurate identification | |
| CN109615052B (en) | Two-dimensional code with high recognition rate | |
| US3247484A (en) | Character recognition system | |
| JP2575480B2 (en) | Table structuring method | |
| JP5993044B2 (en) | Management data label | |
| JPS6227887A (en) | Character type separation method | |
| JPS6132458Y2 (en) | ||
| Stanco et al. | Automatic braille to black conversion | |
| JP3012970U (en) | Prepaid card with identification code printed | |
| JPS6180477A (en) | Document transcription device | |
| Ruiz Bermúdez et al. | QR Code: Analysis in Depth | |
| CN117636362A (en) | Method, device, equipment and storage medium for multi-mode information labeling | 
| Date | Code | Title | Description | 
|---|---|---|---|
| MM4A | The patent is invalid due to non-payment of fees | Effective date:20031201 | |
| NF4A | Reinstatement of patent | ||
| MM4A | The patent is invalid due to non-payment of fees | Effective date:20201201 |