


















本発明は、振り仮名等のルビを漢字等の被ルビに対して付すための情報処理装置、情報処理方法、情報処理プログラムに関する。The present invention relates ruby such furigana information processing apparatus, information processing method for subjecting against the ruby kanji, etc.,to the information processingprogram.
近年、パソコン等の情報処理装置を用いて、文書(原稿)の入力から文書編集やレイアウト編集等の処理が行われている。このような処理を行う際、読者にとって難解な漢字が文書に含まれていることがあるため、ルビと呼ばれる振り仮名を漢字(以下「被ルビ」という。)に対して付している。 In recent years, processing such as document editing and layout editing is performed from input of a document (original) using an information processing apparatus such as a personal computer. When such processing is performed, kanji characters that are difficult for the reader may be included in the document, so a kana called “ruby” is attached to the kanji (hereinafter referred to as “ruby”).
  しかし、全ての被ルビに対してルビを付し表示すると、読者において読みが分かっている被ルビについてもルビが表示されてしまうため、読者にとってはかえって煩わしく感じてしまう。それを解決するための技術として、特許文献1や特許文献2が開示されている。  However, if ruby is attached to and displayed for all the ruby, the ruby is also displayed for the ruby whose reading is known by the reader, which makes the reader feel troublesome. As a technique for solving this problem,
  特許文献1は、文章データの中からルビ表示対象文字を抽出するための抽出手段と、前記抽出手段によって抽出されたルビ表示対象文字に対して、所定の条件でルビ表示するか否かを判定するための判定手段と、前記文章データを表示する際、前記判定手段によってルビ表示すると判定されたルビ表示対象文字にルビを付加して表示する技術である。  
  また、特許文献2は、文書データを論理的に区分する1以上の論理区分を設定して記憶する論理区分記憶手段と、文書データからルビを付与する候補文字列を抽出するルビ付与候補文字列抽出手段とを有し、論理区分毎に、同一文字列からなる候補文字列については最初に出現する候補文字列をルビ付与対象文字列として判定し、文書データの上記判定されたルビ付与対象文字列にルビを付与する技術である。そして、ルビが付された候補文字列(被ルビ)以外の被ルビについては、ルビ制御コードを削除することによって、ルビを付さないように制御している。
しかしながら、上記特許文献では、組版が変更された場合(例えば、縦組から横組に変更された場合)や文字を修正した場合等、文書や文書のレイアウトが変更された際、再度、全ての被ルビに対してルビを付すための処理が行われるため、ルビを付すための処理効率が悪いという課題がある。 However, in the above-mentioned patent document, when the composition is changed (for example, when the composition is changed from the vertical composition to the horizontal composition) or when the character is corrected, all of the documents and the document layout are changed again. Since processing for attaching ruby is performed on the ruby, there is a problem that processing efficiency for attaching ruby is poor.
  また、上記特許文献では、文書ページにおいて、複数のテキストボックス(例えば、図19に示すテキストボックス10〜30)が含まれる場合や、複数のテキストボックス(枠ともいう)に、縦組の文書や横組の文書が含まれる場合(例えば、図19に示すテキストボックス10,20には縦組の文書が含まれており、テキストボックス30には横組の文書が含まれている場合)等、文書のレイアウトについては考慮されていないため、上記特許文献に開示されている技術では被ルビにルビを付すことが困難であった。  In the above-mentioned patent document, a document page includes a plurality of text boxes (for example,
更に、文書ページに含まれる複数のテキストボックスの配置等(レイアウト)が変更されると、変更されたレイアウト等に基づいて被ルビにルビを付すことが困難であった。 Further, when the arrangement or the like (layout) of a plurality of text boxes included in the document page is changed, it is difficult to add ruby to the ruby based on the changed layout or the like.
  また、上記特許文献では、文書ページに複数のテキストボックスが含まれる場合を想定していないため、文書ページに含まれる複数のテキストボックス間に関係がある場合(例えば、図19に示すテキストボックス10にニュースの概要が記され、テキストボックス20にそのニュースの本文が記され、テキストボックス10とテキストボックス20に記されている内容に関連がある場合)に、被ルビにルビを付すことが困難であった。  Further, since the above patent document does not assume a case where a document page includes a plurality of text boxes, there is a relationship between a plurality of text boxes included in the document page (for example, a
本発明の目的は、ページに配置された、文字が配置された複数の枠の位置に従って、初出の文字を判定する枠の順番を決定し、当該順番でルビを出力する初出の文字を判定し、初出の文字に対してルビを出力する仕組みを提供することにある。An object of the present invention isto determine the order of frames for determining first appearance characters according to the positions of a plurality of frames arranged on a page and where characters are arranged, and to determine the first appearance characters that output ruby in that order. It is to provide amechanism foroutputting ruby for the first character .
  上記目的を達成するため、請求項1の情報処理装置は、文字が配置される枠が配置される位置を示すレイアウト情報を記憶するレイアウト記憶手段と、ルビを出力する初出の文字を判定する範囲を示す範囲情報を設定する設定手段と、前記レイアウト記憶手段に記憶された、前記設定手段で設定された範囲情報に示される範囲に含まれる複数の枠のレイアウト情報から、初出の文字を判定する枠の順番を決定する決定する決定手段と、前記決定手段で決定された順番で、当該複数の枠に配置される、ルビの出力対象の文字の中からルビを出力する初出の文字を判定する判定手段と、前記判定手段で判定された初出の文字に対応するルビを出力する出力手段とを備えることを特徴とする。In order to achieve the above object, the information processing apparatus according to
請求項7の情報処理方法は、文字に対してルビを出力する情報処理装置における情報処理方法であって、前記情報処理装置のレイアウト記憶手段が、文字が配置される枠が配置される位置を示すレイアウト情報を記憶するレイアウト記憶工程と、前記情報処理装置の設定手段が、ルビを出力する初出の文字を判定する範囲を示す範囲情報を設定する設定工程と、前記情報処理装置の決定手段が、前記レイアウト記憶工程で記憶された、前記設定工程で設定された範囲情報に示される範囲に含まれる複数の枠のレイアウト情報から、初出の文字を判定する枠の順番を決定する決定する決定工程と、前記情報処理装置の判定手段が、前記決定工程で決定された順番で、当該複数の枠に配置される、ルビの出力対象の文字の中からルビを出力する初出の文字を判定する判定工程と、前記情報処理装置の出力手段が、前記判定工程で判定された初出の文字に対応するルビを出力する出力工程とを備えることを特徴とする。The information processing method according to claim7 is an information processing method inan information processing apparatus that outputs ruby with respect to acharacter, wherein the layout storage unit of the information processing apparatus determines a position at which a frame in which a character is disposed is disposed. A layout storing step for storing layout information to be displayed, a setting step for setting range information indicating a range in which the setting unit of the information processing device outputs a ruby character, and a determination unit of the information processing device. A determination step of determining a frame order for determining the first character from layout information of a plurality of frames included in the range indicated in the range information set in the setting step, stored in the layout storage step; And the determination means of the information processing device is the first to output ruby from the characters to be output of ruby arranged in the plurality of frames in the order determined in the determining step. A determination step of determining the character of the output means of the information processing apparatus, andan outputting step of outputting a ruby corresponding to the character first appears that the determined at determination step.
請求項13の情報処理プログラムは、情報処理装置を、文字が配置される枠が配置される位置を示すレイアウト情報を記憶するレイアウト記憶手段と、ルビを出力する初出の文字を判定する範囲を示す範囲情報を設定する設定手段と、前記レイアウト記憶手段に記憶された、前記設定手段で設定された範囲情報に示される範囲に含まれる複数の枠のレイアウト情報から、初出の文字を判定する枠の順番を決定する決定する決定手段と、前記決定手段で決定された順番で、当該複数の枠に配置される、ルビの出力対象の文字の中からルビを出力する初出の文字を判定する判定手段と、前記判定手段で判定された初出の文字に対応するルビを出力する出力手段として機能させることを特徴とする。An information processing program according to athirteenth aspect of theinvention shows aninformation processing apparatus that has layout storage means for storing layout information indicating a position where a frame in which a character is placed is arranged, and a range for determining a first character that outputs ruby A setting unit configured to set range information; and a frame for determining a first character from layout information of a plurality of frames included in the range indicated by the range information set by the setting unit and stored in the layout storage unit Determining means for determining the order, and determining means for determining the first character that outputs ruby among the characters to be output of ruby arranged in the plurality of frames in the order determined by the determining means And an output means for outputting ruby corresponding to the first character determined by the determination means .
本発明によれば、ページに配置された、文字が配置された複数の枠の位置に従って、初出の文字を判定する枠の順番を決定し、当該順番でルビを出力する初出の文字を判定し、初出の文字に対してルビを出力することができる。According to the present invention, the order of frames for determining the first appearance character is determined according to the positions of a plurality of frames arranged on the page where the character is arranged, and the first appearance character that outputs ruby in the order is determined. Ruby can be output for the first character.
以下、図面を参照して、本発明の実施の形態を詳細に説明する。 Hereinafter, embodiments of the present invention will be described in detail with reference to the drawings.
図1は、本発明の実施の形態に係る情報処理装置の構成を示すブロック図である。 FIG. 1 is a block diagram showing the configuration of the information processing apparatus according to the embodiment of the present invention.
  図1において、本発明の実施の形態に係る情報処理装置はコンピュータ100であり、コンピュータ100は、CPU101、RAM102、ROM103、入力制御部104、入力部105、表示制御部106、表示部107、外部メモリ制御部108、外部メモリ109及び通信I/F制御部110を備えている。CPU101、RAM102、ROM103、入力制御部104、表示制御部106、外部メモリ制御部108及び通信I/F制御部110はシステムバス112に接続されており、入力制御部104、表示制御部106、外部メモリ制御部108は、それぞれ入力部105、表示部107、外部メモリ109に接続されている。  In FIG. 1, an information processing apparatus according to an embodiment of the present invention is a
  CPU101は、システムバス112に接続された各デバイスを統括的に制御する。また、RAM102は、CPU101の主メモリ、ワークエリア、処理対象となっているジョブの一時退避領域等として機能する。さらに、ROM103は、ブートプログラムが記憶されている。  The
  入力制御部104は、キーボードやマウス等のポインティングデバイスで実現される入力部105からの入力を制御する。また、表示制御部106は、CRTモニタや液晶モニタ等で実現される表示部107による表示を制御する。さらに、外部メモリ制御部108は、CPU101の制御プログラムであるオペレーションシステム(OS)や、コンピュータ100の各種機能を実現するためのプログラム、各種データデータベース(DB)、各種ファイル、各種アプリケーション、各種マスタファイル及びユーザファイル等の各種データを記憶する外部メモリ109へのアクセスを制御する。  The
  外部メモリ109には、さらにコンピュータ100の各種機能を実現するための各種テーブル等が記憶されている。外部メモリ109としては、ハードディスク(HD)やフレキシブルディスク(FD)、PCMCIAカードスロットにアダプタを介して接続可能なコンパクトフラッシュ(登録商標)やスマートメディア等が挙げられる。本実施の形態では、CPU101により外部メモリ109に記録されているプログラムが必要に応じてRAM102にロードされ、該プログラムの制御に基づき、CPU101によって各種の処理が実行される。  The
  また、通信I/F制御部110は、LANやインターネット等のネットワーク111を介して外部機器(不図示)との通信制御処理を実行する。  The communication I /
  図2は、図1のコンピュータ100の機能ブロック図である。  FIG. 2 is a functional block diagram of the
  コンピュータ100は、入力されたプレーンのテキストデータにルビのタグを付加して入力するルビ付テキスト入力手段201と、ルビ付テキストを出力するルビ付テキスト出力手段202と、テキストデータから被ルビを抽出する形態素解析手段203と、ルビの位置情報を作成するルビ位置情報作成手段204と、ルビの位置情報を分類(ソート)するルビ位置情報分類手段205と、ルビの表示条件を変更するルビ表示条件変更手段206と、外部メモリ109に含まれる辞書DB216の内容を検索する辞書検索手段207とを備えている。  The
  外部メモリ109は、ルビ付テキスト情報を記憶するルビ付テキスト記憶部210と、各種設定情報を記憶する各種設定情報記憶部211と、文書データ構造情報を記憶する文書データ構造情報記憶部212と、ルビ位置情報を記憶するルビ位置情報記憶部213と、原稿データを記憶する原稿データ記憶部214と、レイアウト情報を記憶するレイアウト情報記憶部215とを備えている。  The
  図3は、コンピュータ100におけるルビの表示制御が実行されるまでの処理の概略を示す図である。  FIG. 3 is a diagram showing an outline of processing until the ruby display control in the
  図3の原稿データAはプレーンテキストであり、コンピュータ100が原稿データAを入力し(ステップS301)、入力部105を介したユーザによるルビの付与指示を受け付けると(ステップS302)、ルビの表示制御が実行される(ステップS303)。ステップS303のルビの表示制御では、ルビの位置情報の検出及びルビの初出の判断が主として実行される。  The document data A in FIG. 3 is plain text. When the
  また、図3の原稿データAに対して、形態素解析手段203により被ルビを抽出し、アプリケーションにより当該被ルビに自動的にルビのタグを挿入し(ステップS304)、ルビ付テキストを入力すると(ステップS305)、ルビの表示制御が実行される(ステップS303)。  3 is extracted by the
  図3の原稿データBはルビ付テキストであり、コンピュータ100が原稿データBを入力すると(ステップS305)、ルビの表示制御が実行される(ステップS303)。  The document data B in FIG. 3 is ruby-added text. When the
また、原稿データBに対して、形態素解析手段203により被ルビを抽出し、アプリケーションにより当該被ルビに自動的にルビのタグを挿入し(ステップS304)、タグ付テキストが入力されると(ステップS305)、ルビの表示制御が実行される(ステップS303)。このステップS304→ステップS305→ステップS303の流れは、ユーザがタグ付テキストに対してさらにアプリケーションにより自動的にルビのタグを挿入することを望む場合に、実行される処理である。 Further, for the document data B, the ruby is extracted by the morphological analysis means 203, the ruby tag is automatically inserted into the ruby by the application (step S304), and the tagged text is input (step S304). S305), ruby display control is executed (step S303). The flow from step S304 to step S305 to step S303 is a process that is executed when the user desires to automatically insert a ruby tag into the tagged text by the application.
  図4〜7は、コンピュータ100のメイン処理を示すフローチャートである。この処理は、CPU201の制御により実行される。  4 to 7 are flowcharts showing main processing of the
  まず、ルビ付テキスト記憶部210に記憶されているルビ付テキスト情報及びレイアウト情報記憶部215に記憶されているレイアウト情報から文書データ構造情報を作成する(ステップS401)。  First, document data structure information is created from ruby-added text information stored in the ruby-added
ここで、ルビ付テキスト情報とは、既に被ルビに対してルビが付された文書データであって、図8にその一例を示す。図8に示すルビ付きテキスト情報のタグ部分は、「<Ruby>ルビ:被ルビ</Ruby>」となっている。これは被ルビに対するルビが付されていることを示している。ここで、<Ruby0>タグ、<Ruby1>タグ、<Ruby2>タグ、<Ruby3>タグをまとめて<Ruby>タグやタグと呼んでいる。 Here, the ruby-added text information is document data in which ruby is already attached to the ruby, and an example thereof is shown in FIG. The tag portion of the text information with ruby shown in FIG. 8 is “<Ruby> Ruby: Ruby </ Ruby>”. This indicates that a ruby is attached to the ruby. Here, <Ruby0> tag, <Ruby1> tag, <Ruby2> tag, and <Ruby3> tag are collectively called <Ruby> tag and tag.
例えば、図8に示すルビ付テキスト情報の3〜4行目の<Ruby1>とう\きょう\と:東京都</Ruby1>は、東京都という被ルビに対し、「東」には「とう」、「京」には「きょう」、「都」には「と」と、それぞれルビが付されることを示している。「¥」は被ルビの文字毎に付されるルビの分かれ目を示す。このように被ルビの文字ごとに付されるルビをモノルビという。また、5〜6行目の<Ruby1>あした:明日</Ruby1>は、「明日」という被ルビに対し「あした」というルビが付されることを示す。このように被ルビの文字列に付されるルビをグループルビという。 For example, <Ruby1> Tokyo: Ruby </ Ruby1> on the 3rd to 4th lines of the text information with ruby shown in FIG. 8 is “To” , “Kyo” is attached to “Kyoto”, and “City” is attached to “To”. “¥” indicates a ruby break attached to each character of the ruby. Such ruby attached to each character of the ruby is called mono ruby. Also, <Ruby1> Tomorrow: Tomorrow </ Ruby1> on the 5th to 6th lines indicates that the ruby “Tomorrow” is attached to the ruby “Tomorrow”. The ruby attached to the character string of the ruby is called group ruby.
  また、レイアウト情報とは、文書ページのレイアウトに関する情報であって、図9(A)にその一例を示す。図9(A)に示すレイアウト情報には、枠番号901、枠の座標(X)902、枠の座標(Y)903、縦組又は横組を示す組方向904、枠の長さ(X)905、枠の長さ(Y)906及び枠のあるページ番号907が含まれている。また、このレイアウト情報には、更に文字(フォント)の大きさなどが含まれていてもよい。  The layout information is information relating to the layout of the document page, and an example thereof is shown in FIG. The layout information shown in FIG. 9A includes a
図9(B)は、図9(A)に示すレイアウト情報を文書ページにイメージ化した図である。図9(B)のレイアウト情報の枠番号「1」における座標(X,Y)は、(5,5)であり、図9(B)に示すように文書ページの基本座標を(0,0)とすると、(5,5)の位置に枠の左上の頂点がくるように枠が配置される。また、枠番号「1」の枠の組方向は横組みであって、枠の長さ(X)は10であり、枠の長さ(Y)が15である。枠番号「2」における座標(X,Y)は、(17,4)であり、(17,4)の位置に枠の右上の頂点がくるように枠が配置される。これは、枠番号「2」の枠の組方向は縦組みだからである。つまり、座標(X,Y)は、横組みの枠であれば左上の頂点を示し、縦組みの枠であれば右上の頂点を示す。 FIG. 9B is a diagram in which the layout information shown in FIG. 9A is imaged on a document page. The coordinates (X, Y) in the frame number “1” of the layout information in FIG. 9B are (5, 5), and the basic coordinates of the document page are (0, 0) as shown in FIG. 9B. ), The frame is arranged so that the upper left vertex of the frame comes to the position of (5, 5). The frame set direction of the frame number “1” is horizontal, the frame length (X) is 10, and the frame length (Y) is 15. The coordinates (X, Y) in the frame number “2” are (17, 4), and the frame is arranged so that the upper right vertex of the frame comes to the position of (17, 4). This is because the frame direction of frame number “2” is vertical. That is, the coordinates (X, Y) indicate the upper left vertex in a horizontal frame, and indicate the upper right vertex in a vertical frame.
ステップS401の文書データ構造情報の作成処理をより詳細に説明する。 The document data structure information creation processing in step S401 will be described in more detail.
  CPU201は、図8のルビ付テキスト情報と図9(A)のレイアウト情報に基づいて文書ページに文字を配置した際の文字の配置情報(段番号・行番号・章番号など)を算出し(「組版処理」という)、文書データ構造情報を作成する。図10は、文書データ構造情報1000の一例を示す。文書データ構造情報1000は、「ページ」、「グループ」、「リンク」、「枠」、「段」、「行」、「章」、「本文」及び「ルビ」の複数の論理区分に分けられている。  The
  ルビ付テキスト情報とレイアウト情報を組み合わせて配置計算を行うことにより、文字が配置される段番号や行番号が決定される。また、ルビ付テキスト情報には、章などを識別する識別子が含まれているため、該識別子を検出することにより章番号が決定される。この決定された段番号、行番号及び章番号が、それぞれ文書データ構造情報1000の「段」の項目1003、「行」の項目1004及び「章」の項目1005の各欄に記入される。  By performing the layout calculation by combining the text information with ruby and the layout information, the column number or line number where the character is to be arranged is determined. In addition, since the ruby-added text information includes an identifier for identifying a chapter or the like, the chapter number is determined by detecting the identifier. The determined column number, line number, and chapter number are entered in each column of “column”
  文書データ構造情報1000の「ページ」の項目1001の欄にはページ番号が含まれ、「枠」の項目1002の欄にはテキストボックス等の枠番号及び組方向の情報(例えば、縦組みか横組みか等を示す情報)が含まれ、「段」の項目1003の欄には段番号が含まれ、「行」の項目1004の欄には行番号が含まれ、「章」の項目1005の欄には章番号が含まれており、これらの情報は、「本文」の項目1006の各欄の文字がどこに記載されているかの位置情報を示している。  The “page”
  また、「リンク」の項目1014の欄には、文書データが別の枠や別のページに続く場合に、文書データが続く先のリンク先がどこかを示す情報を含んでいる。「グループ」の項目1015の欄には、枠とそれに関連する枠がある場合に、それらを一つのグループとして扱うための情報を含む。例えば、図10に示す枠−1と枠−2とがリンク1によって関連づけられている場合、「グループ」の項目1015の欄には、枠−1と枠−2が一つのグループである旨の情報が含まれる。  The column of the “link”
  「本文」の項目1006の欄には、文書データの全ての文字(被ルビ)が一文字毎に含まれている。「ルビ」の項目1007の欄には、「本文」の項目1006の欄に含まれる被ルビに対応するルビが含まれている。  The column of “text”
  また、「ルビ表示」の項目1008の欄には、「本文」の項目1006に含まれている被ルビを一つのルビ付与対象の文字列とするか否か及びルビを表示するか否かの情報が含まれている。  Also, in the column of “ruby display”
  具体的には、「本文」の項目1006の欄1009に「東」「京」「都」という被ルビが含まれている場合、被ルビに対応するルビが「ルビ」の項目1007の欄1010に「とう」「きょう」「と」とそれぞれ格納されている。また、この3文字(「東」「京」「都」)を一つのルビ付与対象の文字列か否かを「ルビ表示」の項目1008の欄1011で決めている。  Specifically, when the
  図10に示す欄1011の場合では、欄1011が「東京都」で分割されているため、CPU201は「東京都」を一つのルビを表示する文字列として判断する。  In the case of the
  また、文書データ構造情報1000では、ルビを表示するか否かを示す旨の情報を「ルビ表示」の項目1008の欄1011に入力される数値(フラグ)に含んでいるので、CPU201は、この「ルビ表示」項目1008の欄1011に入力される数値を参照することによって、ルビを表示するか否かを判断する。  Further, the document
  欄1011に入力される数値の「0」は、CPU201がプログラムを実行することにより自動的に被ルビにルビが付与されるが、出力される文書にはルビが表示されないことを示し、さらに被ルビに付されるルビのタグが、ルビ付テキスト情報やレイアウト情報の変更に基づいて変更可能であることを示す。また、欄1011に入力される数値が「0」の場合は、ルビ付テキスト情報にタグ<Ruby0>のルビが付されていることを示す。CPU201は、ルビ付テキスト情報のタグ<Ruby0>タグを参照し、該タグに含まれる被ルビは文書データ構造情報の「本文」1006に、また該タグに含まれるルビは「ルビ」1007に入れる。更に該タグが<Ruby0>であれば、文書データ構造情報の「ルビ表示」項目1008に「0」を入れる。その他の<Ruby>についても同様である。  The numerical value “0” input in the
  欄1011に入力される数値の「1」は、CPU201がプログラムを実行することにより自動的に被ルビにルビが付与され、出力される文書にルビが表示されることを示し、さらに被ルビに付されるルビのタグが、ルビ付テキスト情報やレイアウト情報の変更に基づいて変更可能であることを示す。また、欄1011に入力される数値が「1」の場合は、ルビ付テキスト情報にタグ<Ruby1>のルビが付されていることを示す。  The numerical value “1” input in the
  欄1011に入力される数値の「2」は、入力部105を介して強制的に手動で被ルビにルビが付与され、出力される文書にルビが必ず表示されることを示し、さらに被ルビに付されるルビのタグが、ルビ付テキスト情報やレイアウト情報の変更によっても変更不可能であることを示す。また、欄1011に入力される数値が「2」の場合は、ルビ付テキスト情報にタグ<Ruby2>のルビが付されていることを示す。  The numerical value “2” input in the
  欄1011に入力される数値の「3」は、CPU201がプログラムを実行することにより自動的に被ルビにルビが付与され、出力される文書にルビが必ず表示されることを示し、さらに被ルビに付されるルビのタグが、ルビ付テキスト情報やレイアウト情報の変更によっても変更不可能であることを示す。また、欄1011に入力される数値が「3」の場合は、ルビ付テキスト情報にタグ<Ruby3>のルビが付されていることを示す。  The numerical value “3” input in the
  また、欄1009及び欄1010では、「東」(被ルビ)に対して「とう」(ルビ)が、「京」に対して「きょう」が、「都」に対して「と」が、付されている。このようにそれぞれの被ルビに対してルビが付されているものについては、いわゆるモノルビの表示がなされる。  Also, in
  また、欄1013に示すように、「明」「日」に対して、「あす」というルビが付されているものについては、いわゆるグループルビの表示がなされる。  Also, as shown in a
図4のステップS401の処理の終了後、ステップS401で作成された図10に示す文書データ構造情報に基づいて、図11に示すルビ位置情報テーブルを作成する(ステップS402)。 After the process of step S401 in FIG. 4 is completed, the ruby position information table shown in FIG. 11 is created based on the document data structure information shown in FIG. 10 created in step S401 (step S402).
以下、ステップS402の処理の具体例を説明する。 Hereinafter, a specific example of the process of step S402 will be described.
  文書データ構造情報1000の「本文」の項目1006の欄から被ルビを文書データの初めから検索する。  The ruby is searched from the beginning of the document data from the column of the “text”
  そして、「本文」の項目1006から「東京都」(被ルビ)が検索された場合、該検索された「東京都」(被ルビ)をルビ位置情報テーブルの「被ルビ」の項目の欄に格納する。このとき、文書データ構造情報1000の「ルビ表示」の項目1008の欄を参照し、「0」、「1」、「2」、「3」のいずれかの符号が付されていれば、それを検知し、「東京都」をルビの付与対象の文字列として判断する。  When “Tokyo” (covered ruby) is searched from the
  次いで、検索された「東京都」(被ルビ)に対応する「とう」「きょう」「と」(ルビ)を文書データ構造情報1000の「ルビ」の項目507の欄から抽出し、ルビ間に「¥」を加えたルビ文字列をルビ位置情報テーブルの「ルビ(ルビ文字列)」の項目の欄に格納する。  Next, “to”, “today”, “to” (ruby) corresponding to the searched “Tokyo” (ruby) is extracted from the column of “ruby”
  さらに、「本文」の項目1006から検索された被ルビ(「東京都」)の始めの文字(「東」)の位置情報(ページ番号・枠番号・組方向・段番号・行番号・章番号)と、該被ルビに対応するルビを表示するか否かの情報(「ルビ表示」の項目1008の欄に含まれる番号であって、例えば「1」等)を文書データ構造情報1000から抽出し、それぞれルビ位置情報テーブルに格納する。  Furthermore, the position information (page number, frame number, group direction, column number, line number, chapter number) of the first character (“east”) of the ruby (“Tokyo”) retrieved from the “text” item 1006 ) And information indicating whether or not to display the ruby corresponding to the ruby (the number included in the
  ルビ位置情報テーブルの「文字番号」の項目の欄には、「本文」の項目1006から検索された被ルビ(「東京都」)の始めの文字(「東」)が該始めの文字(「東」)の行の中で、何文字目かを示す情報が格納される。  In the “character number” item column of the ruby position information table, the first character (“east”) of the ruby (“Tokyo”) retrieved from the “text”
ルビ位置情報テーブルの「ページ番号」、「グループ」、「組方向」、「枠番号」、「章番号」、「段番号」及び「行番号」の項目の欄には、適宜文書データ構造情報1000のこれらに対応する項目の欄から情報を抽出し、それぞれ格納する。 In the column of “page number”, “group”, “group direction”, “frame number”, “chapter number”, “column number” and “line number” in the ruby position information table, document data structure information Information is extracted from the column of items corresponding to these 1000 and stored respectively.
ステップS402の処理の終了後、図12に示す初出判定範囲情報を外部メモリ109から抽出する(ステップS403)。 After the process of step S402 is completed, the first appearance determination range information shown in FIG. 12 is extracted from the external memory 109 (step S403).
ここで、図12に示す初出判定範囲情報は、ユーザにより予め設定されている情報であって、ルビを付す初出の被ルビをどの単位で判定するかを示す。例えば、初出判定範囲情報の条件が1の場合(条件=1)は、ページ単位で初出の被ルビの判定を行うことを示している。 Here, the first appearance determination range information shown in FIG. 12 is information set in advance by the user, and indicates in which unit the first appearance ruby to which ruby is attached is determined. For example, when the condition of the first appearance determination range information is 1 (condition = 1), it indicates that the first appearance ruby determination is performed in page units.
次いで、ステップS403で抽出された初出判定範囲情報に基づいて、ステップS408〜ステップS410の処理が行われる。 Next, the processing of step S408 to step S410 is performed based on the first appearance determination range information extracted in step S403.
具体的には、ステップS403で抽出された初出判定範囲情報が「ページ単位」と設定されている(条件=1)か否かを判別し(ステップS404)、初出判定範囲情報が「ページ単位」と設定されている(条件=1)場合には、ステップS402で作成されたルビ位置情報テーブルがページ単位で分割し、分割ルビ位置情報テーブルを作成して(ステップS408)、図5のステップS501に進む。ステップS408の処理では、例えば、図11に示すルビ位置情報テーブルが該ルビ位置情報テーブルのページ番号別に分割され、図13に示す2つの分割ルビ位置情報テーブルが作成される。図13(A)は1ページ目でまとめられた分割ルビ位置情報テーブルを示し、図13(B)は2ページ目でまとめられた分割ルビ位置情報テーブルを示す。 Specifically, it is determined whether or not the first appearance determination range information extracted in step S403 is set to “page unit” (condition = 1) (step S404), and the first appearance determination range information is “page unit”. Is set (condition = 1), the ruby position information table created in step S402 is divided page by page to create a divided ruby position information table (step S408), and step S501 in FIG. Proceed to In the process of step S408, for example, the ruby position information table shown in FIG. 11 is divided by the page number of the ruby position information table, and two divided ruby position information tables shown in FIG. 13 are created. FIG. 13A shows a divided ruby position information table grouped on the first page, and FIG. 13B shows a divided ruby position information table grouped on the second page.
  次いで、ステップS404で初出判定範囲情報が「ページ単位」と設定されていない場合(条件≠1)には、ステップS403で抽出された初出判定範囲情報が「見開き単位」と設定されている(条件=2)か否かを判別し(ステップS405)、初出判定範囲情報が「見開き単位」と設定されている(条件=2)には、ステップS402で作成されたルビ位置情報テーブルを見開き単位で分割し、分割ルビ位置情報テーブルを作成し(ステップS409)、図5のステップS501に進む。例えば、図11に示すルビ位置情報テーブルが該ルビ位置情報テーブルの見開きページ番号別に分割され、分割ルビ位置情報テーブルが作成される。ここで、「見開き単位で分割」とは、1ページ|2・3ページ|4・5ページ・・・n−2・n−1ページ|nページ(nは最後のページ数を示し、|は分割の境界を示す)のように1ページと2ページの間で分割され、3ページと4ページ・・・n−1ページとnページの間で分割されることをいう。製本のような見開きで出力する場合には、それに応じたページ間で分割される。  Next, if the first appearance determination range information is not set to “page unit” in step S404 (condition ≠ 1), the first appearance determination range information extracted in step S403 is set to “spread unit” (condition) = 2) or not (step S405), and when the first appearance determination range information is set to “double spread unit” (condition = 2), the ruby position information table created in step S402 is double spread. Dividing and creating a divided ruby position information table (step S409), the process proceeds to step S501 in FIG. For example, the ruby position information table shown in FIG. 11 is divided for each spread page number of the ruby position information table, and a divided ruby position information table is created. Here, “divided by spread unit” means 1 page | 2/3 pages | 4/5 pages ... n-2.n-1 pages | n pages (n indicates the last page number, | It indicates that the page is divided between
次に、初出判定範囲情報が「見開き単位」と設定されていない(条件≠2)には、ステップS403で抽出された初出判定範囲情報が「章単位」と設定されている(条件=3)か否かを判別し(ステップS406)、初出判定範囲情報が「章単位」と設定されている(条件=3)には、ステップS402で作成されたルビ位置情報テーブルを章番号単位で分割し、分割ルビ位置情報テーブルを作成し(ステップS410)、図5のステップS501に進む。例えば、図11に示すルビ位置情報テーブルが該ルビ位置情報テーブルの章番号別に分割され、分割ルビ位置情報テーブルが作成される。 Next, when the first appearance determination range information is not set to “spread unit” (condition ≠ 2), the first appearance determination range information extracted in step S403 is set to “chapter unit” (condition = 3). (Step S406), and when the first appearance determination range information is set to “chapter unit” (condition = 3), the ruby position information table created in step S402 is divided in units of chapter numbers. Then, a divided ruby position information table is created (step S410), and the process proceeds to step S501 in FIG. For example, the ruby position information table shown in FIG. 11 is divided for each chapter number of the ruby position information table, and a divided ruby position information table is created.
続けて、初出判定範囲情報が「章単位」と設定されていない(条件≠3)場合には、ステップS403で抽出された初出判定範囲情報が「文書全体」と設定されている(条件=4)か否かを判別し(ステップS407)、初出判定範囲情報が「文書全体」と設定されている(条件=4)場合には、図5のステップS501に進む一方、初出判定範囲情報が「文書全体」と設定されていない(条件≠4)場合には、本処理を終了する。 Subsequently, when the first appearance determination range information is not set as “chapter unit” (condition ≠ 3), the first appearance determination range information extracted in step S403 is set as “whole document” (condition = 4). ) Or not (step S407). If the first appearance determination range information is set to “whole document” (condition = 4), the process proceeds to step S501 in FIG. If “whole document” is not set (condition ≠ 4), the process is terminated.
次に、図5の処理を説明する。 Next, the process of FIG. 5 will be described.
まず、分割ルビ位置情報テーブル毎に第一キーを被ルビとし、第二キーをルビとしてソート(分類)する(ステップS501)。この処理によって、同一の被ルビのものがまとまるように並べ替えられる又は同一の被ルビに付すルビが同一なものがまとまるように並べ替えられる。 First, for each divided ruby position information table, the first key is sorted (classified) as ruby and the second key is sorted as ruby (step S501). By this process, the same ruby objects are rearranged so as to be collected, or the same ruby attached to the same ruby is rearranged.
次いで、ステップS501でソートされた分割ルビ位置情報テーブルを異なる被ルビ間又は異なるルビ間で分割し、ルビ分割ルビ位置情報テーブルを作成する(ステップS502)。この処理によって、分割ルビ位置情報テーブルを被ルビ別又はルビ別に分類することができる。 Next, the divided ruby position information table sorted in step S501 is divided between different ruby or different ruby to create a ruby divided ruby position information table (step S502). By this processing, the divided ruby position information table can be classified by ruby or ruby.
次に、予め設定された組方向優先順位情報を外部メモリ109から抽出する(ステップS503)。ここで、組方向優先順位情報とは、図14に示す予め設定された情報であって、同一の文書ページに複数の枠があり、それらの枠の組方向が異なる場合、横組みと縦組みのどちらを優先してルビを付すか等の情報である。ここで、図14に示す組方向優先条件情報において、条件1(条件=1)は、縦組みの枠及び横組みの枠にある文字についてそれぞれ別々に初出の判断を行う条件である。また、条件2(条件=2)は、横組みの枠にある文字を優先して初出の判断を行う条件である。また、条件3(条件=3)は、縦組みの枠にある文字を優先して初出の判断を行う条件である。 Next, preset group direction priority order information is extracted from the external memory 109 (step S503). Here, the composition direction priority information is information set in advance as shown in FIG. 14, and when there are a plurality of frames on the same document page and the composition directions of these frames are different, the horizontal composition and the vertical composition are used. This is information such as which one is prioritized for ruby. Here, in the group direction priority condition information shown in FIG. 14, condition 1 (condition = 1) is a condition for making a first appearance determination for each of the characters in the vertical frame and the horizontal frame. Condition 2 (condition = 2) is a condition for preferential determination of characters in a horizontal frame with priority. Condition 3 (Condition = 3) is a condition for performing the first appearance determination by giving priority to the characters in the vertical frame.
次いで、ステップS503で抽出された組方向優先順位情報の条件が「1」と設定されている(条件=1)か否かを判別し(ステップS504)、組方向優先順位情報の条件が「1」と設定されている(条件=1)場合には、ステップS502で作成されたルビ分割ルビ位置情報テーブルを組方向でソートし(ステップS507)、ステップS507でソートされたルビ分割ルビ位置情報テーブルを異なる組方向間で分割し、組方向分割ルビ位置情報テーブルを作成する(ステップS508)。続けて、ステップS508で作成された組方向分割ルビ位置情報テーブルを、図15(A)に示す組方向別ソートキー(A)を用いてソートし(ステップS509)、図6のステップS601に進む。ここで、横組みの組方向分割ルビ位置情報テーブルをソートする場合は、図15に示す組方向別ソートキー(A)の横組みのソートキーを用い、縦組みの組方向分割ルビ位置情報テーブルをソートする場合は、図15に示す組方向別ソートキー(A)の縦組みのソートキーを用いる。 Next, it is determined whether or not the condition of the group direction priority information extracted in step S503 is set to “1” (condition = 1) (step S504), and the condition of the group direction priority information is “1”. ”Is set (condition = 1), the ruby divided ruby position information table created in step S502 is sorted in the set direction (step S507), and the ruby divided ruby position information table sorted in step S507. Are divided between different set directions, and a set direction divided ruby position information table is created (step S508). Subsequently, the group direction divided ruby position information table created in step S508 is sorted using the group direction sorting key (A) shown in FIG. 15A (step S509), and the process proceeds to step S601 in FIG. Here, when sorting the horizontal composition direction division ruby position information table, the horizontal composition sort key (A) shown in FIG. 15 is used to sort the vertical composition direction division ruby position information table. In order to do this, the vertical sort key of the sort direction-specific sort key (A) shown in FIG. 15 is used.
ステップS504で、組方向優先順位情報の条件が「1」と設定されていない(条件≠1)場合には、ステップS503で抽出された組方向優先順位情報の条件が「2」と設定されている(条件=2)か否かを判別し(ステップS505)、組方向優先順位情報の条件が「2」と設定されている(条件=2)場合には、ステップS502で作成されたルビ分割ルビ位置情報テーブルを、図15(B)に示す組方向別ソートキー(B)を用いてソートし(ステップS510)、図6のステップS601に進む。 If the condition of the group direction priority information is not set to “1” in step S504 (condition ≠ 1), the condition of the group direction priority information extracted in step S503 is set to “2”. (Condition = 2) is determined (step S505). If the condition of the group direction priority information is set to “2” (condition = 2), the ruby division created in step S502 is determined. The ruby position information table is sorted using the group direction sorting key (B) shown in FIG. 15B (step S510), and the process proceeds to step S601 in FIG.
ステップS505で、組方向優先順位情報の条件が「2」と設定されていない(条件≠2)場合には、ステップS503で抽出された組方向優先順位情報の条件が「3」と設定されている(条件=3)か否かを判別し(ステップS506)、組方向優先順位情報の条件が「3」と設定されている(条件=3)場合には、ステップS502で作成されたルビ分割ルビ位置情報テーブルを、図15(C)に示す組方向別ソートキー(C)を用いてソートし(ステップS511)、図6のステップS601に進む。一方、ステップS506で、組方向優先順位情報の条件が「3」と設定されていない(条件≠3)場合には、直接図6のステップS601に進む。 If the condition of the group direction priority information is not set to “2” in step S505 (condition ≠ 2), the condition of the group direction priority information extracted in step S503 is set to “3”. (Condition = 3) or not (step S506). If the condition of the group direction priority information is set to “3” (condition = 3), the ruby division created in step S502 The ruby position information table is sorted using the group direction sorting key (C) shown in FIG. 15C (step S511), and the process proceeds to step S601 in FIG. On the other hand, if the condition of the group direction priority information is not set to “3” (condition ≠ 3) in step S506, the process directly proceeds to step S601 in FIG.
ここで、第1キー等の各ソートキーは、ルビ位置情報テーブルなどの行を並び替える際に、どの列のデータを比較するかを示している。まず、第1キーを比較し、次に第2キーを比較する、という比較する優先順位で適用される。ページ番号等の番号を示すキーについては、整数として比較し、昇順に並び替える。また、座標値については、指定の向きを正方向として昇順に並び替える。たとえば、下向きのキーについては、図9(B)の紙面レイアウトにおいて、より下方向に位置する座標がより大きい値と判断する。すなわち、Y座標値については昇順に並び替えられる。また、右向きのキーについては、図9(B)の紙面レイアウトにおいて、より右方向に位置する座標がより大きい値と判断する。すなわち、X座標値については昇順に並び替えられる。また、左向きのキーについては、図9(B)の紙面レイアウトにおいて、より左方向に位置する座標がより大きい値と判断する。すなわち、X座標値については降順に並び替えられる。 Here, each sort key such as the first key indicates which column data is compared when rearranging rows of the ruby position information table or the like. First, the first key is compared, and then the second key is compared. Keys indicating page numbers and the like are compared as integers and rearranged in ascending order. The coordinate values are rearranged in ascending order with the designated direction as the positive direction. For example, with respect to the downward key, it is determined that the coordinates positioned further downward in the paper layout of FIG. 9B are larger values. That is, the Y coordinate values are rearranged in ascending order. For the right-pointing key, it is determined that the coordinates positioned more rightward in the paper layout of FIG. 9B are larger values. That is, the X coordinate values are rearranged in ascending order. For the left-facing key, it is determined that the coordinate located in the left direction is a larger value in the paper layout of FIG. 9B. That is, the X coordinate values are rearranged in descending order.
次に、図6の処理を説明する。 Next, the process of FIG. 6 will be described.
まず、図16に示す表示条件情報を外部メモリ109から抽出する(ステップS601)。図16に示す表示条件情報の条件が「1」の「先頭からの個数指定」とは、初出の被ルビと同一の文字列からなる、初出以外の被ルビについて、幾つまでの被ルビについてルビを付すかを設定した情報である。表示条件情報の条件が「2」の「周期指定」とは、初出の被ルビと同一の文字列からなる被ルビに対して周期的にルビを付すことを設定した情報である。また、どの位の周期でルビを付すかといった情報が含まれている。 First, display condition information shown in FIG. 16 is extracted from the external memory 109 (step S601). The condition of the display condition information shown in FIG. 16 with “1” is “specifying the number from the beginning” means that the ruby is composed of the same character string as the first appearing ruby and the number of rubyes up to how many It is information that sets whether or not. “Cycle designation” with the condition of the display condition information “2” is information in which ruby is periodically added to ruby comprising the same character string as the first appearing ruby. In addition, information such as how often the ruby is attached is included.
次いで、ステップS601で抽出された表示条件情報の条件が「1」に設定されている(条件=1)か否かを判別し(ステップS602)、表示条件情報の条件が「1」に設定されている(条件=1)場合には、組方向分割ルビ位置情報テーブル又はルビ分割ルビ位置情報テーブルに含まれる被ルビの先頭から、表示条件情報の条件で設定された個数まで、組方向分割ルビ位置情報テーブル又はルビ分割ルビ位置情報テーブルの「ルビ表示」の項目の欄を「1」にし、その他の「ルビ表示」の項目の欄を「0」に変更し(ステップS603)、ステップS604に進む。ここで、「ルビ表示」の項目の欄が既に「2」と設定されているものについては変更しない。 Next, it is determined whether or not the condition of the display condition information extracted in step S601 is set to “1” (condition = 1) (step S602), and the condition of the display condition information is set to “1”. (Condition = 1), the group direction divided ruby position from the head of the ruby included in the group direction divided ruby position information table or the ruby divided ruby position information table to the number set in the condition of the display condition information. In the position information table or the ruby divided ruby position information table, the “ruby display” item column is changed to “1”, and the other “ruby display” item columns are changed to “0” (step S603). move on. Here, no change is made for the item in which the item of “ruby display” is already set to “2”.
ステップS601で抽出された表示条件情報の条件が「1」に設定されていない(条件≠1)場合、ステップS601で抽出された表示条件情報の条件が「2」に設定されている(条件=2)か否かを判別し(ステップS604)、表示条件情報の条件が「2」に設定されている(条件=2)場合には、組方向分割ルビ位置情報テーブル又はルビ分割ルビ位置情報テーブルに含まれる被ルビの先頭から、表示条件情報で設定された周期毎に、組方向分割ルビ位置情報テーブル又はルビ分割ルビ位置情報テーブルの「ルビ表示」の項目の欄を「1」にし、その他の「ルビ表示」の項目の欄を「0」に変更し(ステップS605)、ステップS606に進む。ここで、「ルビ表示」の項目の欄が既に「2」と設定されているものについては変更しない。 When the condition of the display condition information extracted in step S601 is not set to “1” (condition ≠ 1), the condition of the display condition information extracted in step S601 is set to “2” (condition = 2) is determined (step S604), and when the condition of the display condition information is set to “2” (condition = 2), the group direction divided ruby position information table or the ruby divided ruby position information table From the head of the ruby included in, set the column of “ruby display” in the group direction divided ruby position information table or the ruby divided ruby position information table to “1” for each period set in the display condition information, and others. The item field of “ruby display” is changed to “0” (step S605), and the process proceeds to step S606. Here, no change is made for the item in which the item of “ruby display” is already set to “2”.
  ステップS604で表示条件情報の条件が「2」に設定されていない(条件≠2)場合、組方向分割ルビ位置情報テーブル又はルビ分割ルビ位置情報テーブルの「ルビ表示」の項目の欄に設定された番号を文書データ構造情報の「ルビ表示」の項目1008の対応する欄に転記する(ステップS606)。これにより、ユーザの期待するルビ表示の情報が文書データ構造情報1000に反映される。  If the condition of the display condition information is not set to “2” in step S604 (condition ≠ 2), it is set in the “ruby display” item column of the grouping direction divided ruby position information table or the ruby divided ruby position information table. The number is transferred to the corresponding field of the “ruby display”
  次いで、ステップS606で転記された文書データ構造情報1000に基づいて、ルビが付された文書データを作成し、出力画面に表示する(ステップS607)。また、ここでルビが付された文書データの印刷ジョブが作成され、印刷装置に出力されてもよい。  Next, based on the document
その後、ステップS907で作成された文書データの文字やレイアウトが変更されたか否かを判別し(ステップS608)、文書データの文字やレイアウトが変更されてない場合には、本処理を終了する一方、文書データの文字やレイアウトが変更された場合には、図7のステップS701に進む。 Thereafter, it is determined whether or not the character or layout of the document data created in step S907 has been changed (step S608). If the character or layout of the document data has not been changed, the present process ends. If the character or layout of the document data is changed, the process proceeds to step S701 in FIG.
次に、図7の処理を説明する。 Next, the process of FIG. 7 will be described.
まず、文書データの文字が変更されたか否かを判別する(ステップS701)。文書データの文字が変更されていない場合、即ち、レイアウトが変更された場合には、図10に示す文書データ構造情報の枠番号や段番号や行番号等が変更され、文書データ構造情報を再作成し(ステップS708)、図4のステップS402に戻る。このとき、レイアウトの変更が、図9(A)のレイアウト情報(座標等)の変更であれば、枠番号と関連付けられた図9(A)のレイアウト情報が変更される。 First, it is determined whether or not the character of the document data has been changed (step S701). If the characters of the document data are not changed, that is, if the layout is changed, the frame number, column number, line number, etc. of the document data structure information shown in FIG. Create (step S708), and return to step S402 in FIG. At this time, if the layout change is the layout information (coordinates, etc.) in FIG. 9A, the layout information in FIG. 9A associated with the frame number is changed.
  ステップS701で文書データの文字が変更された場合には、図10に示す文書データ構造情報1000の「本文」の項目1006の欄の文字が変更される。その変更された文書データ構造情報1000の「本文」の項目1006の欄の文字を、ルビ付きテキスト情報に書き出す(ステップS702)。このとき、変更された文字として識別できるために、変更された文字については、所定の識別子が付されている。  When the character of the document data is changed in step S701, the character in the column of the “text”
次いで、ステップS702で書き出されたルビ付きテキスト情報の変更された文字部分について、形態素解析の処理を行う(ステップS703)。このとき、変更された文字は上記付された識別子により判定される。この形態素解析の処理では被ルビが検出される。 Next, a morphological analysis process is performed on the changed character portion of the text information with ruby written in step S702 (step S703). At this time, the changed character is determined by the identifier attached above. In this morphological analysis process, ruby is detected.
  ステップS703の形態素解析の処理の結果、変更された文字部分から被ルビを検出したか否かを判別し(ステップS704)、変更された文字部分から被ルビを検出した場合には、外部メモリ109に格納されているルビ辞書を用いて、該検出された全ての被ルビに対して、ルビを検索する(ステップS705)。  As a result of the morphological analysis processing in step S703, it is determined whether or not ruby has been detected from the changed character portion (step S704). If ruby is detected from the changed character portion, the
次に、ルビ付テキスト情報に<Ruby>タグを追加することで、ステップS704で検出された全ての被ルビに対して、ステップS705で検索されたルビを付す(ステップS706)。このとき、ルビ付テキスト情報に追加される<Ruby>タグは、<Ruby1>タグである。 Next, by adding a <Ruby> tag to the text information with ruby, the ruby retrieved in step S705 is attached to all the ruby detected in step S704 (step S706). At this time, the <Ruby> tag added to the text information with ruby is the <Ruby1> tag.
  最後に、ルビ付きテキスト情報を文書データ構造情報1000に読み出し、文書データ構造情報1000を再作成し(ステップS707)、ステップS402に戻る。  Finally, the text information with ruby is read into the document
以上詳細に説明したように、本実施の形態によれば、被ルビを含むルビ付テキスト情報及びレイアウト情報に基づいて、複数の論理区分(図10の1001〜1007、1014及び1015)及びルビ出力の項目の欄(図10の1008)を含む文書データ構造情報が作成され(図4のステップS401)、当該ルビ出力の項目の欄の値に基づいて該被ルビに対してルビを出力するか否かが制御され(図6のステップS602〜605)、その制御に基づいて当該ルビが当該被ルビに対して出力されるので(図6のステップS606、607)、文書や文書のレイアウトが変更された際に、再度、全ての被ルビに対してルビを付すための処理が行われず、ルビを付すための処理効率を高めることができる。 As described above in detail, according to the present embodiment, a plurality of logical divisions (1001 to 1007, 1014, and 1015 in FIG. 10) and ruby output based on ruby-added text information including the ruby and layout information. Is created (step S401 in FIG. 4) including the item field (1008 in FIG. 10), and whether ruby is output to the ruby based on the value in the item field of the ruby output. Is controlled (steps S602 to 605 in FIG. 6), and the ruby is output to the ruby based on the control (steps S606 and 607 in FIG. 6), so that the layout of the document or document is changed. When this is done, the processing for attaching ruby is not performed again on all ruby, and the processing efficiency for attaching ruby can be increased.
また、レイアウト情報(図9、図10の1002)がルビ出力の項目の欄を含む文書データ構造情報の作成に反映されて、被ルビに対してルビを出力するか否かが制御されるので、レイアウトに応じてルビが被ルビに付され、読者にとって読み易い文書を作成することができる。 In addition, since layout information (1002 in FIGS. 9 and 10) is reflected in the creation of document data structure information including an item field for ruby output, whether to output ruby for ruby is controlled. The ruby is attached to the ruby according to the layout, and a document easy to read for the reader can be created.
さらに、表示条件情報(図16)に基づいてルビ出力の項目の欄の値が変更されるので、表示条件情報をユーザが設定しておくことで、自動的に被ルビに対してルビを出力するか否かが制御され、ルビを付すための処理効率をより高めることができる。 Furthermore, since the value of the column of the ruby output item is changed based on the display condition information (FIG. 16), the user automatically sets the display condition information to automatically output the ruby for the ruby. Whether or not to do so is controlled, and the processing efficiency for attaching ruby can be further increased.
また、文書データ構造情報に基づいてルビ位置情報テーブルが作成され(図4のステップS402)、作成されたルビ位置情報テーブルを編集して(図4のS408〜S410、図5のS501、S502、S507〜S511、図6のS603、S605)、前記文書データ構造情報に転記する(図6のS606)ことできるので、より読者にとって読み易い文書を作成することができる。 Also, a ruby position information table is created based on the document data structure information (step S402 in FIG. 4), and the created ruby position information table is edited (S408 to S410 in FIG. 4, S501, S502 in FIG. S507 to S511, and S603 and S605 in FIG. 6 can be transferred to the document data structure information (S606 in FIG. 6), so that a document that is easier for the reader to read can be created.
さらにまた、ルビ付テキスト情報又はレイアウト情報が変更されたときには、文書データ構造情報が再作成されるので(図7)、常に読者にとって読み易い文書を提供することができる。 Furthermore, when the ruby-added text information or layout information is changed, the document data structure information is recreated (FIG. 7), so that it is possible to provide a document that is always easy for the reader to read.
以下、図5の変形例を図17を参照しながら説明する。 Hereinafter, a modification of FIG. 5 will be described with reference to FIG.
図5のフローチャートと同一の処理については、同一のステップ番号を付し、その説明は省略する。 The same processes as those in the flowchart of FIG. 5 are denoted by the same step numbers, and description thereof is omitted.
まず、分割ルビ位置情報テーブル毎にキーを被ルビとしてソート(分類)する(ステップS1701)。この処理によって、同一の被ルビのものがまとまるように並べ替えられる。 First, for each divided ruby position information table, the keys are sorted (classified) as ruby (step S1701). By this processing, the same ruby objects are rearranged so as to be collected.
ステップS506でNOの場合又はステップS509〜ステップS511のいずれかの処理が終了した場合には、組方向分割ルビ位置情報テーブルの行番号の項目を昇順に並び替え、ルビの変わり目に相当する行及びそれ以降の行に対応する「ルビ表示」の項目の欄を「3」に変更し(ステップS1702)、図6のステップS601に進む。 If NO in step S506 or if any of steps S509 to S511 is completed, the row number items in the group direction split ruby position information table are rearranged in ascending order, The item column of “ruby display” corresponding to the subsequent lines is changed to “3” (step S1702), and the process proceeds to step S601 in FIG.
ステップS1702の処理を具体的に説明する。ステップS509の処理が終了すると、例えば、図18(A)の組方向分割ルビ位置情報テーブルが取得できる。 The process of step S1702 will be specifically described. When the process of step S509 ends, for example, the group direction division ruby position information table of FIG. 18A can be acquired.
この組方向分割ルビ位置情報テーブルにおいて、2行目のルビは「あした」であり、3行目のルビは「みょう¥にち」であるため、ルビの変わり目に相当する行は、3行目であり、3行目及びそれ以降の6行目に対応する「ルビ表示」の項目の欄を「1」から「3」に変更している。この変更後の組方向分割ルビ位置情報テーブルを示すのが図18(B)である。 In this group direction division ruby position information table, the ruby on the second line is “Ashi”, and the ruby on the third line is “Today”, so the line corresponding to the change of the ruby is the third line. The item column of “ruby display” corresponding to the third line and the sixth line thereafter is changed from “1” to “3”. FIG. 18B shows the group direction divided ruby position information table after this change.
  組方向分割ルビ位置情報テーブルの「ルビ表示」の項目の欄に入力される数値の「3」は、CPU201がプログラムを実行することにより自動的に被ルビにルビが付与され、出力される文書にルビが必ず表示されることを示す。ただし、ルビ付テキスト情報やレイアウト情報の変更によって、再度、表示するか否かを判断する対象となるため、その変更の際には、ルビ付テキスト情報にはタグ<Ruby1>で書き出される。  The numerical value “3” input in the field of “ruby display” item of the group direction division ruby position information table is a document that is output with ruby automatically given to the ruby when the
以上の処理により、1ページに複数行の記載がある文書データにおいて、同一の文字列からなる複数の被ルビに対応する複数のルビが互いに異なることがある場合でも、常に適切なルビ表示がなされ、ユーザの誤読を防ぐことができる。文書データの文字やレイアウトが変更された場合にも、常に適切なルビ表示がなされる。 With the above processing, in document data having a plurality of lines written on one page, even when a plurality of rubies corresponding to a plurality of rubies made of the same character string may be different from each other, appropriate ruby display is always performed. , User misreading can be prevented. Appropriate ruby display is always performed even when the character or layout of the document data is changed.
一般的にルビとは、ルビ表示対象の文字列である被ルビに対して付される文字又は文字列のことをいう。本発明の実施の形態では、一実施例として、漢字を被ルビとして、また、該漢字に対して付される振り仮名をルビとして説明をしたが、これに限定されるものではない。すなわち、英語の文字列が被ルビで、該被ルビに対して付される文字列が日本語の文字列であるといったような場合などでも構わない。 本発明の機能が実行されるものであれば、単体の機器であっても、複数の機器からなるシステムであっても、LAN、WAN等のネットワークを介して接続がなされ処理が行われるシステムであっても、本発明を適用できることは言うまでもない。 In general, ruby refers to a character or character string attached to ruby being a character string to be displayed as a ruby. In the embodiment of the present invention, as an example, a kanji character is described as ruby and a kana character attached to the kanji character is described as ruby. However, the present invention is not limited to this. That is, an English character string may be a ruby and a character string attached to the ruby may be a Japanese character string. As long as the functions of the present invention can be executed, a system that is connected and connected via a network such as a LAN or WAN, whether it is a single device or a system composed of a plurality of devices. Needless to say, the present invention can be applied.
また、本発明の目的は、実施形態の機能を実現するソフトウェアのプログラムコードを記録した記憶媒体を、システム或いは装置に供給し、そのシステム或いは装置のコンピュータ(またはCPUやMPU等)が記憶媒体に格納されたプログラムコードを読み出して実行することによっても達成される。 In addition, an object of the present invention is to supply a storage medium storing software program codes for realizing the functions of the embodiments to a system or apparatus, and a computer (or CPU, MPU, etc.) of the system or apparatus as a storage medium. This can also be achieved by reading and executing the stored program code.
この場合、記憶媒体から読み出されたプログラムコード自体が前述した実施の形態の機能を実現することになり、そのプログラムコード及び該プログラムコードを記憶した記憶媒体は本発明を構成することになる。 In this case, the program code itself read from the storage medium realizes the functions of the above-described embodiments, and the program code and the storage medium storing the program code constitute the present invention.
又、プログラムコードを供給するための記憶媒体としては、例えば、フロッピー(登録商標)ディスク、ハードディスク、光磁気ディスク、CD−ROM、CD−R、CD−RW、DVD−ROM、DVD−RAM、DVD−RW、DVD+RW、磁気テープ、不揮発性のメモリカード、ROM等を用いることができる。または、プログラムコードをネットワークを介してダウンロードしてもよい。 Examples of the storage medium for supplying the program code include a floppy (registered trademark) disk, a hard disk, a magneto-optical disk, a CD-ROM, a CD-R, a CD-RW, a DVD-ROM, a DVD-RAM, and a DVD. -RW, DVD + RW, magnetic tape, nonvolatile memory card, ROM, etc. can be used. Alternatively, the program code may be downloaded via a network.
また、コンピュータが読み出したプログラムコードを実行することにより、上記実施の形態の機能が実現されるだけでなく、そのプログラムコードの指示に基づき、コンピュータ上で稼動しているOS(オペレーティングシステム)等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。 Further, by executing the program code read by the computer, not only the functions of the above-described embodiments are realized, but also an OS (operating system) running on the computer based on the instruction of the program code. A case where part or all of the actual processing is performed and the functions of the above-described embodiments are realized by the processing is also included.
更に、記憶媒体から読み出されたプログラムコードが、コンピュータに挿入された機能拡張ボードやコンピュータに接続された機能拡張ユニットに備わるメモリに書き込まれた後、そのプログラムコードの指示に基づき、その機能拡張ボードや機能拡張ユニットに備わるCPU等が実際の処理の一部または全部を行い、その処理によって前述した実施形態の機能が実現される場合も含まれる。 Further, after the program code read from the storage medium is written in a memory provided in a function expansion board inserted into the computer or a function expansion unit connected to the computer, the function expansion is performed based on the instruction of the program code. This includes the case where the CPU or the like provided in the board or the function expansion unit performs part or all of the actual processing, and the functions of the above-described embodiments are realized by the processing.
100  コンピュータ
101  CPU
102  RAM
103  ROM
104  入力制御部
105  入力部
106  表示制御部
107  表示部
108  外部メモリ制御部
109  外部メモリ
110  通信I/F制御部
111  ネットワーク
112  システムバス100
 102 RAM
 103 ROM
 104
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| JP2004377690AJP4256841B2 (en) | 2004-12-27 | 2004-12-27 | Information processing apparatus, information processing method, and information processing program | 
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| JP2004377690AJP4256841B2 (en) | 2004-12-27 | 2004-12-27 | Information processing apparatus, information processing method, and information processing program | 
| Publication Number | Publication Date | 
|---|---|
| JP2006185147A JP2006185147A (en) | 2006-07-13 | 
| JP4256841B2true JP4256841B2 (en) | 2009-04-22 | 
| Application Number | Title | Priority Date | Filing Date | 
|---|---|---|---|
| JP2004377690AExpired - Fee RelatedJP4256841B2 (en) | 2004-12-27 | 2004-12-27 | Information processing apparatus, information processing method, and information processing program | 
| Country | Link | 
|---|---|
| JP (1) | JP4256841B2 (en) | 
| Publication number | Publication date | 
|---|---|
| JP2006185147A (en) | 2006-07-13 | 
| Publication | Publication Date | Title | 
|---|---|---|
| JP3425408B2 (en) | Document reading device | |
| US20160314104A1 (en) | Methods and systems for efficient and accurate text extraction from unstructured documents | |
| US20070136660A1 (en) | Creation of semantic objects for providing logical structure to markup language representations of documents | |
| JP4502615B2 (en) | Similar sentence search device, similar sentence search method, and program | |
| JPH0765002A (en) | Document processor | |
| JPH0581327A (en) | Information retrieval support processor | |
| JP5446877B2 (en) | Structure identification device | |
| JP2008108114A (en) | Document processing apparatus and document processing method | |
| JP4256841B2 (en) | Information processing apparatus, information processing method, and information processing program | |
| JP2011070529A (en) | Document processing apparatus | |
| KR102375507B1 (en) | Electronic device that supports retrieval of objects from document by matching objects and keywords inserted into document and operating method thereof | |
| JP2009048351A (en) | Information search device, information search method, and information search program | |
| JP4521218B2 (en) | Image forming system, information processing apparatus, image forming apparatus, image forming method, and image forming program | |
| JP3470930B2 (en) | Natural language analysis method and device | |
| CN114997138B (en) | Chemical specification analysis method, device, equipment and readable storage medium | |
| JP3878174B2 (en) | Record extraction method, record extraction device, and record extraction program | |
| JP2007241473A (en) | Information processing apparatus, information processing method, program, and storage medium | |
| JP3022079B2 (en) | Full-text database system | |
| JPH01205265A (en) | document formatting device | |
| JP5151206B2 (en) | Search device and program | |
| JP2002297574A (en) | System and program for kana putting along side chinese characters | |
| JP5262190B2 (en) | Input completion device and input completion program | |
| JP2005122543A (en) | Document layout analysis program, computer-readable storage medium storing document layout analysis program, document layout analysis method, and document layout analysis apparatus | |
| JPH1115826A (en) | Document analysis apparatus and method | |
| JPS63293674A (en) | How to search and display texts | 
| Date | Code | Title | Description | 
|---|---|---|---|
| RD03 | Notification of appointment of power of attorney | Free format text:JAPANESE INTERMEDIATE CODE: A7423 Effective date:20060420 | |
| A621 | Written request for application examination | Free format text:JAPANESE INTERMEDIATE CODE: A621 Effective date:20061227 | |
| A977 | Report on retrieval | Free format text:JAPANESE INTERMEDIATE CODE: A971007 Effective date:20081003 | |
| A131 | Notification of reasons for refusal | Free format text:JAPANESE INTERMEDIATE CODE: A131 Effective date:20081107 | |
| A521 | Written amendment | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20090106 | |
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) | Free format text:JAPANESE INTERMEDIATE CODE: A01 Effective date:20090127 | |
| A01 | Written decision to grant a patent or to grant a registration (utility model) | Free format text:JAPANESE INTERMEDIATE CODE: A01 | |
| A61 | First payment of annual fees (during grant procedure) | Free format text:JAPANESE INTERMEDIATE CODE: A61 Effective date:20090130 | |
| FPAY | Renewal fee payment (event date is renewal date of database) | Free format text:PAYMENT UNTIL: 20120206 Year of fee payment:3 | |
| R150 | Certificate of patent or registration of utility model | Free format text:JAPANESE INTERMEDIATE CODE: R150 | |
| FPAY | Renewal fee payment (event date is renewal date of database) | Free format text:PAYMENT UNTIL: 20130206 Year of fee payment:4 | |
| FPAY | Renewal fee payment (event date is renewal date of database) | Free format text:PAYMENT UNTIL: 20130206 Year of fee payment:4 | |
| FPAY | Renewal fee payment (event date is renewal date of database) | Free format text:PAYMENT UNTIL: 20140206 Year of fee payment:5 | |
| R250 | Receipt of annual fees | Free format text:JAPANESE INTERMEDIATE CODE: R250 | |
| R250 | Receipt of annual fees | Free format text:JAPANESE INTERMEDIATE CODE: R250 | |
| R250 | Receipt of annual fees | Free format text:JAPANESE INTERMEDIATE CODE: R250 | |
| LAPS | Cancellation because of no payment of annual fees |