【0001】[0001]
【発明の属する技術分野】本発明は、日本語多重表記文
書変換方法および装置及び日本語多重表記文書変換プロ
グラムを格納した記憶媒体に係り、特に、コンピュータ
上で、日本語カナまたは、ローマ字を入力した際、入力
された文書と共にローマ字及びカナ/カタカナ表記文書
を自動的に作成し、インターネットなどの通信ネットワ
ーク上で送受信される文書を、どちらの表記方法でも相
互変換しながら表示するための日本語多重表記文書変換
方法および装置及び日本語多重表記文書変換プログラム
を格納した記憶媒体に関する。BACKGROUND OF THE INVENTION 1. Field of the Invention The present invention relates to a method and an apparatus for converting a Japanese multiple transcript document and a storage medium storing a program for converting a Japanese multiple transcript document, and more particularly to inputting Japanese Kana or Roman characters on a computer. When you do this, a Romanized and Kana / Katakana notation document is automatically created together with the input document, and a document sent and received on a communication network such as the Internet can be displayed while converting between them using either notation method. The present invention relates to a multi-notation document conversion method and device and a storage medium storing a Japanese multi-notation document conversion program.
【0002】[0002]
【従来の技術】従来のコンピュータ上で動作する日本語
システムにおいては、日本語カナ、カタカナ、漢字、ア
ルファベット等のうち、作成者により決定された1つの
表記のみが可能である。2. Description of the Related Art In a conventional Japanese system operating on a computer, only one notation determined by a creator among Japanese kana, katakana, kanji, alphabet, and the like is possible.
【0003】[0003]
【発明が解決しようとする課題】しかしながら、上記従
来の日本語システムには、以下のような問題がある。従
来の日本語システムにおいて、一つの文書ファイルは、
作成者の決定した一種類の表記方法でしか表記されず、
読者側では、表記方法は選択できない。これは、日本人
あるいは非母国語として日本語を使用する外国人が日本
語文書を記述/読解する際に、以下の問題点を生む。However, the above-mentioned conventional Japanese language system has the following problems. In the conventional Japanese system, one document file is
It is written only in one type of notation decided by the creator,
The reader cannot choose the notation. This creates the following problems for Japanese or foreigners who use Japanese as a non-native language when writing / reading Japanese documents.
【0004】(1) 非母国語として日本語を使用する
外国人は、日本語独特のカナ、漢字表記のため、記述、
読解するのが困難である。 (2) 以上のような問題に対応するため、アルファベ
ットを利用したローマ字表示法が確立されいるが、ロー
マ字表記された日本語単語の羅列を、日本人が文書とし
て記述・読解するのは容易ではない。(1) Foreigners who use Japanese as their non-native language must write,
Difficult to read. (2) In order to deal with the problems described above, a Roman alphabet display method using the alphabet has been established. However, it is not easy for Japanese to write and read a series of Japanese words written in Roman alphabet as a document. Absent.
【0005】上記の問題点が日本語の国際言語としての
発展の妨げとなっている。本発明は、上記の点に鑑みな
されたもので、日本語カナ/カタカナ表記文書作成と同
時に、ローマ字表記テキストを自動作成が可能な日本語
多重表記文書変換方法および装置及び日本語多重表記文
書変換プログラムを格納した記憶媒体を提供することを
目的とする。The above problems hinder the development of Japanese as an international language. SUMMARY OF THE INVENTION The present invention has been made in view of the above points, and a Japanese multiple notation document conversion method and apparatus and a Japanese multiple notation document conversion method capable of automatically creating a Romanized notation text simultaneously with creation of a Japanese kana / katakana notation document. It is an object to provide a storage medium storing a program.
【0006】また、本発明の目的は、ローマ字表記文書
作成と同時に、日本語カナテキストを自動的に作成可能
な日本語多重表記文書変換方法および装置及び日本語多
重表記文書変換プログラムを格納した記憶媒体を提供す
ることである。また、本発明の目的は、作成されたカナ
/カタカナ、ローマ字表記の二種類のテキストは、単語
毎に関連付けられ、読者の選択によってどちらの表記方
法でも表示可能とする日本語多重表記文書変換方法およ
び装置及び日本語多重表記文書変換プログラムを格納し
た記憶媒体を提供することである。It is another object of the present invention to provide a method and apparatus for converting a Japanese multiple notation document capable of automatically generating a Japanese kana text simultaneously with the creation of a Romanized notation document, and a storage storing a Japanese multiple notation document conversion program. Is to provide a medium. Also, an object of the present invention is to convert two types of texts, i.e., kana / katakana and romaji notation, that are associated with each word and can be displayed in either notation depending on the selection of a reader. And a storage medium storing a Japanese multiple transcript document conversion program.
【0007】更なる本発明の目的は、作成され、関連付
けられた二種類の文書を一つの文書ファイルとして、イ
ンターネットなどのネットワーク上で送受信のやりとり
が可能な日本語多重表記文書変換方法および装置及び日
本語多重表記文書変換プログラムを格納した記憶媒体を
提供することである。A further object of the present invention is to provide a method and an apparatus for converting Japanese multiplex notation documents which can be transmitted and received on a network such as the Internet by using two types of created and associated documents as one document file. An object of the present invention is to provide a storage medium storing a Japanese multiplex notation document conversion program.
【0008】[0008]
【課題を解決するための手段】図1は、本発明の原理を
説明するための図である。本発明(請求項1)は、コン
ピュータ上で作成者により日本語カナ/カタカナ、漢字
または、ローマ字の文字列を入力し、入力された文字列
からローマ字、カナ/カタカナ表記文書を作成し、通信
ネットワーク上で送受信し、取得した文書を表示するた
めの日本語多重表記文書変換方法において、入力された
日本語カナ/カタカナ、漢字文字列または、ローマ字文
字列を表記方法の異なる文書に変換する、または、同一
の表記方法の文書を作成すると共に、単語対応テーブル
を作成し(ステップ1)、変換または、作成された文書
及び単語対応テーブルを多重化文書として通信回線に送
信し(ステップ2)、利用者が多重化文書を受信すると
(ステップ3)、当該多重化文書中の文書を単語対応テ
ーブルを参照して、任意の表記方法に変換して(ステッ
プ4)、表示する(ステップ5)。FIG. 1 is a diagram for explaining the principle of the present invention. According to the present invention (claim 1), a creator inputs a character string of Japanese kana / katakana, kanji or romaji on a computer, creates a romaji / kana / katakana notation document from the input character string, and performs communication. In a Japanese multiple notation document conversion method for displaying received documents transmitted and received over a network, the input Japanese kana / katakana, kanji character strings, or Roman character strings are converted into documents having different notation methods. Alternatively, a document having the same notation is created, a word correspondence table is created (step 1), and the converted or created document and the word correspondence table are transmitted to the communication line as a multiplexed document (step 2). When the user receives the multiplexed document (step 3), the document in the multiplexed document is converted into an arbitrary notation by referring to the word correspondence table. (Step 4), and displays (Step 5).
【0009】本発明(請求項2)は、入力されたローマ
字表記文字列を変換する際に、ローマ字表記文字列を単
語に分割し、単語の先頭文字のみを大文字表記し、単語
の最後尾毎に余白を配置する。本発明(請求項3)は、
入力された文字列を異なる文書に変換する際に、入力さ
れたカナ/カタカナ・漢字表記文字列をローマ字表記文
字列に、ローマ字文字列をカナ/カタカナ・漢字表記文
字列に変換する。According to the present invention (claim 2), when converting the input Roman character notation character string, the Roman character notation character string is divided into words, and only the first character of the word is capitalized, and the last character of each word is written. Place margins on The present invention (claim 3)
When converting the input character string into a different document, the input kana / katakana / kanji notation character string is converted into a roman character notation character string, and the roman character string is converted into a kana / katakana / kanji notation character string.
【0010】本発明(請求項4)は、入力されたカナ文
字列の該当箇所のみを漢字に変換する。本発明(請求項
5)は、利用者が任意の表記方法で表示する際に、漢字
表記が選択された場合に、漢字テキストにローマ字のル
ビを付与して出力する。According to the present invention (claim 4), only the corresponding portion of the input kana character string is converted into kanji. According to the present invention (claim 5), when kanji notation is selected when the user displays the kanji notation in an arbitrary notation method, the kanji text is added with Roman ruby and output.
【0011】図2は、本発明の原理構成図である。本発
明(請求項6)は、コンピュータ上で作成者により入力
されたテキストを受信し表示する際に、同一または、異
なる文書に変換して表示するための日本語多重表記文書
変換装置であって、作成者からローマ字、カナ/カタカ
ナ、または、ローマ字表記文書の入力を受け付ける入力
手段10と、入力された日本語カナ/カタカナ、漢字文
字列または、ローマ字文字列を表記方法の異なる文書に
変換する、または、同一表記の文書を作成すると共に、
単語対応テーブルを作成する送信時変換手段20と、送
信時変換手段20により、変換または、作成された文書
及び単語対応テーブルからなる多重化文書を通信回線に
送信する送信手段30と、送信手段30により送信され
た文書及び単語対応テーブルを利用者が受信する受信手
段50と、受信手段50により受信した多重化文書中の
文書を単語対応テーブルを参照して、任意の表記方法に
変換する受信時変換手段60と、受信時変換手段60に
おいて変換された表記方法で表示する表示手段70とを
有する。FIG. 2 is a diagram showing the principle of the present invention. The present invention (Claim 6) is a Japanese multiple-notation document conversion apparatus for converting a text input by a creator on a computer into a same or different document for display when receiving and displaying the text. Input means 10 for receiving an input of a romanized character, a kana / katakana or a romanized notation document from the creator, and converts the input Japanese kana / katakana, a kanji character string or a romanized character string into a document having a different notation method. , Or create a document with the same notation,
A transmitting-time converting means 20 for generating a word correspondence table, a transmitting means 30 for transmitting a multiplexed document composed of a document converted or generated by the transmitting-time converting means 20 and the word correspondence table to a communication line, and a transmitting means 30 Means for receiving the document and the word correspondence table transmitted by the user by the user, and the receiving means for converting the document in the multiplexed document received by the receiving means 50 into an arbitrary notation by referring to the word correspondence table It has a conversion means 60 and a display means 70 for displaying in the notation converted by the reception time conversion means 60.
【0012】本発明(請求項7)は、送信時変換手段2
0において、ローマ字表記文字列を単語に分割し、単語
の先頭文字のみを大文字表記し、単語の最後尾毎に余白
を配置する手段を含む。本発明(請求項8)は、送信時
変換手段20において、入力されたカナ/カタカナ・漢
字表記文字列をローマ字表記文字列に、ローマ字文字列
をカナ/カタカナ・漢字表記文字列に変換する異表記変
換手段を含む。According to the present invention (claim 7), the transmission time conversion means 2
0, means for dividing the Roman character string into words, capitalizing only the first character of the word, and placing a margin at the end of the word. According to the present invention (claim 8), the transmission time conversion means 20 converts the input kana / katakana / kanji notation character string into a roman character notation character string and converts the input roman character string into a kana / katakana / kanji notation character string. Notation conversion means is included.
【0013】本発明(請求項9)は、異表記変換手段に
おいて、入力されたカナ文字列の該当箇所のみを漢字に
変換する手段を含む。本発明(請求項10)は、表示手
段70において、漢字表記が選択された場合に、漢字テ
キストにローマ字のルビを付与して出力する手段を含
む。According to the present invention (claim 9), the different notation conversion means includes means for converting only a corresponding portion of the input kana character string into kanji. The present invention (Claim 10) includes a means for adding Roman ruby to kanji text and outputting the kanji text when kanji notation is selected on the display means 70.
【0014】本発明(請求項11)は、コンピュータ上
で作成者により入力されたテキストを受信し表示する際
に、同一または、異なる文書に変換して表示するための
日本語多重表記文書変換プログラムを格納した記憶媒体
であって、作成者からローマ字、カナ/カタカナ、また
は、ローマ字表記文書の入力を受け付ける入力プロセス
と、入力された日本語カナ/カタカナ、漢字文字列また
は、ローマ字文字列を表記方法の異なる文書に変換する
または、同一の表記方法の文書を作成すると共に、単語
対応テーブルを作成する送信時変換プロセスと、送信時
変換プロセスにより変換または、作成された文書及び単
語対応テーブルを多重化文書として通信回線に送信させ
る送信プロセスと、送信プロセスにより送信された多重
化文書を受信させる受信プロセスと、受信プロセスによ
り取得した多重化文書の文書を単語対応テーブルを参照
して、任意の表記方法に変換する受信時変換プロセス
と、受信時変換プロセスにおいて変換された表記方法で
表示させる表示プロセスとを有する。According to the present invention (claim 11), a Japanese multiplex notation document conversion program for converting and displaying the same or different documents when receiving and displaying a text input by a creator on a computer. Is a storage medium that stores the input process of accepting the input of a romaji, kana / katakana, or romaji document from the creator, and the input Japanese kana / katakana, kanji character string, or romaji character string. Converting to a document using a different method or creating a document with the same notation method, and creating a word correspondence table, and multiplexing the document and word correspondence table converted or created by the transmission time conversion process. A transmission process to be transmitted to a communication line as a multiplexed document and a multiplexed document transmitted by the transmission process to be received. A receiving process, a receiving conversion process for converting a multiplexed document obtained by the receiving process into an optional notation by referring to the word correspondence table, and a display for displaying the received notation converted in the receiving conversion process Process.
【0015】本発明(請求項12)は、送信時変換プロ
セスにおいて、ローマ字表記文字列を単語に分割し、単
語の先頭文字のみを大文字表記し、単語の最後尾毎に余
白を配置するプロセスを含む。本発明(請求項13)
は、送信時変換プロセスにおいて、入力されたカナ/カ
タカナ・漢字表記文字列をローマ字表記文字列に、ロー
マ字文字列をカナ/カタカナ・漢字表記文字列に変換す
る異表記変換プロセスを含む。According to the present invention (claim 12), in the conversion process at the time of transmission, a process of dividing a Roman character string into words, capitalizing only the first character of the word, and placing a margin at the end of the word is described. Including. The present invention (claim 13)
Includes a different notation conversion process of converting an input kana / katakana / kanji notation character string into a Roman character notation character string and a Roman character string into a kana / katakana / kanji notation character string in a transmission conversion process.
【0016】本発明(請求項14)は、異表記変換プロ
セスにおいて、入力されたカナ文字列の該当箇所のみを
漢字に変換するプロセスを含む。本発明(請求項15)
は、表示プロセスにおいて、漢字表記が選択された場合
に、漢字テキストにローマ字のルビを付与して出力させ
るプロセスを含む。The present invention (claim 14) includes a process of converting only a corresponding portion of an input kana character string into a kanji in the different notation conversion process. The present invention (Claim 15)
Includes a process in which, when a kanji notation is selected in a display process, a roman character ruby is added to the kanji text and output.
【0017】上記のように、本発明では、作成者によっ
て入力された日本語カナ/カタカナ、漢字表記文書と並
行して、新たなローマ字表記文書あるいは、カナ/カタ
カナ、漢字表記文書を作成し、両方の文書間で単語表記
対応表も作成、参照することにより、文書の読者の側で
最適な表記方法で文書表示することができるようにな
る。これにより、非母国語として日本語を使用する外国
人が日本語文書を記述/読解することを容易にする。As described above, according to the present invention, in parallel with the Japanese kana / katakana and kanji notation documents input by the creator, a new Roman alphabet notation document or kana / katakana and kanji notation documents are created. By creating and referring to a word notation correspondence table between both documents, the document reader can display the document in an optimal notation method. This makes it easier for foreigners who use Japanese as their non-native language to write / read Japanese documents.
【0018】また、作成者によって入力されたローマ字
文書も同様に、新たな日本語カナ/カタカナ、漢字表記
文書と単語対応表を同時作成し、文書の読者の側で最適
な表記方法で文書表示することができるようにする。こ
れは、母国語として日本語を使用する日本人がローマ字
表記された日本語単語の羅列を、日本語文章として読解
することを容易にする。Similarly, for a Romanized document input by the creator, a new Japanese Kana / Katakana, Kanji notation document and a word correspondence table are simultaneously created, and the document reader displays the document in an optimal notation method. To be able to. This makes it easier for Japanese who use Japanese as their native language to read a series of Japanese words written in Roman characters as Japanese sentences.
【0019】また、多重表記された日本語文書を、イン
ターネットなどの国や地域を問わない国際的なネットワ
ーク上で送受信することが可能になる。Further, it becomes possible to transmit and receive a multiplexed Japanese document on an international network irrespective of country or region such as the Internet.
【0020】[0020]
【発明の実施の形態】以下の説明中に使用されている
「ローマ字」とは訓令式とヘボン式両方を含むものとす
る。図3は、本発明の日本語多重表記文書変換装置の構
成を示す。同図に示す日本語多重表記文書変換装置10
0は、漢字変換部11を有するテキスト入力部10、テ
キスト変換部20、送信部30、受信部50、データ変
換部60、漢字変換部71を有するテキスト出力部70
及び単語対応テーブル80から構成される。また、当該
日本語多重表記文書変換装置100間には、インターネ
ット等の通信ネットワーク40が介在するものとする。BEST MODE FOR CARRYING OUT THE INVENTION In the following description, the term "Roman alphabet" includes both the instruction type and the Hepbon type. FIG. 3 shows a configuration of the Japanese multiplex document conversion apparatus of the present invention. Japanese multiple notation document conversion device 10 shown in FIG.
0 denotes a text input unit 10 having a kanji conversion unit 11, a text conversion unit 20, a transmission unit 30, a reception unit 50, a data conversion unit 60, and a text output unit 70 having a kanji conversion unit 71.
And a word correspondence table 80. It is assumed that a communication network 40 such as the Internet is interposed between the Japanese multiplex document conversion devices 100.
【0021】テキスト入力部10は、キーボード入力に
応じてカナ/カタカナ、ローマ字を入力する。漢字変換
部11は、入力されたカナを該当箇所のみ漢字に変換す
る。当該漢字変換部11は、変換された漢字を利用者に
提示し、利用者が提示された漢字が希望する漢字である
場合には、“OK”等の指示を行うボタンをクリック
し、希望する漢字でない場合には、“変換”の機能を有
するボタンをクリックすることにより所望の漢字に変換
することが可能である。The text input unit 10 inputs Kana / Katakana and Roman characters in response to keyboard input. The kanji conversion unit 11 converts the input kana into kanji only in the corresponding portion. The kanji conversion unit 11 presents the converted kanji to the user. If the kanji presented by the user is the desired kanji, the user clicks a button for giving an instruction such as “OK” and clicks the desired kanji. If it is not a kanji, it can be converted to a desired kanji by clicking a button having the function of "conversion".
【0022】テキスト変換部20は、テキスト入力部1
0に入力されたカナ/カタカナ・漢字表記テキストをロ
ーマ字表記テキストに、ローマ字テキストをカナ/カタ
カナ・漢字表記テキストに変換し、新規文書として同時
に作成し、双方で単語毎の変換を可能にする単語対応テ
ーブル80を作成する。送信部30は、テキスト入力部
10あるいは、テキスト変換部20で入力された二種類
の文書データと単語対応テーブルを多重化し、文書デー
タとしてインターネットなどの通信回線40に送信す
る。The text conversion unit 20 includes the text input unit 1
Words that convert kana / katakana / kanji notation text entered in 0 to Romanized notation text and Romanized text to kana / katakana / kanji notation text, create them simultaneously as a new document, and enable word-to-word conversion on both sides A correspondence table 80 is created. The transmission unit 30 multiplexes the two types of document data and the word correspondence table input by the text input unit 10 or the text conversion unit 20, and transmits the multiplexed document data to a communication line 40 such as the Internet.
【0023】受信部50は、インターネット等の通信回
線40を介して送信された文書データを受信する。デー
タ変換部60は、受信した文書データを単語対応テーブ
ルとカナ/カタカナ、漢字表記文書とローマ字表記文書
とに変換する。テキスト出力部70は、データ変換部6
0で変換された文書を単語対応テーブル80を参照し、
カナ/カタカナ、ローマ字表記文書として表示する。漢
字変換部71は、テキスト出力部70において、カナ表
記文書内で該当箇所のみ漢字変換する。The receiving section 50 receives the document data transmitted via the communication line 40 such as the Internet. The data conversion unit 60 converts the received document data into a word correspondence table, kana / katakana, kanji notation documents, and romanization notation documents. The text output unit 70 includes the data conversion unit 6
The document converted by 0 is referred to the word correspondence table 80,
Display as Kana / Katakana, Romanized notation document. The kanji conversion unit 71 performs kanji conversion of only the corresponding portion in the kana notation document in the text output unit 70.
【0024】本発明では、テキスト入力部10において
入力されたローマ字あるいは、カナ/カタカナ、漢字で
文書を作成する際に、同時にカナ/カタカナ、漢字ある
いは、ローマ字表記された新規文書と異なる文書間での
単語毎の表記対応表(単語対応テーブル)を当該装置1
00で作成し、相互変換を可能にすることによって、文
書を読み出す際に、ユーザが任意で単語毎に表記方法を
選択することが可能となる。According to the present invention, when a document is created in Roman characters, kana / katakana, and kanji input in the text input unit 10, a new document written in kana / katakana, kanji, or romaji simultaneously differs from a different document. Of the notation correspondence table (word correspondence table) for each word of
By creating the document at 00 and enabling mutual conversion, the user can arbitrarily select a notation method for each word when reading the document.
【0025】なお、上記の構成では、テキスト入力部1
0において、入力された文字列を異表記または、同様の
表記に変換する処理を行っているが、当該テキスト入力
部10は、単に文字列を入力し、形態素解析等の単語を
分割する機能のみとし、テキスト変換部20において、
表記の異なる文字列からなる文書に変換するようにして
もよい。また、文字列としてカナ、カタカナ、ローマ字
が入力された場合には、形態素解析等の後に、作成者に
より任意に指定された単語を漢字変換部11により漢字
に変換(変換ボタン等を使用)して、テキスト変換部2
0に渡すようにしてもよく、同一表記または、異表記に
して、漢字変換を施すか否かは作成者の選択により種々
の変換が可能である。In the above configuration, the text input unit 1
0, a process of converting the input character string into a different notation or a similar notation is performed. However, the text input unit 10 only has a function of simply inputting a character string and dividing words such as morphological analysis. In the text conversion unit 20,
You may make it convert into the document which consists of a character string with a different notation. When a character string such as kana, katakana, or romaji is input, a word arbitrarily designated by the creator is converted into a kanji by the kanji conversion unit 11 (using a conversion button or the like) after morphological analysis or the like. And text converter 2
It may be passed to 0, and various conversions are possible depending on the creator's selection as to whether or not to perform kanji conversion in the same notation or different notation.
【0026】[0026]
【実施例】以下、図面と共に本発明の実施例を説明す
る。図4は、本発明の一実施例の多重日本語表記変換動
作を説明するための図である。ローマ字入力の際に、キ
ーボード等の特定の操作によってテキスト入力部10よ
り入力されたローマ字データは、 『Wagahai Ha Neko De Aru.』 のように、「単語」に分割され、単語の先頭文字のみを
大文字表示し、単語の最後尾毎に余白を配置し、単語の
羅列データとする。ここでテキスト入力部10は、羅列
された単語データをテキスト変換部20に引き渡す。Embodiments of the present invention will be described below with reference to the drawings. FIG. 4 is a diagram for explaining the multiple Japanese notation conversion operation according to one embodiment of the present invention. At the time of inputting the Roman alphabet, the Roman alphabet data input from the text input unit 10 by a specific operation such as a keyboard is described in “Wagahai Ha Neko De Aru. ], Only the first character of the word is displayed in capital letters, a margin is arranged at the end of the word, and the word sequence data is used. Here, the text input unit 10 transfers the listed word data to the text conversion unit 20.
【0027】テキスト変換部20では、引き渡された単
語データをローマ字表記、カナ/カタカナ表記で対応さ
せ、単語対応テーブル80を作成する。単語対応テーブ
ル80の出力例を図5に示す。図5の単語対応テーブル
によって、新規カナ/カタカナ表記文書を作成する。例
えば、「Wagahai」については、カナ=『わがは
い』、カタカナ=『ワガハイ』ローマ字=『Wagah
ai』とし、新規カナ/カタカナ文書として、以下のよ
うな表記文書が生成される。The text conversion unit 20 creates a word correspondence table 80 by associating the delivered word data in Roman alphabet notation and Kana / Katakana notation. An output example of the word correspondence table 80 is shown in FIG. A new Kana / Katakana notation document is created using the word correspondence table of FIG. For example, for “Wagahai”, Kana = “Wagahai”, Katakana = “Wagahai” Roman characters = “Wagah”
ai ”, and the following notation document is generated as a new kana / katakana document.
【0028】「わがはいはねこである。」 「ワガハイハネコデアル。」 「Wagahai Ha Neko De Aru」 が出力される。また、これらの表記に対応する単語対応
テーブル80も出力される。"I am a cat.""Wagahai Haneko Dearu.""Wagahai Ha Neko De Aru" is output. Further, a word correspondence table 80 corresponding to these notations is also output.
【0029】送信部30は、テキスト入力部10で作成
されたローマ字表記文書と、データ変換部20で作成さ
れた単語対応テーブル80及びカナ/カタカナ表記文書
を多重化し、一つのテキストデータとしてインターネッ
トなどの通信ネットワーク上に送信する。受信部50
で、送信されたテキストデータを受け取り、データ変換
部60でローマ字表記文書、単語対応テーブル80、カ
ナ/カタカナ表記文書とに再構成する。The transmitting unit 30 multiplexes the Romanized notation document created by the text input unit 10 with the word correspondence table 80 and the kana / katakana notation document created by the data conversion unit 20 and creates one text data as the Internet or the like. On the communication network. Receiver 50
Then, the transmitted text data is received, and the data conversion unit 60 reconstructs it into a Romanized document, a word correspondence table 80, and a Kana / Katakana document.
【0030】テキスト出力部70では、データ変換部6
0で作成された単語対応テーブル80を参照することに
より、読者側で選択された表記方法で、テキスト表示す
る。また、テキスト出力部70は、漢字変換部71を有
し、漢字変換が可能な該当箇所のみ、漢字変換し、表示
する。単語対応テーブル80の参照により単語毎に表記
方法が選択できる他、出力された漢字テキストにローマ
字ルビを表示することができる。もし、読者側でカナ表
記を選択した場合には、 『わがはいはねこである。』 を出力し、また、カタカナ表記を選択した場合には、 『ワガハイハネコデアル。』 を出力し、ローマ字表記を選択した場合には、 『Wagahai Ha Neko De Aru.』 を出力し、漢字表記を選択した場合には、 『我輩は猫である。』 と共に、利用者が選択した位置に存在する漢字にローマ
字をルビとして付与された、 Neko 『我輩は猫 である。』 のような表記も可能である。上記の例は、『猫』の箇所
に利用者がカーソルを移動し、当該漢字のルビ指定を設
定した場合の例である。In the text output unit 70, the data conversion unit 6
By referring to the word correspondence table 80 created in step 0, the text is displayed in the notation selected by the reader. Further, the text output unit 70 has a kanji conversion unit 71, and performs kanji conversion and displays only the applicable portions where kanji conversion is possible. By referring to the word correspondence table 80, a notation method can be selected for each word, and romaji ruby can be displayed on the output kanji text. If the reader selects Kana notation, "My cat is a cat. Is output, and if Katakana notation is selected, "Wagahaihanekodearu. Is output and if the Romanized notation is selected, the message “Wagahai Ha Neko De Aru. Is output and if you select kanji notation, you are a cat. Along with a roman character as ruby for the kanji present at the position selected by the user, Neko: "I am acat . ] Is also possible. The above example is an example in a case where the user moves the cursor to the location of “cat” and sets the ruby designation of the kanji.
【0031】また、上記の実施例では、ローマ字入力を
例として説明したが、カナ、カタカナであっても、前述
のように、作成者の意図により同一表記、漢字変換が施
された意表記を含めて種々アレンジが可能である。な
お、上記のように変換されたローマ字表記文書を音声処
理技術に適用し、文書を自動的に音声で読み上げること
も可能となる。In the above embodiment, Roman character input has been described as an example. However, even in the case of kana and katakana, as described above, the same notation and the meaning notation converted into kanji by the creator's intention are used. Various arrangements are possible including this. In addition, it is also possible to apply the Romanized document converted as described above to the voice processing technology and automatically read out the document by voice.
【0032】また、変換された文書をCD−ROMやフ
ロッピー等に格納し、これを読者に配布することによ
り、ネットワークを用いて通信する以外にもスタンドア
ロンで変換された文書を利用することが可能である。ま
た、上記の実施例では、図3の構成に基づいて説明した
が、この例に限定されることなく、同図に示す構成要素
をプログラムとして構築し、本発明を実施するコンピュ
ータのディスク装置や、フロッピーディスクやCD−R
OM等の可搬記憶媒体に格納しておき、本発明を実施す
る際にインストールすることにより容易に本発明を実現
できる。Further, by storing the converted document on a CD-ROM, a floppy or the like and distributing it to readers, it is possible to use the converted document in a stand-alone manner in addition to communicating via a network. It is. Although the above embodiment has been described based on the configuration of FIG. 3, the present invention is not limited to this example, and the components shown in FIG. , Floppy disk or CD-R
The present invention can be easily realized by storing it in a portable storage medium such as an OM and installing it when implementing the present invention.
【0033】なお、本発明は、上記の実施例に限定され
ることなく、特許請求の範囲内で種々変更・応用が可能
である。The present invention is not limited to the above embodiment, but can be variously modified and applied within the scope of the claims.
【0034】[0034]
【発明の効果】上述のように、本発明によれば、以下の
ような効果を奏する。 ・本来表示文字である日本語カナ/カタカナ・漢字を、
表音文字であるアルファベットを利用したローマ字表記
に、ユーザの任意によって変換・表示させることができ
る。As described above, according to the present invention, the following effects can be obtained.・ Japanese kana / katakana / kanji, which are originally displayed characters,
It can be converted and displayed in Roman alphabet notation using the alphabet that is a phonetic character by the user.
【0035】・表音表記であるローマ字表記文書を、表
意表記である日本語カナ/カタカナ表記に変換し、表示
することができる。 ・表示文字でるという日本語の特殊性を補完することに
より、日本語の国際言語としての発展に寄与する。 ・インターネット等の通信ネットワークだけでなく、C
D−ROM等の異なるメディア上でも利用することが可
能であり、文書作成者と読者とのインタフェースを取る
ことが容易になる。It is possible to convert a Roman notation document, which is a phonetic notation, into a Japanese kanji / katakana notation, which is an ideographic notation, and display it. -Contribute to the development of Japanese as an international language by complementing the special character of Japanese that is displayed characters. -Not only communication networks such as the Internet, but also C
It can be used on different media such as a D-ROM, and it is easy to take an interface between a document creator and a reader.
【0036】・ローマ字表記文書を音声処理技術と組み
合わせれば、文書を自動的に音声で読み上げることが可
能となり、日本語の会話能力から記述能力、あるいは、
記述能力から会話能力を向上させることが容易になる。When a Romanized document is combined with speech processing technology, the document can be automatically read aloud by speech.
It is easy to improve conversation ability from writing ability.
【図1】本発明の原理を説明するための図である。FIG. 1 is a diagram for explaining the principle of the present invention.
【図2】本発明の原理構成図である。FIG. 2 is a principle configuration diagram of the present invention.
【図3】本発明の日本語多重表記文書変換装置の構成図
である。FIG. 3 is a configuration diagram of the Japanese multiplex notation document conversion device of the present invention.
【図4】本発明の一実施例の多重日本語表記変換動作を
説明するための図である。FIG. 4 is a diagram for explaining a multiple Japanese notation conversion operation according to one embodiment of the present invention.
【図5】本発明の一実施例の単語対応テーブルの例であ
る。FIG. 5 is an example of a word correspondence table according to one embodiment of the present invention.
10 入力手段、テキスト入力部 11 漢字変換部 20 送信時変換手段、テキスト変換部 30 送信手段、送信部 40 インターネット(通信ネットワーク) 50 受信手段、受信部 60 受信時変換手段、データ変換部 70 表示手段、テキスト出力部 71 漢字変換部 80 単語対応テーブル REFERENCE SIGNS LIST 10 input means, text input section 11 kanji conversion section 20 transmission conversion section, text conversion section 30 transmission section, transmission section 40 Internet (communication network) 50 reception section, reception section 60 reception conversion section, data conversion section 70 display section Text output unit 71 Kanji conversion unit 80 Word correspondence table
───────────────────────────────────────────────────── フロントページの続き (72)発明者 曽根原 登 東京都新宿区西新宿三丁目19番2号 日本 電信電話株式会社内 ──────────────────────────────────────────────────続 き Continued on the front page (72) Inventor Noboru Sonehara 3-19-2 Nishishinjuku, Shinjuku-ku, Tokyo Nippon Telegraph and Telephone Corporation
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10072853AJPH11272655A (en) | 1998-03-20 | 1998-03-20 | Japanese multi-notation document conversion method and apparatus, and storage medium storing Japanese multi-notation document conversion program |
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP10072853AJPH11272655A (en) | 1998-03-20 | 1998-03-20 | Japanese multi-notation document conversion method and apparatus, and storage medium storing Japanese multi-notation document conversion program |
| Publication Number | Publication Date |
|---|---|
| JPH11272655Atrue JPH11272655A (en) | 1999-10-08 |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP10072853APendingJPH11272655A (en) | 1998-03-20 | 1998-03-20 | Japanese multi-notation document conversion method and apparatus, and storage medium storing Japanese multi-notation document conversion program |
| Country | Link |
|---|---|
| JP (1) | JPH11272655A (en) |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005510804A (en)* | 2001-11-23 | 2005-04-21 | リサーチ イン モーション リミテッド | System and method for processing extensible markup language (XML) documents |
| JP2010146143A (en)* | 2008-12-17 | 2010-07-01 | Fuji Xerox Co Ltd | Document processing apparatus and program |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2005510804A (en)* | 2001-11-23 | 2005-04-21 | リサーチ イン モーション リミテッド | System and method for processing extensible markup language (XML) documents |
| US7636565B2 (en) | 2001-11-23 | 2009-12-22 | Research In Motion Limited | System and method for processing extensible markup language (XML) documents |
| US7904073B2 (en) | 2001-11-23 | 2011-03-08 | Research In Motion Limited | System and method for processing extensible markup language (XML) documents |
| US8010097B2 (en) | 2001-11-23 | 2011-08-30 | Research In Motion Limited | System and method for processing extensible markup language (XML) documents |
| JP2010146143A (en)* | 2008-12-17 | 2010-07-01 | Fuji Xerox Co Ltd | Document processing apparatus and program |
| Publication | Publication Date | Title |
|---|---|---|
| US6161082A (en) | Network based language translation system | |
| US10963760B2 (en) | Method and apparatus for processing information | |
| US20060241933A1 (en) | Predictive conversion of user input | |
| US20040218451A1 (en) | Accessible user interface and navigation system and method | |
| JP4118470B2 (en) | E-mail device, e-mail transmission method and recording medium | |
| JPH1153168A (en) | Document preparing device with voice information and method used with the same | |
| CN118940723A (en) | Contextual Denormalization for Automatic Speech Recognition | |
| US7020840B2 (en) | Relating to Braille equipment | |
| JP4787634B2 (en) | Music font output device, font database and language input front-end processor | |
| McEnery et al. | EMILLE: Building a corpus of South Asian languages | |
| Pine et al. | Seeing the Heiltsuk orthography from font encoding through to Unicode: A case study using convertextract | |
| JPH11272655A (en) | Japanese multi-notation document conversion method and apparatus, and storage medium storing Japanese multi-notation document conversion program | |
| JP2002157196A (en) | E-mail device | |
| CN101770328B (en) | Multi-segmented Chinese Pinyin system and its method | |
| JP6613671B2 (en) | Information processing device | |
| JP2002014952A (en) | Information processing apparatus and information processing method | |
| US20050131674A1 (en) | Information processing apparatus and its control method, and program | |
| KR100277834B1 (en) | Book reading system and service processing method | |
| JPH05274075A (en) | Information processor with help function | |
| JP2002288167A (en) | Translation system | |
| JPH09190437A (en) | Document processing apparatus and method | |
| JPH1069484A (en) | Pictographic multilingual communication system | |
| KR100837775B1 (en) | Web memo conversion and transmission method using bitmap object and web memo generating device therefor | |
| JP2023157158A (en) | Information processing system, information processing method, and program | |
| JPH1185753A (en) | Multilanguage translating method with no erroneous translation |