






本発明は、学術文献、雑誌記事、新聞記事、特許文献、ホームページの各種のコンテンツ等の各種の文書の中から所望の文書の強調表示を行う文書表示装置、文書表示方法および文書表示プログラムに関する。 The present invention relates to a document display device, a document display method, and a document display program for highlighting a desired document from various documents such as academic documents, magazine articles, newspaper articles, patent documents, and various contents of a homepage.
文書の所望の箇所を強調表示することは、各所で日常的に行われている。このための文書表示装置は、専門の計算機から簡単なアプリケーションソフトウェアをパーソナルコンピュータ等のCPU(Central Processing Unit)で実行するものまで多岐にわたっている。このような文書表示装置は検索装置を例に採ると、検索エンジン、検索方式、検索対象によって大別することができる。 Highlighting a desired portion of a document is routinely performed at various locations. Document display apparatuses for this purpose range from specialized computers to those that execute simple application software on a CPU (Central Processing Unit) such as a personal computer. Taking a search device as an example, such a document display device can be roughly classified according to a search engine, a search method, and a search target.
検索エンジンとしては、インデックス型エンジン、RDB(relational database)型エンジン、全文検索エンジン、概念検索エンジン等の各種のエンジンが提案されている。検索方式としては、AND、OR、NOT、NEAR等の論理演算を行うブール演算方式、語彙空間におけるベクトルである相関係数順や、指定した複数の検索ワードのうちヒットしたワード数の100分率順で表示するランキング型の手法が知られている。検索対象としては、文献全体を対象とするもの、あるいは、ページを対象とするもの、または、文献やページの構成単位であるセンテンス等の所定範囲の文字列を対象とするものが知られている。 As search engines, various engines such as an index type engine, an RDB (relational database) type engine, a full-text search engine, and a concept search engine have been proposed. As a search method, a Boolean operation method that performs logical operations such as AND, OR, NOT, and NEAR, a correlation coefficient order that is a vector in a vocabulary space, and a percentage of the number of hit words among a plurality of specified search words A ranking type method of displaying in order is known. As a search target, there is known a target for the entire document, a target for a page, or a target for a character string in a predetermined range such as a document or a sentence that is a constituent unit of a page. .
ところで、ある技術分野の特許出願が存在するかを、文書表示装置を使用して先行技術調査を行うものとする。このような場合、調査の担当者はその技術分野を特定するキーワードを所定数選択する。そして、調査範囲として定めた特許文献の中からそれらのキーワードを多く含む特許文献を抽出する。そして、これらの抽出した特許文献の中から技術的に最も近い特許文献を、実際に記載されている文章を実際に読みながら選択するという作業が行われることになる。 By the way, it is assumed that a prior art search is performed using a document display device to determine whether there is a patent application in a certain technical field. In such a case, the person in charge of the survey selects a predetermined number of keywords that specify the technical field. And the patent document which contains many those keywords is extracted from the patent documents defined as a search range. Then, an operation of selecting the technically closest patent document from among the extracted patent documents while actually reading the actually written text is performed.
このように特許文献を特定する場合、その特許文献のどこを読むべきかが問題となる。一般に、キーワード等の注目すべき箇所の文字を強調表示することが、本発明の関連技術として行われている(たとえば特許文献1参照)。ここで強調表示とは、注目する文字の部分を他と区別して表示することである。赤色等の特別の色で注目する文字を着色してもよいし、フォントのサイズを大きくしたり、書体を変えたり、太文字にしたり、斜体にしてもよい。注目する文字とその背景の濃度を反転表示してもよいし、アンダーラインを引いたり、網点を掛けたり、括弧で括ってもよい。注目する文字の部分のみを立体文字風に表示してもよい。 When a patent document is specified in this way, the problem is where to read the patent document. In general, highlighting of characters of a noteworthy portion such as a keyword is performed as a related technique of the present invention (see, for example, Patent Document 1). Here, the highlighting means that the portion of the character of interest is displayed separately from the others. The character of interest may be colored with a special color such as red, or the font size may be increased, the font type may be changed, the font may be bold, or italic. The target character and the density of the background may be highlighted, underlined, halftone dots, or enclosed in parentheses. Only the character portion of interest may be displayed in a three-dimensional character style.
ところが、このように注目する文字を無条件で強調表示すると、たとえば最終的にキーワードの出現頻度で絞り込んだ幾つかの特許文献を表示するような場合には、文章のいたる所が赤色等で強調表示されることになる。これにより、表示が煩雑となり、1つの文章の中のどの箇所を特に読むべきかの判断がし辛くなる。 However, when highlighting the characters of interest unconditionally in this way, for example, when displaying several patent documents finally narrowed down by the appearance frequency of keywords, all the sentences are highlighted in red or the like. Will be displayed. As a result, the display becomes complicated and it is difficult to determine which part in one sentence should be read.
そこで本発明の目的は、文章の注目すべき箇所を簡単に判断できるようにした文書表示装置、文書表示方法および文書表示プログラムを提供することにある。 SUMMARY OF THE INVENTION An object of the present invention is to provide a document display device, a document display method, and a document display program that can easily determine a noteworthy portion of a sentence.
本発明では、(イ)表示対象の文書を指定する文書指定手段と、(ロ)この文書指定手段で指定した文書内の所望の部位を強調表示するための語句として互いに異なる意味内容の所定数の指定語を入力する指定語入力手段と、(ハ)前記した文書指定手段で指定した文書内のセンテンスごとに前記した指定語入力手段によって入力した前記した所定数の指定語のうちの幾つが使われているかの割合を演算するセンテンス単位演算手段と、(ニ)このセンテンス単位演算手段による演算結果に応じて前記した割合の高い順にセンテンスを抽出するセンテンス抽出手段と文書表示装置が具備する。 In the present invention, (b) a document designating unit for designating a document to be displayed, and (b) a predetermined number of different semantic contents as words for highlighting a desired part in the document designated by the document designating unit. And (c) some of the predetermined number of designated words inputted by the designated word input means for each sentence in the document designated by the document designating means. Sentence unit calculating means for calculating the ratio of used one, (d) sentence extracting means for extracting sentences in descending order of the ratio according to the calculation result by the sentence unit calculating means, and a document display device.
また、本発明では、(イ)表示対象の文書を指定する文書指定ステップと、(ロ)この文書指定ステップで指定した文書内の所望の部位を強調表示するための語句として互いに異なる意味内容の所定数の指定語を入力する指定語入力ステップと、(ハ)前記した文書指定ステップで指定した文書内のセンテンスごとに前記した指定語入力ステップによって入力した前記した所定数の指定語のうちの幾つが使われているかの割合を演算するセンテンス単位演算ステップと、(ニ)このセンテンス単位演算ステップによる演算結果に応じて前記した割合の高い順にセンテンスを抽出するセンテンス抽出ステップとを文書表示方法が具備する。 In the present invention, (a) a document designating step for designating a document to be displayed, and (b) different meaning contents as words for highlighting a desired part in the document designated in the document designating step. A specified word input step for inputting a predetermined number of specified words, and (c) of the predetermined number of specified words input by the specified word input step for each sentence in the document specified in the document specifying step. The document display method includes a sentence unit calculation step for calculating a ratio of how many are used, and (d) a sentence extraction step for extracting sentences in the descending order of the ratio according to the calculation result of the sentence unit calculation step. It has.
更に本発明では、コンピュータに、文書表示プログラムとして、(イ)表示対象の文書を指定する文書指定処理と、(ロ)この文書指定処理で指定した文書内の所望の部位を強調表示するための語句として互いに異なる意味内容の所定数の指定語を入力する指定語入力処理と、(ハ)前記した文書指定処理で指定した文書内のセンテンスごとに前記した指定語入力処理によって入力した前記した所定数の指定語のうちの幾つが使われているかの割合を演算するセンテンス単位演算処理と、(ニ)このセンテンス単位演算処理による演算結果に応じて前記した割合の高い順にセンテンスを抽出するセンテンス抽出処理とを実行させることを特徴とする。 Further, according to the present invention, as a document display program on the computer, (a) a document designating process for designating a document to be displayed and (b) highlighting a desired part in the document designated by the document designating process. A specified word input process for inputting a predetermined number of specified words having different semantic contents as words; and (c) the predetermined word input by the specified word input process for each sentence in the document specified by the document specifying process. Sentence unit calculation processing that calculates the ratio of how many of the specified words are used, and (d) sentence extraction that extracts sentences in the descending order of the ratio according to the calculation result of the sentence unit calculation processing. And processing.
以上説明したように本発明によれば、センテンスごとに指定語の含まれる割合を演算して、演算結果に応じて前記した割合の高い順にセンテンスを抽出するようにしている。したがって、必要なセンテンスを処理の対象とすることができる、処理の効率化に寄与するという効果がある。 As described above, according to the present invention, the ratio in which the designated word is included is calculated for each sentence, and the sentences are extracted in descending order of the ratio according to the calculation result. Therefore, there is an effect that it is possible to make a necessary sentence a target of processing and contribute to the efficiency of processing.
図1は、本発明の文書表示装置のクレーム対応図を示したものである。本発明の文書表示装置10は、文書指定手段11と、指定語入力手段12と、センテンス単位演算手段13と、センテンス抽出手段14を備えている。ここで、文書指定手段11は、表示対象の文書を指定する。指定語入力手段12は、文書指定手段11で指定した文書内の所望の部位を強調表示するための語句として互いに異なる意味内容の所定数の指定語を入力する。センテンス単位演算手段13は、文書指定手段11で指定した文書内のセンテンスごとに指定語入力手段12によって入力した前記した所定数の指定語のうちの幾つが使われているかの割合を演算する。センテンス抽出手段14は、センテンス単位演算手段13による演算結果に応じて前記した割合の高い順にセンテンスを抽出する。 FIG. 1 shows a claim correspondence diagram of the document display apparatus of the present invention. The
図2は、本発明の文書表示方法のクレーム対応図を示したものである。本発明の文書表示方法20は、文書指定ステップ21と、指定語入力ステップ22と、センテンス単位演算ステップ23と、センテンス抽出ステップ24を備えている。ここで、文書指定ステップ21では、表示対象の文書を指定する。指定語入力ステップ22では、文書指定ステップ21で指定した文書内の所望の部位を強調表示するための語句として互いに異なる意味内容の所定数の指定語を入力する。センテンス単位演算ステップ23では、文書指定ステップ21で指定した文書内のセンテンスごとに指定語入力ステップ22によって入力した前記した所定数の指定語のうちの幾つが使われているかの割合を演算する。センテンス抽出ステップ24では、センテンス単位演算ステップ23による演算結果に応じて前記した割合の高い順にセンテンスを抽出する。 FIG. 2 shows a claim correspondence diagram of the document display method of the present invention. The
図3は、本発明の文書表示プログラムのクレーム対応図を示したものである。本発明の文書表示プログラム30は、コンピュータに、文書表示プログラムとして、文書指定処理31と、指定語入力処理32と、センテンス単位演算処理33と、センテンス抽出処理34を実行させるようにしている。ここで、文書指定処理31では、表示対象の文書を指定する。指定語入力処理32では、文書指定処理31で指定した文書内の所望の部位を強調表示するための語句として互いに異なる意味内容の所定数の指定語を入力する。センテンス単位演算処理33では、文書指定処理31で指定した文書内のセンテンスごとに指定語入力処理32によって入力した前記した所定数の指定語のうちの幾つが使われているかの割合を演算する。センテンス抽出処理34では、センテンス単位演算処理33による演算結果に応じて前記した割合の高い順にセンテンスを抽出する。 FIG. 3 shows a claim correspondence diagram of the document display program of the present invention. The document display
<発明の実施の形態> <Embodiment of the Invention>
次に本発明の実施の形態を説明する。 Next, an embodiment of the present invention will be described.
図4は、本発明の実施の形態による文書表示装置の構成の概要を表わしたものである。本実施の形態の文書表示装置100は、装置全体の制御を行う主制御部101を備えている。主制御部101は、CPU(Central Processing Unit)102と、装置の各種制御を行う制御プログラムを格納したメモリ103を有している。メモリ103は、ROM(Read Only Memory)のような半導体メモリであってもよいし、磁気ディスクや光ディスクあるいはDVD(Digital Versatile Disk)等の記憶媒体であってもよい。主制御部101は、次の各部と接続されており、これらの制御を行う。ただし、次に説明する各部の少なくとも一部は、CPU102がメモリ103あるいは通信ネットワーク上の図示しない記憶媒体に格納された制御プログラムを実行することでソフトウェア的に実現されるものであってもよい。 FIG. 4 shows an outline of the configuration of the document display device according to the embodiment of the present invention. The
文書格納部104は、表示対象の文書を格納する。ただし、表示対象の文書は文書格納部104に格納されている必要はない。表示対象の文書は、CD(Compact Disc)あるいはDVD等の記録メディアに格納されていてもよい。あるいは通信を制御する通信制御部105を介して接続された前記した通信ネットワーク上のサーバに制御プログラムと共に、あるいは文書のみが単独で格納されていてもよい。 The
データ入力部106は、キーワードとしての指定語等の強調表示に使用する各種のデータの入力を処理する。文書表示装置100には、キーボードや、ポインティングデバイスとしてのマウスといった入力デバイス107が取り付けられるようになっており、データ入力部106はこれらからの入力データを処理することになる。 The
センテンス設定部108は、強調表示の対象となる1つ1つの文書の中から「センテンス」単位で強調表示の結果を表示するときの、その「センテンス」が何を意味するかを、作業者(以下、ユーザという。)の意図に応じて設定しておく部分である。たとえば特許文献のテキスト情報を強調表示の対象とするときには、各段落を「センテンス」と定義付けてもよいし、1つ1つの文章を「センテンス」と定義付けてもよい。あるいはもっと細かく、句読点のそれぞれで分解された文章の部分を「センテンス」と定義付けてもよい。 The
日本語で「、」に代表される読点を基準に「センテンス」を定める場合には、読点の直前に仮名文字が存在するときにのみ「センテンス」に区切るようにすることが好適な場合が多い。これは、たとえば「金、銀、銅のうちのいずれかの金属を使った斧を使用し、」という文章が存在した場合に、「金」や「銀」の箇所でセンテンスを区切らないようにすることができるためである。センテンス設定部108を用いて、ユーザは強調表示の対象とする文章の「センテンス」を定義付けることができるが、予めシステム側が用意したデフォルト値をそのまま使用することも可能である。 When “sentence” is defined based on a punctuation mark represented by “,” in Japanese, it is often preferable to divide it into “sentence” only when a kana character exists immediately before the punctuation mark. . For example, if there is a sentence “Use an ax made of one of gold, silver, or copper”, do not separate sentences at “gold” or “silver”. This is because it can be done. Using the
指定語・均等語管理部109は、強調表示の対象となるキーワードとしての指定語をユーザから指定された際に、それぞれの指定語に対する均等語を管理する辞書というべき部分である。たとえば、ある文章に対して強調表示を行う場合のユーザが入力した指定語が「用紙」であるとする。このとき、本実施の形態の文書表示装置100は、紙、PAPER、カット紙、ロール紙、記録紙といった技術検索に使用する均等語を指定範囲に含める。 The designated word / equivalent
ユーザが指定語を入力したときに強調表示処理のときに包含される均等語はシステム側で辞書として提供することができる。ユーザは、指定語を入力したときに、どのような均等語が指定語として包含されるかを表示して確認したり、均等語の追加や削除といった編集を行うことも可能である。 Equivalent words included in the highlighting process when the user inputs a designated word can be provided as a dictionary on the system side. When the user inputs a designated word, the user can display and confirm what equivalent words are included as the designated word, and can perform editing such as addition or deletion of equivalent words.
センテンス内指定語率算出部110は、指定語が1つ1つのセンテンスに何種類出現するかの比率を算出する部分である。たとえば後に例示するように、迷子のペットを見つけ出す特許文献を強調表示するものとする。このとき、指定語として、ユーザが「ペット」を入力したとき、辞書から均等語として「犬」、「飼い犬」、「猫」、「飼い猫」等の語句が提供される。ユーザは、これらの中で今回の強調表示の対象となる「ペット」と一括りの用語として不適切なものを排除したり、必要な均等語を追加することができる。センテンスに指定語のいずれかが出現しなかった場合でも、その均等語が出現していれば指定語が出現したものとして算出を行う。また、指定語とその均等語が共に出現した場合には、これらを合算しない。1つの指定語が1つのセンテンスに複数回出現したり、その均等語が複数種類あるいは複数回出現しても、1種類の指定語が出現したものとして算出する。 The in-sentence designated word
センテンス順位判別部111は、センテンス内指定語率算出部110で判別したそれぞれのセンテンスにおける指定語の種類の多い順に順位を付ける部分である。たとえば指定語が4種類存在した場合、1つのセンテンスにこれら4種類の指定語が出現した場合は、第1順位となる。指定語の一部の種類が出現しなくても、これらの均等語が出現した場合は同様に扱う。 The sentence
同一順位のセンテンス間で更に順位を付けてもよい。この際の順位の付け方は、ユーザがセンテンス内指定語率算出部110の算出基準として設定することができる。一例としては、同一のセンテンスに含まれる指定語や均等語の数を単純に計数して、これらの登場回数が多いものほど上位にする。この他に、隣接するセンテンスにおける指定語率(均等語も含む)を比較して、総合的な指定語の出現率が高いものをより高い順位としてもよい。隣接するセンテンスを含めた場合でも同一順位が存在する場合には、更に隣接する範囲まで範囲を広げて指定語率(均等語も含む)の出現率を判別してもよいし、以上の幾つかの判断基準を複数組み合わせるようにしてもよい。 A rank may be further assigned between sentences having the same rank. The ordering method at this time can be set by the user as a calculation criterion of the in-sentence designated word
表示制御部112は、この文書表示装置100に接続されるディスプレイ113に強調表示結果等の必要な視覚情報を出力する際の表示制御を行う部分である。文書表示装置100には、ディスプレイ113の他にプリンタが接続されていてもよい。 The
表示形態設定部114は、強調表示の結果をディスプレイ113に表示する際の表示形態を設定する部分である。強調表示の仕方や、ディスプレイ113に強調表示の結果を表示する際の表示項目の選択といった各種の表示形態の設定を行うことができる。 The display
図5は、本実施の形態の文書表示装置の全体的な強調表示処理の様子を表わしたものである。特許文献を強調表示する場合を例に採り、図4と共に説明する。 FIG. 5 shows the overall highlighting process of the document display apparatus according to the present embodiment. An example of highlighting a patent document will be described with reference to FIG.
文書表示装置100は、データ入力部106を用いてユーザからの入力デバイス107を用いたデータ入力を受け付ける(ステップS201)。このとき、ユーザは、たとえば調査する特許文献の範囲や指定語を入力したり、均等語の編集を行う。また、ユーザは入力デバイス107を用いて、センテンスを定義したり、強調表示の仕方を選択することができる。 The
以上のステップS201の処理が終了すると、文書表示装置100は調査する特許文献の範囲で文書の強調表示処理を実行する(ステップS202)。具体的には、指定語が多く含まれる特許文献を、ユーザがステップS201で指定した数の範囲内で抽出する。強調表示の結果は、該当した特許文献の集合として順位を付けて文書格納部104に格納される(ステップS203)。ただし、この場合の順序付けは、センテンスを単位として指定語の含まれる割合の高い順に文書を順情付ける必要はない。従来から行われている各種の基準で特許文献を順番付けするものであってもよい。 When the processing in step S201 is completed, the
以上のようにして指定語を基にして所定数の特許文献が選択されたら、主制御部101はこのうち強調表示の結果で第1番目の文書を指定する(ステップS204)。この代わりに、ユーザによる順番の指示や特許文献の具体的な指定を待機してもよい。 When a predetermined number of patent documents are selected based on the designated word as described above, the
主制御部101は指定された文書をセンテンスに区切って、それぞれのセンテンスごとに、指定語の種類としての指定語率を算出する(ステップS205)。そして、センテンス順位判別部111が、センテンス内指定語率算出部110で判別したそれぞれのセンテンスにおける指定語の種類の多い順に順位を付けてその内容をメモリ103の所定の領域に保存する(ステップS206)。 The
この後、主制御部101は指定語の種類の最も多い1番目の順位のセンテンスを指定する(ステップS207)。表示制御部112は、その1番目の順位のセンテンスにおける指定語および均等語を設定された表現形式で強調してディスプレイ113に表示する(ステップS208)。 Thereafter, the
図6は、ディスプレイに表示された強調表示の結果の一例を表わしたものである。ディスプレイ113の中央には、強調表示の結果を表示する強調表示結果ウィンドウ121が表示されており、ここには、1つの段落を1つのセンテンスと定義した際の強調表示結果が表示されている。この強調表示結果ウィンドウ121の下には現在設定されている指定語の状態を示す指定語ウィンドウ122が表示されている。 FIG. 6 shows an example of the result of highlighting displayed on the display. In the center of the
更に、ディスプレイ113の一番上の領域には、現在表示されている特許文献の文献番号123や出願人124が表示されており、これらと強調表示結果ウィンドウ121の間には、文献を切り替えるボタン125、126、センテンスを切り替えるボタン127および指定語のヒット率(指定語率)128が表示されている。 Further, the
強調表示結果ウィンドウ121の中央には、指定語の種類の最も多い1番目の順位のセンテンスに相当する第0016段落の内容が表示されており、その上下に、隣接する段落の内容が表示枠の範囲内で表示されている。第0016段落の内容のみについて、指定語および均等語としてヒットした語句が強調表示されている。この例で各語句は、枠で取り囲んだ形で強調表示されているが、それらの部分のフォントを着色する等の他の強調表示を行うことも可能である。 In the center of the
図5に戻って図6と共に説明を続ける。ユーザは、図6に示したような表示がディスプレイ113に行われた状態で(ステップS208)、センテンスの表示順位を指定する操作(ステップS209)や、強調表示の対象とした文書を他の文書に指定する操作(ステップS210)や、強調表示の条件を変更する操作(ステップS211)あるいは強調表示を終了する操作(ステップS212)が行われるのを待機している。 Returning to FIG. 5, the description will be continued with FIG. In a state where the display as shown in FIG. 6 is performed on the display 113 (step S208), the user designates the display order of the sentences (step S209) or the document to be highlighted as another document. (Step S210), an operation for changing the highlighting condition (step S211), or an operation for terminating the highlighting (step S212).
ユーザが図6のセンテンスを切り替えるボタン127のいずれかを操作してセンテンスの表示順位を切り替える指示を行った場合には(ステップS209:Y)、この指示によって指定されたセンテンスが、強調表示結果ウィンドウ121の中央部分に新たに表示される(ステップS208)。たとえば、ユーザがセンテンスを切り替えるボタン127のうちの「次センテンス」のボタンを、図示しないマウスでクリックしたり、同じく図示しないタッチパネルを用いてそのボタンを押下した場合には、2番目に指定語率が高いと判断された段落が表示されることになる。このとき、該当する段落についてのみ、指定語および均等語が強調表示され、併せて表示されるその前後の段落の文章は強調表示されない。 When the user gives an instruction to switch the display order of sentences by operating one of the
ユーザがセンテンスを切り替えるボタン127のうちの次センテンスのボタンの隣に配置され「次センテンス」のボタンと逆方向を記した三角形のボタンは、1つ前の指定語率のセンテンスに飛ぶボタンである。また、その左隣りの三角形の先端が縦棒に接続された形のボタンは、同一文書における1番目に指定語率が高いと判断されたセンテンスに戻るボタンである。 A triangle button that is arranged next to the next sentence button among the
このようにして、ユーザはセンテンスを切り替えるボタン127を適宜操作していくことで、同一文書内における所望のセンテンスに飛びながら、それらの記載内容を順に点検することができる。この際に、着目しているセンテンス以外の部分に指定語や均等語が存在しても、これらはその時点で強調表示されることはない。したがって、ユーザは指示されたセンテンスのみに神経を集中して、その内容をチェックすることができる。 In this way, the user can check the description contents in order while jumping to a desired sentence in the same document by appropriately operating the
このようにして1つの文書について必要な強調表示が行われたら、ユーザは文献を切り替えるボタン125、126を選択することで(ステップS209:N、ステップS210:Y)、ステップS205に戻って、次の文書について同様のチェックを行ったり、必要な場合には以前にチェックした文献を読み出して他の文献との比較を行うこともできる。 When necessary highlighting is performed for one document in this way, the user selects
また、ユーザは強調表示の処理の途中であっても、指定語やそれらの均等語を追加あるいは削除するといった強調表示条件の変更が可能である。強調表示条件を変更した場合には(ステップS210:N、ステップS211:Y)、ステップS201に戻って新しい条件を基にした強調表示が実行されることになる(ステップS202)。また、ユーザが強調表示の終了を指示した場合には(ステップS211:N、ステップS212:Y)、一連の強調表示処理が終了する(エンド)。 Further, even during the highlighting process, the user can change the highlighting conditions such as adding or deleting the designated words and their equivalent words. When the highlighting condition is changed (step S210: N, step S211: Y), the process returns to step S201 and the highlighting based on the new condition is executed (step S202). When the user instructs the end of highlighting (step S211: N, step S212: Y), a series of highlighting processing ends (end).
図7は、ユーザがセンテンスを、文章における句読点で切れたそれぞれの範囲と定義付けた場合の強調表示結果の表示例を示したものである。この例では、図6と同一の特許文献を処理し、指定語率が4指定語中の3語がヒットしている状態で、同様の第0016段落中の「あるいは知人で消息を絶っている人のように実在している物や人で照会を求める対象(第1のデータ)について第1の端末から照会を求める者を特定する第2のデータと共に入力し、」というセンテンスに対してのみ強調表示が行われている。図6と対比すると、「センテンス」をより短い語句からなるものと定義することで、ユーザが読むべき箇所をより的確に表示していることが分かる。 FIG. 7 shows a display example of the highlighted display result when the user defines the sentence as each range cut by punctuation marks in the sentence. In this example, the same patent document as in FIG. 6 is processed, and in the state where the specified word rate is hit in 3 of the 4 specified words, “in the same paragraph in the 0016 paragraph” or “the acquaintance has disappeared. Only for a sentence that “the actual object such as a person or an object (first data) for which an inquiry is requested (first data) is input from the first terminal together with the second data for specifying the person seeking the inquiry.” Highlighting is done. Compared with FIG. 6, it can be seen that by defining “sentence” to be composed of shorter words, a portion to be read by the user is displayed more accurately.
しかも、図6と図7の双方の場合について、該当するセンテンスだけでなく、これに隣接あるいはこの周囲に位置する他のセンテンスも連続した文章の形で表示されている。したがって、センテンスを構成する語句が短くて、そのセンテンスにおける指定語と文脈の関係が不明確な場合があっても、前後のセンテンスを読むことで、ユーザは該当するセンテンスの意味合いを理解しやすくなり、迅速かつ適切に特許調査を進めることができる。 In addition, in both cases of FIGS. 6 and 7, not only the corresponding sentence but also other sentences located adjacent to or around the sentence are displayed in the form of continuous sentences. Therefore, even if the words that make up a sentence are short and the relationship between the specified word and the context in the sentence is unclear, the user can easily understand the meaning of the sentence by reading the preceding and following sentences. The patent search can be advanced promptly and appropriately.
もちろん、以上説明した実施の形態とは異なるが、強調表示結果ウィンドウ121には該当するセンテンスのみを表示するようにすることも可能である。 Of course, although different from the embodiment described above, it is also possible to display only the corresponding sentence in the highlight
また、実施の形態では、特許文献の調査のための強調表示処理を説明したが、文章あるいはテキスト情報を含んで構成される他の文選や文書に対して本発明を同様に適用できることは当然である。 In the embodiment, the highlighting process for searching patent documents has been described. However, it is natural that the present invention can be similarly applied to other sentence selections and documents that include sentences or text information. is there.
10、100 文書表示装置
11 文書指定手段
12 指定語入力手段
13 センテンス単位演算手段
14 センテンス抽出手段
20 文書表示方法
21 文書指定ステップ
22 指定語入力ステップ
23 センテンス単位演算ステップ
24 センテンス抽出ステップ
30 文書表示プログラム
31 文書指定処理
32 指定語入力処理
33 センテンス単位演算処理
34 センテンス抽出処理
101 主制御部
102 CPU
103 メモリ
104 文書格納部
106 データ入力部
108 センテンス設定部
109 指定語・均等語管理部
110 センテンス内指定語率算出部
111 センテンス順位判別部
112 表示制御部
113 ディスプレイ
114 表示形態設定部
121 強調表示結果ウィンドウ
122 指定語ウィンドウDESCRIPTION OF SYMBOLS 10,100
DESCRIPTION OF
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009257092AJP2011103027A (en) | 2009-11-10 | 2009-11-10 | Document display device, document display method, and document display program |
| Application Number | Priority Date | Filing Date | Title |
|---|---|---|---|
| JP2009257092AJP2011103027A (en) | 2009-11-10 | 2009-11-10 | Document display device, document display method, and document display program |
| Publication Number | Publication Date |
|---|---|
| JP2011103027Atrue JP2011103027A (en) | 2011-05-26 |
| Application Number | Title | Priority Date | Filing Date |
|---|---|---|---|
| JP2009257092APendingJP2011103027A (en) | 2009-11-10 | 2009-11-10 | Document display device, document display method, and document display program |
| Country | Link |
|---|---|
| JP (1) | JP2011103027A (en) |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016207071A (en)* | 2015-04-27 | 2016-12-08 | アイ・ピー・ファイン株式会社 | Information processing apparatus |
| WO2017061253A1 (en)* | 2015-10-09 | 2017-04-13 | アイビーリサーチ株式会社 | Display control device, display control method, and display control program |
| WO2020013615A1 (en)* | 2018-07-10 | 2020-01-16 | 삼성전자 주식회사 | Electronic device, and method for controlling electronic device |
| JP7422824B1 (en) | 2022-08-15 | 2024-01-26 | Lineヤフー株式会社 | Information processing device, information processing method, and information processing program |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001167096A (en)* | 1999-12-06 | 2001-06-22 | Ricoh Co Ltd | Document retrieval system, document retrieval method, and computer-readable recording medium recording program for executing the method |
| JP2004326216A (en)* | 2003-04-22 | 2004-11-18 | Ricoh Co Ltd | Document search device, method, program, and recording medium |
| JP2008293312A (en)* | 2007-05-25 | 2008-12-04 | Fuji Xerox Co Ltd | Retrieval document display system |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2001167096A (en)* | 1999-12-06 | 2001-06-22 | Ricoh Co Ltd | Document retrieval system, document retrieval method, and computer-readable recording medium recording program for executing the method |
| JP2004326216A (en)* | 2003-04-22 | 2004-11-18 | Ricoh Co Ltd | Document search device, method, program, and recording medium |
| JP2008293312A (en)* | 2007-05-25 | 2008-12-04 | Fuji Xerox Co Ltd | Retrieval document display system |
| Publication number | Priority date | Publication date | Assignee | Title |
|---|---|---|---|---|
| JP2016207071A (en)* | 2015-04-27 | 2016-12-08 | アイ・ピー・ファイン株式会社 | Information processing apparatus |
| WO2017061253A1 (en)* | 2015-10-09 | 2017-04-13 | アイビーリサーチ株式会社 | Display control device, display control method, and display control program |
| CN107077515A (en)* | 2015-10-09 | 2017-08-18 | Ib研究株式会社 | Display control unit, display control method and display control program |
| JPWO2017061253A1 (en)* | 2015-10-09 | 2018-08-16 | アイビーリサーチ株式会社 | Display control apparatus, display control method, and display control program |
| JP2021077426A (en)* | 2015-10-09 | 2021-05-20 | アイビーリサーチ株式会社 | Display control apparatus, display control method, and display control program |
| WO2020013615A1 (en)* | 2018-07-10 | 2020-01-16 | 삼성전자 주식회사 | Electronic device, and method for controlling electronic device |
| CN112771532A (en)* | 2018-07-10 | 2021-05-07 | 三星电子株式会社 | Electronic device and method for controlling electronic device |
| US11435883B2 (en) | 2018-07-10 | 2022-09-06 | Samsung Electronics Co., Ltd. | Electronic device, and method for controlling electronic device |
| US12131013B2 (en) | 2018-07-10 | 2024-10-29 | Samsung Electronics Co., Ltd. | Electronic device, and method for controlling electronic device |
| CN112771532B (en)* | 2018-07-10 | 2025-06-24 | 三星电子株式会社 | Electronic device and method for controlling the electronic device |
| JP7422824B1 (en) | 2022-08-15 | 2024-01-26 | Lineヤフー株式会社 | Information processing device, information processing method, and information processing program |
| Publication | Publication Date | Title |
|---|---|---|
| RU2683507C2 (en) | Retrieval of attribute values based upon identified entries | |
| US11042694B2 (en) | Document beautification using smart feature suggestions based on textual analysis | |
| US20130173610A1 (en) | Extracting Search-Focused Key N-Grams and/or Phrases for Relevance Rankings in Searches | |
| JP7493937B2 (en) | Method, program and system for identifying a sequence of headings in a document | |
| TW200805095A (en) | Data product search using related concepts | |
| US20130318124A1 (en) | Computer product, retrieving apparatus, and retrieval method | |
| JP5737079B2 (en) | Text search device, text search program, and text search method | |
| JP2011103027A (en) | Document display device, document display method, and document display program | |
| JP6772478B2 (en) | Information retrieval program and information retrieval device | |
| US10599741B2 (en) | Application software for a browser with enhanced efficiency | |
| JPH0844771A (en) | Information retrieval device | |
| JP2008262506A (en) | Information extraction system, information extraction method, and information extraction program | |
| KR101835994B1 (en) | Method and apparatus of providing searching service for electronic books | |
| JP2009129176A (en) | Structured document retrieval apparatus, method and program | |
| JP5259764B2 (en) | Browsing support system, browsing support method and program | |
| JP2004220226A (en) | Document classification method and device for retrieved document | |
| US12174844B1 (en) | System, method, and computer program product for searching a plurality of documents based on a text string | |
| JP5998779B2 (en) | SEARCH DEVICE, SEARCH METHOD, AND PROGRAM | |
| JP4980604B2 (en) | Document search apparatus, document search method, document search program, and recording medium | |
| JP7703623B2 (en) | System, method, and program | |
| EP4571565A1 (en) | Systems and methods for processing designs | |
| JP5262190B2 (en) | Input completion device and input completion program | |
| CN101685375A (en) | Electronic apparatus with dictionary function | |
| JP4189251B2 (en) | Keyword analysis method and program used therefor | |
| JP2024116608A (en) | Information processing system and program |
| Date | Code | Title | Description |
|---|---|---|---|
| A621 | Written request for application examination | Free format text:JAPANESE INTERMEDIATE CODE: A621 Effective date:20121003 | |
| A131 | Notification of reasons for refusal | Free format text:JAPANESE INTERMEDIATE CODE: A131 Effective date:20140114 | |
| A02 | Decision of refusal | Free format text:JAPANESE INTERMEDIATE CODE: A02 Effective date:20140526 |