












特許法第30条第2項適用  公開日  令和1年12月4日  外部登壇  https://search-tech.connpass.com/event/156014/Application of Article 30,
特許法第30条第2項適用  公開日  令和2年3月18日  投稿情報  https://techblog.yahoo.co.jp/entry/20200318819061/Article 30,
本出願は、情報処理装置、情報処理方法、及び情報処理プログラムに関する。 The present application relates to an information processing device, an information processing method, and an information processing program.
情報技術の発展と普及により、様々な検索技術が提案されている。例えば、データの特徴量を利用して検索を行う術では、データ間の特徴量の類似性に基づいて、クエリとして与えられたデータに類似するデータの検索が行われる。 With the development and spread of information technology, various search techniques have been proposed. For example, in a technique of performing a search using feature amounts of data, data similar to data given as a query is searched based on the similarity of feature amounts between data.
また、検索技術は、EC(EC:Electronic Commerce)サービスにおいても、キーワード(キーワードクエリ)を用いることにより、ユーザ自身で探している商品を検索するための仕組みとして提供されている。また、この仕組みでは、一般的に、検索結果に対してランキング(順位付け)が行われた状態でユーザに提示される。 In addition, search technology is also provided in EC (EC: Electronic Commerce) services as a mechanism for users themselves to search for products they are looking for by using keywords (keyword queries). Also, in this mechanism, the search results are generally presented to the user in a state in which they are ranked.
しかしながら、商品の検索結果の提供において、検索結果の順位付けの精度と、検索結果の応答速度とはトレードオフの関係にあり、両立が難しい。つまり、ユーザが指定するキーワードクエリに基づいて検索結果の順位付けの精度を高めようとすれば応答速度が遅くなり、検索結果の応答速度を速めようとすれば検索結果の順位付けの精度が低くなる。 However, in providing product search results, there is a trade-off between the accuracy of ranking search results and the response speed of search results, and it is difficult to achieve both. In other words, if you try to improve the accuracy of the search result ranking based on the keyword query specified by the user, the response speed will be slow, and if you try to speed up the search result response speed, the search result ranking accuracy will be low. Become.
本願は、上記に鑑みてなされたものであって、検索結果の順位付けの精度と検索結果の応答速度とのバランスを最適化できる情報処理装置、情報処理方法、及び情報処理プログラムを提供することを目的とする。 The present application has been made in view of the above, and provides an information processing device, an information processing method, and an information processing program that can optimize the balance between the accuracy of ranking search results and the response speed of search results. With the goal.
本願に係る情報処理装置は、検索部と、順位付け部とを備える。検索部は、検索ワードに基づくデータ検索を行う。順位付け部は、検索部による検索結果に対して、第1の順位付け手法により順位付けを行い、第1の順位付け手法による順位付け結果のうち順位が上位のデータを抽出して、抽出した順位が上位のデータに対し、第1の順位付け手法よりも高精度な第2の順位付け手法により順位付けを行う。 An information processing apparatus according to the present application includes a search section and a ranking section. The search unit searches for data based on search words. The ranking unit ranks the search results of the search unit by a first ranking method, and extracts and extracts the data ranked higher among the ranking results by the first ranking method. Ranking is performed on the data with the highest ranking by the second ranking method, which is more accurate than the first ranking method.
実施形態の態様の1つによれば、検索結果の順位付けの精度と検索結果の応答速度とのバランスを最適化できる。 According to one aspect of the embodiments, the balance between search result ranking accuracy and search result response speed can be optimized.
以下に、本願に係る情報処理装置、情報処理方法、及び情報処理プログラムを実施するための形態(以下、「実施形態」と呼ぶ)について図面を参照しつつ詳細に説明する。なお、以下に説明する複数の実施形態により本願に係る情報処理装置、情報処理方法、及び情報処理プログラムが限定されるものではない。また、以下に説明する複数の実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。また、以下に説明する複数の実施形態において同一の部位には同一の符号を付し、重複する説明は省略される。 Hereinafter, modes for implementing an information processing apparatus, an information processing method, and an information processing program (hereinafter referred to as "embodiments") according to the present application will be described in detail with reference to the drawings. Note that the information processing apparatus, information processing method, and information processing program according to the present application are not limited to the embodiments described below. In addition, multiple embodiments described below can be appropriately combined within a range that does not contradict the processing content. In addition, in a plurality of embodiments described below, the same parts are denoted by the same reference numerals, and overlapping descriptions are omitted.
[1.情報処理の概要]
  図1を用いて、実施形態にかかる情報処理の一例を説明する。図1は、実施形態に係る情報処理の一例を示す図である。図1に示す例において、実施形態に係る情報処理システム1は、端末装置10と、複数の情報処理装置100とを有する。端末装置10と、情報処理装置100aとは、ネットワークを介して有線または無線により通信可能に接続される。また、情報処理装置100aと、情報処理装置100b~100dとは、ネットワークを介して有線または無線により相互に通信可能に接続される。以下では、情報処理の一例として、情報処理装置100がECサイトにおけるサイト内検索を管理する場合について説明する。[1. Overview of information processing]
 An example of information processing according to the embodiment will be described with reference to FIG. FIG. 1 is a diagram illustrating an example of information processing according to an embodiment. In the example illustrated in FIG. 1 , an
  図1に示す端末装置10は、ユーザによって利用される情報処理装置である。端末装置10は、GPS(Global  Positioning  System)等の各種センサや、液晶ディスプレイ等の表示デバイス(以下、「画面」と適宜記載する。)や、マイク等の音声入力デバイスを有する。例えば、端末装置10は、デスクトップ型PC(Personal  Computer)や、ノート型PCや、タブレット端末や、スマートフォンや、携帯電話機や、PDA(Personal  Digital  Assistant)や、ウェアラブルデバイス等である。  A
  情報処理装置100a~100dは、ECサイトにおける端末装置10からの検索要求を分散処理する検索システムを構成するサーバ装置である。図1に示す例において、例えば、情報処理装置100aが端末装置10からの検索要求を受け付けるサーチヘッドとしての役割を担い、情報処理装置100b~100dが検索要求を分散処理する処理サーバとしての役割を担う。なお、小規模な検索システムであれば、情報処理装置100aが検索システムの処理を全て実行してもよい。以下、図1を用いて、実施形態に係る情報処理について説明する。なお、以下の実施形態では、情報処理装置100a~100dが、端末装置10から検索要求として受け付けた検索ワードに基づく検索処理を実行する例について説明するが、この例には特に限定される必要はない。例えば、情報処理装置100a~100dが、端末装置10からの検索要求として、画像による類似検索要求や、音声入力によりウェブ検索要求などを受け付けて検索処理を行う場合にも、以下に説明する実施形態を同様に適用できる。  The
  図1に示すように、情報処理装置100aは、端末装置10のユーザから検索要求を取得すると(ステップS1)、検索要求に含まれる検索ワード(キーワードクエリ)を取得し、情報処理装置100b~100dにそれぞれ転送する(ステップS2)。  As shown in FIG. 1, when the
  情報処理装置100b~100dは、情報処理装置100aから取得した検索ワードに基づく検索処理を実行する(ステップS3)。情報処理装置100b~100dは、検索処理により、検索ワードに合致する商品に関するドキュメント(文書)を検索結果として取得する。検索結果として取得される商品に関するドキュメントは、検索処理により検索ワードに合致すると判定された商品の固有名称である商品名、マーケティングコピーとして文書内に記述された商品説明、及び商品に対する評価として文書内に記録されたレビューのうちの少なくともいずれかを含む。検索結果として取得されるドキュメントは、例えばHTML(HyperText  Markup  Language)文書、XML(Extensible  Markup  Language)文書、XHTML(Extensible  HyperText  Markup  Language)文書等である。なお、ドキュメントには、商品をユーザに提示するための画像や、音声や、映像等のマルチメディアデータ、及び、商品名や、商品説明や、レビューなどのテキストデータなどを含んで構成されてもよい。  The
  まず、情報処理装置100b~100dの各々は、第1の順位付け手法により検索結果の順位付けを行う(ステップS4)。なお、ドキュメントの順位付けは、そのまま商品の順位付けとなる。続いて、情報処理装置100b~100dの各々は、第1の順位付け手法による順位付け結果のうち順位が上位のドキュメントを抽出し、抽出したドキュメントについて、第1の順位付け手法よりも高精度な第2の順位付け手法による順位付けを、順位付けに用いる情報を変更しつつ、規定の回数に到達するまで繰り返し実行する(ステップS5)。第2の順位付け手法については、以下に詳述する。そして、情報処理装置100b~100dの各々は、検索処理の処理結果を情報処理装置100aに送信する(ステップS6)。  First, each of the
  情報処理装置100aは、情報処理装置100b~100dのそれぞれから、検索処理の処理結果を受信すると、処理結果に含まれるドキュメントをスコア順に並べて、検索結果の最終的なランキングを生成する(ステップS7)。  When the
  そして、情報処理装置100aは、最終的な検索結果を端末装置10に提供する(ステップS8)。  Then, the
  以下、図2~図7を用いて、情報処理装置100による順位付け処理について具体的に説明する。図2~図7は、実施形態に係る順位付け処理の概要を示す図である。  The ranking process by the
  図2に示すように、情報処理装置100aは、端末装置10のユーザY1から受信する検索要求から、検索ワードとして「スマートフォン+ケース」を取得する。そして、情報処理装置100aは、取得した検索ワード「スマートフォン+ケース」を情報処理装置100b~100dにそれぞれ転送する。As shown in FIG. 2 , the
  図3に示すように、情報処理装置100b~100dは、情報処理装置100aから取得した検索ワードに基づいて、検索ワードに合致する全レコードを走査する。例えば、情報処理装置100b~100dは、検索ワード:「スマートフォン」の索引(インデックス)と、検索ワード:「ケース」の索引(インデックス)とに基づいてデータベースに記録されているドキュメントの中から、検索ワードに合致するドキュメントを検索する。そして、情報処理装置100b~100dは、検索ワード:「スマートフォン」、及び検索ワード:「ケース」の両方を含む、例えば100万件の検索ドキュメントのリストを作成する。ドキュメントリストに含まれる検索ドキュメント(ドキュメントID)の数は、検索システムの管理者が任意に設定できる。  As shown in FIG. 3, based on the search word acquired from the
  また、図3に示すように、情報処理装置100b~100dは、作成したドキュメントリストを用いて、第1の順位付け手法により検索ドキュメントの順位付けを行う。第1の順位付け手法は、順位付けの精度よりも応答速度に比重を置いた高速な順位付け手法である。例えば、第1の順位付け手法による順位付けに用いる情報として、検索ワードに対応する商品(ドキュメント)の閲覧回数などが考えられる。  Further, as shown in FIG. 3, the
  また、図3に示すように、順位付けの結果は、例えば、「ランク」の項目と、「ドキュメントID」の項目と、「スコア」の項目とで構成される。「ランク」の項目には、順位付けの結果に基づく順位が記録される。「ドキュメントID」の項目には、ドキュメントに対して付与されている識別子が記録される。「スコア」の項目には、順位付けにおける点数が記録される。図3に示す「スコア」の項目に記録される点数の算出方法について一例を説明する。例えば、情報処理装置100b~100dは、ドキュメントごとに、検索ワードに対して検索結果としてユーザに提示した提示回数と、検索結果として提示した後にユーザにより閲覧された閲覧回数とに基づいてスコアを算出できる。例えば、ある検索ワードに対して提示された回数が「100回」で、各提示においてユーザにより閲覧された閲覧回数の合計が「67回」のドキュメントがある場合、情報処理装置100b~100dは、閲覧回数と提示回数との比である「0.67」を、該当ドキュメントのスコアとすることが考えられる。一方、ユーザに提示されたことないドキュメントについては、各検索ワードに対する検索結果としてユーザに提示されたことのある全てのドキュメントについて、閲覧回数と提示回数との比を算出し、その平均値を該当ドキュメントのスコアとすることが考えられる。図3に示す例によれば、第1の順位付け手法による順位付けの結果、ドキュメントID:「m」のドキュメントがランクキング第1位であり、ドキュメントID:「r」のドキュメントが第2位、そして、ドキュメントID:「o(オー)」のドキュメントが第3位と続く。情報処理装置100b~100dは、第1の順位付け手法による全ての順位付け結果(例えば、100万件)の中から、例えば、上位1000件のドキュメントを抽出して順位付け結果として保持する。なお、順位付け結果を抽出して保持する数は、検索システムの管理者が任意に変更できる。  Also, as shown in FIG. 3, the ranking result is composed of, for example, an item of "rank", an item of "document ID", and an item of "score". The ranking based on the ranking result is recorded in the item of "rank". The “document ID” field records an identifier assigned to the document. The score in the ranking is recorded in the "score" item. An example of the calculation method of the score recorded in the item of "score" shown in FIG. 3 will be described. For example, the
  続いて、図4に示すように、情報処理装置100b~100dは、保持した第1の順位付け手法による順位付け結果について、第1の順位付け手法よりも高精度な第2の順位付け手法による順位付けを行う。第2の順位付け手法は、応答速度よりも順位付けの精度に比重を置いた高精度な順位付け手法である。第2の順位付け手法は、第1の順位付け手法よりも順位付けに用いる情報の数が多く、第1の順位付け手法よりも高精度な順位付けを実現できる。また、第2の順位付け手法は、順位付けに用いる情報の数が、第1の順位付け手法に順位付けに用いる情報の数と同数、又はそれ以下であっても、第1の順位付け手法よりも情報をより複雑に処理する結果、高精度な順位付けを実現できる。この場合、第2の順位付け手法は、第1の順位付け手法よりも情報処理装置100のリソース(CPUの占有時間及び消費電力)を多く費やすことにより、第1の順位付け手法よりも情報をより複雑に処理できる。例えば、第1の順位付け手法による順位付けに用いる情報として検索ワードに対応する商品(ドキュメント)の閲覧回数が用いられた場合、第2の順位付け手法に用いる情報として、第1の順位付け手法で用いた情報に加えて、ドキュメントに含まれる商品名と検索ワードとのマッチ度をさらに用いることが考えられる。  Subsequently, as shown in FIG. 4, the
  また、情報処理装置100b~dは、第2の順位付け手法による順位付けを、順位付けを行うたびに、抽出するデータの順位をより上位に変更するとともに、順位付けに用いる情報を変更して、規定の回数に到達するまで繰り返し実行する。なお、第2の順位付け手法による順位付けを繰り返し実行する規定の回数は、検索システムの管理者が任意に変更できる。  In addition, the
  図4に示す例によれば、1回目の第2の順位付け手法による順位付けの結果、ドキュメントID:「v」のドキュメントがランクキング第1位であり、ドキュメントID:「x」のドキュメントが第2位、そして、ドキュメントID:「t」のドキュメントが第3位と続く。また、図4に示す例によれば、ドキュメントID:「u」のドキュメントが最下位となっている。図4に示す「スコア」の項目に記録される点数の算出方法について一例を説明する。例えば、情報処理装置100は、第1の順位付け手法のスコアと、ドキュメントに含まれる商品名と検索ワードとのマッチ度を評価した評価値とに基づいて、1回目の第2の順位付け手法によるスコアを算出できる。ドキュメントに含まれる商品名と検索ワードとのマッチ度を評価した評価値は、以下に説明するように、商品名中の検索ワードの出現回数と商品名の語数とに基づいて評価できる。具体的には、情報処理装置100は、商品名中の検索ワードの出現回数と商品名の語数との比を評価値F1とし、第1の順位付け手法によるスコアをスコアSC1とするとき、以下の式(1)で表される値を1回目の第2の順位付け手法によるスコアSC21とすることが考えられる。つまり、情報処理装置100は、1回目の第2順位付け手法として、第1の順位付け手法によるスコアを考慮しつつ、ドキュメントに含まれる商品名と検索ワードとのマッチ度に基づくスコアリングを行う。
  スコアSC21=0.9×評価値F1+0.1×スコアSC1・・・(1)According to the example shown in FIG. 4, as a result of ranking by the second ranking method for the first time, the document with the document ID: "v" is ranked first, and the document with the document ID: "x" is ranked first. The document with document ID: "t" ranks second, and so on. Also, according to the example shown in FIG. 4, the document with the document ID: "u" is at the bottom. An example of the calculation method of the score recorded in the item of "score" shown in FIG. 4 will be described. For example, the
 Score SC21=0.9×evaluation value F1+0.1×score SC1 (1)
  続いて、図5に示すように、情報処理装置100は、1回目の第2の順位付け手法による順位付けの結果(上位1000件)から、例えば、上位100件のドキュメントを抽出する。そして、情報処理装置100は、抽出した上位100件のドキュメントについて、前回とは異なる情報を用いて、2回目の第2の順位付け手法による順位付けを行う。例えば、第2の順位付け手法に用いる情報として、第1の順位付け手法で用いた情報と、1回目の第2の順位付け手法で用いた情報に加えて、商品の詳細説明と検索ワードとのマッチ度をさらに用いることが考えられる。  Subsequently, as shown in FIG. 5, the
  図5に示す例によれば、2回目の第2の順位付け手法による順位付けの結果、ドキュメントID:「w」のドキュメントがランクキング第1位であり、ドキュメントID:「t」のドキュメントが第2位、そして、ドキュメントID:「v」のドキュメントが第3位と続く。また、図5に示す例によれば、ドキュメントID:「x」のドキュメントが最下位となっている。図5に示す「スコア」の項目に記録される点数の算出方法について一例を説明する。例えば、情報処理装置100は、第1の順位付け手法のスコアSC1と、1回目の第2の順位付け手法で算出した評価値F1と、商品の詳細説明と検索ワードとのマッチ度を評価した評価値とに基づいて、2回目の第2の順位付け手法によるスコアを算出できる。ドキュメントに含まれる商品説明と検索ワードとのマッチ度を評価した評価値は、以下に説明するように、商品説明中の検索ワードの出現回数と商品説明の語数とに基づいて評価できる。具体的には、情報処理装置100は、商品説明中の検索ワードの出現回数と商品説明の語数との比を評価値F2とするとき、以下の式(2)で表される値を2回目の第2の順位付け手法によるスコアSC22とすることが考えられる。つまり、情報処理装置100は、2回目の第2順位付け手法として、第1の順位付け手法によるスコアSC1と、第2の順位付け手法で算出した評価値F1とを考慮しつつ、ドキュメントに含まれる商品説明と検索ワードとのマッチ度に基づくスコアリングを行う。
  スコアSC22=100×評価値F2+10×評価値F1+スコアSC1・・・(2)According to the example shown in FIG. 5, as a result of the second ranking by the second ranking method, the document with the document ID: "w" is ranked first, and the document with the document ID: "t" is ranked first. The document with the document ID: "v" ranks second, and so on. Also, according to the example shown in FIG. 5, the document with the document ID: "x" is at the bottom. An example of the calculation method of the score recorded in the item of "score" shown in FIG. 5 will be described. For example, the
 Score SC22=100×evaluation value F2+10×evaluation value F1+score SC1 (2)
  続いて、図6に示すように、情報処理装置100は、2回目の第2の順位付け手法による順位付けの結果から、例えば、上位10件のドキュメントを抽出する。そして、情報処理装置100は、抽出した上位10件のドキュメントについて、前回とは異なる情報を用いて、3回目の第2の順位付け手法による順位付けを行う。例えば、3回目の第2の順位付け手法に用いる情報として、第1の順位付け手法で用いた情報と、1回目の第2の順位付け手法で用いた情報と、2回目の第2の順位付け手法で用いた情報とに加えて、ドキュメントに含まれる商品のレビューと検索ワードとのマッチ度をさらに用いることが考えられる。  Subsequently, as shown in FIG. 6, the
  図6に示す例によれば、3回目の第2の順位付け手法による順位付けの結果、ドキュメントID:「v」のドキュメントがランキング第1位であり、ドキュメントID:「n」のドキュメントが第2位、そして、ドキュメントID:「p」のドキュメントが第3位と続く。また、図6に示す例によれば、ドキュメントID:「s」のドキュメントが最下位(第10位)となっている。図6に示す「スコア」の項目に記録される点数の算出方法について一例を説明する。例えば、情報処理装置100は、第1の順位付け手法のスコアSC1と、1回目の第2の順位付け手法で算出した評価値F1と、2回目の第2の順位付け手法で算出した評価値F2と、商品のレビューと検索ワードとのマッチ度を評価した評価値とに基づいて、3回目の第2の順位付け手法によるスコアを算出できる。ドキュメントに含まれるレビューと検索ワードとのマッチ度を評価した評価値は、以下に説明するように、レビュー中の検索ワードの出現回数とレビューの語数とに基づいて評価できる。具体的には、情報処理装置100は、レビュー中の検索ワードの出現回数とレビューの語数との比を評価値F3とするとき、以下の式(3)で表される値を3回目の第2の順位付け手法によるスコアSC23とすることが考えられる。つまり、情報処理装置100は、3回目の第2順位付け手法として、第1の順位付け手法によるスコアSC1と、1回目の第2の順位付け手法で算出した評価値F1と、2回目の第2の順位付け手法で算出した評価値F2とを考慮しつつ、ドキュメントに含まれるレビューと検索ワードとのマッチ度に基づくスコアリングを行う。
  スコアSC23=1900×評価値F3+90×評価値F2+9×評価値F1+スコアSC1・・・(3)According to the example shown in FIG. 6, as a result of ranking by the second ranking method for the third time, the document with the document ID: "v" is ranked first, and the document with the document ID: "n" is ranked first. The second place is followed by the document with document ID: "p" in the third place. Further, according to the example shown in FIG. 6, the document with document ID: "s" is at the lowest rank (tenth rank). An example of the calculation method of the score recorded in the item of "score" shown in FIG. 6 will be described. For example, the
 Score SC23=1900×evaluation value F3+90×evaluation value F2+9×evaluation value F1+score SC1 (3)
  第2の順位付け手法による順位付けの規定回数が3回である場合、情報処理装置100aは、検索ドキュメントをスコア順に並べて、最終的な検索結果のランキングを作成し、順位付けの処理を終了する。そして、情報処理装置100aは、図7に示すように、作成した検索結果のランキングの中から、ユーザY1が閲覧中のウェブページに対応する検索結果を提供する。例えば、ユーザY1に対して検索結果を提供するウェブページの1ページに、5つの検索結果が表示される場合、情報処理装置100aは、ユーザY1が閲覧中のページに応じて検索結果を提供する。例えば、ユーザY1が閲覧中のウェブページが1ページ目である場合は、情報処理装置100aは、ランキング第1位~第5位のドキュメントを提供する。また、例えば、ユーザY1が閲覧中のウェブページが2ページ目である場合は、情報処理装置100aは、図7に示すように、ランキング第6位~第10位のドキュメントを提供する。If the specified number of times of ranking by the second ranking method is three, the
  このようにして、実施形態に係る情報処理装置100a~100dで構成される検索システムは、端末装置10のユーザY1から取得した検索要求に基づく検索結果について、応答速度に比重を置いた第1の順位付け手法による順位付けを行う。また、情報処理装置100b~100dは、第1の順位付け手法の結果から順位が上位のドキュメントを抽出し、抽出したドキュメントについて順位付けの精度に比重を置いた第2の順位付け手法による順位付けを行う。また、情報処理装置100b~100dは、第2の順位付け手法による順位付け処理を、抽出するデータの順位をより上位に変更するとともに、順位付けに用いる情報を変更して、規定の回数に到達するまで繰り返し実行する。このようなことから、実施形態によれば、検索結果の順位付けの精度と検索結果の応答速度とをバランスを最適化できる。In this way, the search system configured by the
[2.情報処理システムの構成]
  図8を用いて、実施形態にかかる情報処理システム1の構成について説明する。図8は、実施形態にかかる情報処理システムの構成例を示す図である。図8に示すように、情報処理システム1は、端末装置10と、情報処理装置100a~100dとを有する。[2. Configuration of information processing system]
 The configuration of the
  端末装置10及び複数の情報処理装置100は、ネットワークNを介して、有線または無線により通信可能に接続される。ネットワークNは、LAN(Local  Area  Network)、WAN(Wide  Area  Network)、電話網(携帯電話網、固定電話網等)、地域IP(Internet  Protocol)網、インターネット等の通信ネットワークである。ネットワークNには、有線ネットワークが含まれていてもよいし、無線ネットワークが含まれていてもよい。なお、情報処理システム1は、図8に示す例には特に限定されず、図8に示す数よりも多くの情報処理装置100で構成されてもよいし、1台の情報処理装置100で構成されてもよい。  A
  端末装置10は、ユーザによって利用される端末装置である。端末装置10は、例えば、スマートフォンや、タブレット型端末や、ノート型PC(Personal  Computer)や、デスクトップPCや、携帯電話機や、PDA(Personal  Digital  Assistant)等である。端末装置10は、情報処理装置100が管理するサイト内検索用の検索要求を送信する。端末装置10のユーザは、ECサイト内の検索入力欄に、所望の検索ワード(キーワードクエリ)を入力することにより検索要求を行う。  The
  また、端末装置10は、端末装置10にプリインストールされたウェブブラウザ又はアプリケーションにより、情報処理装置100から取得する検索結果のウェブページをディスプレイに表示する。端末装置10は、情報処理装置100によって提供される情報の表示処理を実現する制御情報を情報処理装置100から受け取った場合には、制御情報に従って表示処理を実現する。  In addition, the
  情報処理装置100は、端末装置10のユーザからの検索要求に応じて、検索結果を提供(返却)するサーバ装置である。複数の情報処理装置100により、検索処理を分散処理する検索システムを構成する。例えば、図1に例示するように、情報処理装置100aは、検索システムにおける検索処理を管理するサーチヘッドの役割を担う情報処理装置100aと、検索要求を分散処理する処理サーバとしての役割を担う情報処理装置100b~100dとを含んで構成される。情報処理装置100a~100dは、ECサイトにデプロイされた検索入力欄に対する検索ワードに基づいて、検索処理を実行する。図1に示す例では、情報処理装置100aがサーチヘッドとして機能するが、情報処理装置100b~100dのいずれかがサーチヘッドして機能してもよい。情報処理装置100a~100dは、それぞれが同一の処理機能を備えてよい。  The
[3.情報処理装置の構成]
  図9を用いて、実施形態に係る情報処理装置100の構成について説明する。図9は、実施形態に係る情報処理装置の構成例を示す図である。図9に示すように、情報処理装置100は、通信部110と、記憶部120と、制御部130とを有する。[3. Configuration of information processing device]
 The configuration of the
(通信部110について)
  通信部110は、例えば、NIC(Network  Interface  Card)等によって実現される。通信部110は、ネットワークNと有線または無線で接続される。情報処理装置100は、ネットワークNを介して、端末装置10との間で情報の送受信を行う。(Regarding communication unit 110)
 The communication unit 110 is realized by, for example, a NIC (Network Interface Card) or the like. The communication unit 110 is connected to the network N by wire or wirelessly. The
(記憶部120について)
  記憶部120は、例えば、RAM(Random  Access  Memory)、フラッシュメモリ等の半導体メモリ素子、または、ハードディスク、光ディスク等の記憶装置によって実現される。記憶部120は、ドキュメントDB121と、サイト情報DB122とを有する。(Regarding storage unit 120)
 The storage unit 120 is realized by, for example, a RAM (Random Access Memory), a semiconductor memory device such as a flash memory, or a storage device such as a hard disk or an optical disk. Storage unit 120 has document DB 121 and site information DB 122 .
  ドキュメントDB121は、情報処理装置100が管理するサイトにおいて、端末装置10に提供するドキュメントデータを記憶する。ドキュメントDB121が記憶するドキュメントデータは、商品名や、商品の詳細説明や、商品に対するレビューの情報を含む。サイト情報DB122は、情報処理装置100が管理するサイトにおけるユーザの行動ログを記憶する。サイト情報DB122が記憶する行動ログは、ECサイトにおいて端末装置10のユーザに閲覧された検索ワードに対応する商品の閲覧回数を含む。  The document DB 121 stores document data to be provided to the
(制御部130について)
  制御部130は、コントローラ(controller)であり、CPU(Central  Processing  Unit)やMPU(Micro  Processing  Unit)等によって、情報処理装置100内部の記憶装置に記憶されている各種プログラムがRAMを作業領域として実行されることにより実現される。また、制御部130は、例えば、ASIC(Application  Specific  Integrated  Circuit)やFPGA(Field  Programmable  Gate  Array)等の集積回路により実現される。(Regarding the control unit 130)
 The
  図9に示すように、制御部130は、検索部131と、順位付け部132と、提供部133とを有する。制御部130は、これらの各部により、以下に説明する情報処理の機能や作用を実現または実行する。なお、制御部130の内部構成は、図9に示した構成に限られず、後述する情報処理を行う構成であれば他の構成であってもよい。  As shown in FIG. 9 , the
(検索部131について)
  検索部131は、端末装置10から送信された検索要求に含まれる検索ワードに基づくデータ検索(ドキュメント検索)を行う。検索部131は、検索ワードに合致するドキュメントDB121の全レコードを走査する。例えば、検索部131は、検索ワード「スマートフォン+ケース」を取得すると、検索ワード:「スマートフォン」の索引(インデックス)と、検索ワード:「ケース」の索引(インデックス)とに基づいて、ドキュメントDB121に記録されているドキュメントの検索を行う。(Regarding the search unit 131)
 The search unit 131 performs a data search (document search) based on search words included in search requests sent from the
(順位付け部132について)
  順位付け部132は、検索部131による検索結果について順位付けを実行する。具体的には、順位付け部132は、検索部131による全ての検索結果に対して、第1の順位付け手法により順位付けを行い、第1の順位付け手法による順位付け結果のうち順位が上位のデータを抽出して、抽出した順位が上位のデータに対し、第1の順位付け手法よりも高精度な第2の順位付け手法により順位付けを行う。(Regarding the ranking unit 132)
 The
第1の順位付け手法は、順位付けの精度よりも応答速度に比重を置いた高速な検索手法である。例えば、第1の順位付け手法による順位付けに用いる情報として、検索ワードに対応する商品(ドキュメント)の閲覧回数や検索ワードに紐付く購入回数(検索ワードに対応する検索結果から購入に至った回数)などが考えられる。第2の順位付け手法は、応答速度よりも順位付けの精度に比重を置いた高精度な検索手法である。第2の順位付け手法は、第1の順位付け手法よりも順位付けに用いる情報の数が多く、第1の順位付け手法よりも高精度な順位付けを実現できる。例えば、第1の順位付け手法による順位付けに用いる情報として検索ワードに対応する商品(ドキュメント)の閲覧回数が用いられた場合、第2の順位付け手法に用いる情報として、第1の順位付け手法で用いた情報に加えて、ドキュメントに含まれる商品名と検索ワードとのマッチ度をさらに用いることが考えられる。 The first ranking method is a high-speed search method that emphasizes response speed rather than ranking accuracy. For example, as the information used for ranking by the first ranking method, the number of views of the product (document) corresponding to the search word and the number of purchases linked to the search word (the number of purchases from the search results corresponding to the search word) ), etc. The second ranking method is a high-precision retrieval method that places more emphasis on ranking accuracy than on response speed. The second ranking method uses a larger amount of information for ranking than the first ranking method, and can achieve higher-precision ranking than the first ranking method. For example, when the number of views of a product (document) corresponding to a search word is used as the information used for ranking by the first ranking method, the information used for the second ranking method is the first ranking method. In addition to the information used in (1), it is conceivable to further use the degree of matching between the product name contained in the document and the search word.
  また、順位付け部132は、第2の順位付け手法による順位付けを、順位付けを行うたびに、抽出するデータの順位をより上位に変更するとともに、順位付けに用いる情報を変更して、規定の回数に到達するまで繰り返し実行する。順位付け部132により実行される第2の順位付け手法による順位付けの繰り返し実行する規定の回数は、検索システムの管理者により任意に変更が可能である。  In addition, the
  例えば、順位付け部132は、1回目の第2の順位付け手法による順位付けの結果(上位1000件)から、例えば、上位100件のドキュメントを抽出する。そして、情報処理装置100は、抽出した上位100件のドキュメントについて、前回とは異なる情報を用いて、2回目の第2の順位付け手法による順位付けを行う。例えば、第2の順位付け手法に用いる情報として、第1の順位付け手法で用いた情報、及び1回目の第2の順位付け手法で用いた情報(ドキュメントに含まれる商品名と検索ワードとのマッチ度)に加えて、商品の詳細説明と検索ワードとのマッチ度をさらに用いることが考えられる。  For example, the
  順位付け部132は、第2の順位付け手法による順位付けの実行回数が規定の回数に到達した場合、最終的な検索結果のランキングを作成し、順位付けの処理を終了する。  When the number of executions of ranking by the second ranking method reaches a specified number, the
(提供部133について)
  提供部133は、順位付け部132により作成された最終的な検索結果のランキングを検索結果として端末装置10に提供する。(Regarding the providing unit 133)
 The providing
[4.処理手順]
  以下、図10を用いて、実施形態に係る情報処理システムにおける処理の流れについて説明する。図10は、実施形態に係る情報処理システムにおける処理の流れを示すシーケンス図である。[4. Processing procedure]
 The flow of processing in the information processing system according to the embodiment will be described below with reference to FIG. FIG. 10 is a sequence diagram illustrating the flow of processing in the information processing system according to the embodiment;
  図10に示すように、端末装置10は、検索要求を情報処理装置100aに送信する(ステップS101)。情報処理装置100aは、端末装置10から取得した検索要求から検索ワードを取得する(ステップS102)。  As shown in FIG. 10, the
  情報処理装置100aは、取得した検索ワードを情報処理装置100b~100dにそれぞれ転送する(ステップS103)。  The
  情報処理装置100b~100dは、情報処理装置100aから取得した検索ワードに基づいて、検索処理を実行する(ステップS104)。情報処理装置100b~100dは、検索処理の処理結果を情報処理装置100aに送信する(ステップS105)。  The
  情報処理装置100aは、情報処理装置100b~100dから取得した検索処理の処理結果に基づいて、最終的な検索結果のランキングを作成する(ステップS106)。そして、情報処理装置100aは、検索結果を端末装置10に送信する(ステップS107)。  The
  端末装置10は、情報処理装置100aから受信した検索結果を表示する(ステップS108)。  The
  以下、図11を用いて、実施形態に係る情報処理装置による検索処理について説明する。図11は、実施形態に係る情報処理装置による検索処理の手順を示すフローチャートである。図11に示す処理手順は、情報処理装置100(100b~100d)の制御部130により実行される。図11に示す処理手順は、情報処理装置100(100b~100d)の稼働中、繰り返し実行される。  Search processing by the information processing apparatus according to the embodiment will be described below with reference to FIG. 11 . FIG. 11 is a flowchart illustrating a procedure of search processing by the information processing apparatus according to the embodiment; The processing procedure shown in FIG. 11 is executed by the
検索部131は、検索ワードに基づいて、検索ワードに合致する全レコードを走査し、検索ワードに合致する検索ドキュメントのドキュメントリストを作成する(ステップS201)。 Based on the search word, the search unit 131 scans all records that match the search word, and creates a document list of search documents that match the search word (step S201).
  順位付け部132は、検索部131により作成されたドキュメントリストを用いて、第1の順位付け手法により検索ドキュメントの順位付けを行う。(ステップS202)。  The
  続いて、順位付け部132は、第1の順位付け手法による順位付け結果から、順位が上位(例えば、上位1000件)のドキュメントを抽出する(ステップS203)。  Subsequently, the
  続いて、順位付け部132は、抽出した順位が上位のドキュメントを第2の順位付け手法により順位付けを行う(ステップS204)。  Subsequently, the
  続いて、順位付け部132は、第2の順位付け手法による順位付けの実行回数が規定回数に到達しているか否かを判定する(ステップS205)。  Subsequently, the
  順位付け部132は、第2の順位付け手法による順位付けの実行回数が規定回数に到達していると判定した場合(ステップS205;Yes)、最終的な検索結果のランキングを作成し(ステップS206)、図11に示す処理手順を終了する。  If the
  一方、順位付け部132は、第2の順位付け手法による順位付けの実行回数が規定回数に到達していないと判定した場合(ステップS205;No)、検索ドキュメントの抽出順位をより上位に変更し(ステップS207)、順位付けに用いる情報を変更して(ステップS208)、上記ステップS203の処理手順に戻り、再び、第2の順位付け手法による順位付けを実行する。  On the other hand, if the
[5.変形例]
  上記実施形態にかかる情報処理装置100は、上記実施形態以外にも種々の異なる形態にて実施されてよい。そこで、以下では、情報処理装置100の他の実施形態について説明する。[5. Modification]
 The
上記実施形態において、情報処理装置100(100b~100d)は、ルールベースの第2の順位付け手法を用いて、検索ドキュメントの順位付けを行う例を説明したが、この例には特に限定される必要はない。例えば、情報処理装置100(100b~100d)は、第2の順位付け手法の代わりに、順位付けするデータに付与されたラベルの順序関係に従ってモデルの出力するスコアが高くなるように機械学習された学習済みモデルを用いて、検索結果の順位付けを行ってもよい。 In the above embodiment, the information processing apparatus 100 (100b to 100d) uses the rule-based second ranking method to rank search documents. However, this example is particularly limited. No need. For example, instead of the second ranking method, the information processing device 100 (100b to 100d) is machine-learned so that the score output by the model increases according to the order relationship of the labels given to the data to be ranked. A trained model may be used to rank search results.
例えば、機械学習の手法の1つに、ドキュメント間の順序関係を学習するランキング学習という手法がある。図12は、変形例に係る機械学習モデルの構築例を示す図である。図3に示すように、検索キーワードに対し、各ドキュメントに「優」、「良」、「悪」の3段階のラベルが振られているとする。 For example, one of machine learning methods is a method called ranking learning for learning the order relationship between documents. FIG. 12 is a diagram illustrating a construction example of a machine learning model according to a modification. As shown in FIG. 3, it is assumed that each document is assigned a three-level label of "excellent", "good", and "bad" with respect to a search keyword.
「優」(Excellent)は、検索結果の上位に出て欲しいドキュメント(以下、「文書」と称する。)に振られるラベルである。例えば、ユーザY1がクリックし、さらに購入等のコンバージョン(conversion:CV)に至った文書であれば、「優」のラベルが振られる。「優」のラベルは、数値「2」であってもよい。"Excellent" is a label assigned to a document (hereinafter referred to as "document") that is desired to appear at the top of the search results. For example, if the document is clicked by the userY1 and is converted to purchase or the like (CV: CV), the label "excellent" is given. The label for "excellent" may be the numeric value "2".
「良」(Good)は、検索結果の上位に出ていても違和感はない程度の文書に振られるラベルである。例えば、ユーザY1がクリックしたが、コンバージョンには至らなかった文書であれば、「良」のラベルが振られる。「良」のラベルは、数値「1」であってもよい。"Good" is a label assigned to a document that does not feel out of place even if it appears at the top of the search results. For example, a document that was clicked by userY1 but did not result in conversion would be labeled as "good". A "good" label may be the numeric value "1".
「悪」(Bad)は、検索結果に出て欲しくない文書に振られるラベルである。例えば、ユーザY1がクリックすらしなかった文書であれば、「悪」のラベルが振られる。「悪」のラベルは、数値「0」であってもよい。"Bad" is a label assigned to documents that should not appear in search results. For example, a document that userY1 did not even click on would be labeled "bad". A "bad" label may be the numeric value "0".
ラベルの順序関係は、「優」>「良」>「悪」の順である。なお、上記の3段階のラベルは一例に過ぎない。実際には、「必」>「優」>「良」>「可」>「悪」のような5段階のラベルであってもよい。すなわち、ラベルの種類および段階の数は任意である。 The order relationship of the labels is "excellent">"good">"bad". Note that the three-step label described above is merely an example. In practice, it may be a five-level label such as "necessary">"excellent">"good">"acceptable">"bad". That is, the types of labels and the number of stages are arbitrary.
「必」(Perfect)は、検索結果の最上位に出て欲しい文書に振られるラベルである。例えば、ユーザY1が商品購入のために普段使いしているサイト等、クリックした際には必ず(又は高確率で)コンバージョンに至る文書であれば、「必」のラベルが振られる。"Perfect" is a label assigned to a document desired to appear at the top of the search results. For example, if it is a document that always (or with a high probability) converts when clicked, such as a site that userY1 usually uses to purchase a product, the label "necessary" is assigned.
「可」(Fair)は、検索結果に出ていても許される程度の文書に振られるラベルである。例えば、単にユーザY1がクリックしただけの文書であれば、「可」のラベルが振られる。なお、最終的にコンバージョンには至らなかったが、ユーザY1がコンバージョンを検討(商品をカートに入れる等)した文書や、ユーザY1が長時間(所定時間以上)滞在・視聴した文書であれば、「良」のラベルが振られる。"Fair" is a label assigned to documents that are permitted even if they appear in the search results. For example, if the document is simply clicked by userY1 , it is labeled as "OK". In addition, even if the document did not lead toconversion in the end, but the conversion was considered by userY1 (putting the product in the cart, etc.) label as "good".
また、同じ行動についても、文書に対してその行動が行われた回数(行動階数)に応じてラベルを分けてもよい。例えば、購入が1回だけなら「優1」、複数回であれば「優2」、定期的に繰り返し購入されている場合は「優3」等のラベルが振られるようにしてもよい。この場合、ラベルの順序関係は、「優3」>「優2」>「優1」の順である。 Moreover, even for the same action, labels may be divided according to the number of times the action is performed on the document (action rank). For example, a label such as "Excellent 1" may be assigned if the item is purchased only once, "Excellent 2" if purchased multiple times, and "Excellent 3" if purchased repeatedly. In this case, the order relationship of the labels is "Excellent 3">"Excellent 2">"Excellent 1".
  また、情報処理装置100は、同一の文章について、検索クエリ(検索ワード)ごとに異なるラベルを付与する。例えば、「しょうゆさし」の文章について、検索クエリに「しょうゆ」と入れたときに「しょうゆさし」の文章は「良」もしくは「悪」のラベルとなるが、検索クエリに「しょうゆさし」と入れたときに「しょうゆさし」の文章は「優」のラベルとなる。すなわち、同一の「しょうゆさし」の文章について、検索クエリが「しょうゆ」の場合には「良」もしくは「悪」のラベルが付与され、検索クエリが「しょうゆさし」の場合には「優」のラベルが付与される。このように、同一の文章であっても、検索クエリごとに異なるラベルが付与されて学習がなされる。  In addition, the
ラベルの付与は、ガイドラインを定めて付与する、ユーザY1の行動ログ(文書のクリックログなど)を活用して付与する、などの方法が取られる。Labels may be assigned according to a guideline, or based on userY1 's action log (document click log, etc.).
また、各文書には、その文書の情報を表す特徴量が与えられている。 In addition, each document is given a feature amount representing the information of the document.
図12に示すように、ランキング学習では、ラベルの順序関係に従ってモデルの出力するスコアが高くなるように、学習が進む。スコアは、例えばラベル値の合計値等である。 As shown in FIG. 12, in ranking learning, learning progresses so that the score output by the model increases according to the order relationship of the labels. The score is, for example, the total value of label values.
  変形例に係る情報処理装置100は、上述したランキング学習を用いた機械学習モデル(ランキングモデル)をユーザY1の行動ログから構築する。そして、変形例に係る情報処理装置100は、構築した機械学習モデルから出力されるスコアを用いて、第2の順位付け手法に代わる文書(商品)の順位付けを行う。The
[6.ハードウェア構成]
  実施形態にかかる情報処理装置100は、例えば図13に示すような構成のコンピュータ1000によって実現される。図13は、実施形態に係る情報処理装置の機能を実現するコンピュータの一例を示すハードウェア構成図である。[6. Hardware configuration]
 The
  コンピュータ1000は、CPU1100、RAM1200、ROM1300、HDD1400、通信インターフェイス(I/F)1500、入出力インターフェイス(I/F)1600、及びメディアインターフェイス(I/F)1700を有する。
  CPU1100は、ROM1300又はHDD1400に格納されたプログラムに基づいて動作し、各部の制御を行う。ROM1300は、コンピュータ1000の起動時にCPU1100によって実行されるブートプログラムや、コンピュータ1000のハードウェアに依存するプログラム等を格納する。  The
  HDD1400は、CPU1100によって実行されるプログラム、および、かかるプログラムによって使用されるデータ等を格納する。通信インターフェイス1500は、通信網50を介して他の機器からデータを受信してCPU1100へ送り、CPU1100が生成したデータを、ネットワーク(通信網)Nを介して他の機器へ送信する。
  CPU1100は、入出力インターフェイス1600を介して、ディスプレイやプリンタ等の出力装置、及び、キーボードやマウス等の入力装置を制御する。CPU1100は、入出力インターフェイス1600を介して、入力装置からデータを取得する。また、CPU1100は、生成したデータを、入出力インターフェイス1600を介して出力装置へ出力する。  The
  メディアインターフェイス1700は、記録媒体1800に格納されたプログラム又はデータを読み取り、RAM1200を介してCPU1100に提供する。CPU1100は、かかるプログラムを、メディアインターフェイス1700を介して記録媒体1800からRAM1200上にロードし、ロードしたプログラムを実行する。記録媒体1800は、例えばDVD(Digital  Versatile  Disc)、PD(Phase  change  rewritable  Disk)等の光学記録媒体、MO(Magneto-Optical  disk)等の光磁気記録媒体、テープ媒体、磁気記録媒体、または半導体メモリ等である。
  例えば、コンピュータ1000が実施形態にかかる情報処理装置100として機能する場合、コンピュータ1000のCPU1100は、RAM1200上にロードされたプログラムを実行することにより、制御部130の機能を実現する。また、HDD1400には、記憶部120内のデータが格納される。コンピュータ1000のCPU1100は、これらのプログラムを、記録媒体1800から読み取って実行するが、他の例として、他の装置から、通信網50を介してこれらのプログラムを取得してもよい。  For example, when the
[7.その他]
  上記実施形態において説明した各処理のうち、自動的に行われるものとして説明した処理の全部または一部を手動的に行うこともでき、あるいは、手動的に行われるものとして説明した処理の全部または一部を公知の方法で自動的に行うこともできる。この他、上記文書中や図面中で示した処理手順、具体的名称、各種のデータやパラメータを含む情報については、特記する場合を除いて任意に変更することができる。[7. others]
 Of the processes described in the above embodiments, all or part of the processes described as being automatically performed can be manually performed, or all or part of the processes described as being manually performed. Part can also be done automatically by known methods. In addition, information including processing procedures, specific names, various data and parameters shown in the above documents and drawings can be arbitrarily changed unless otherwise specified.
  上記実施形態において、第1の順位付け手法及び第2の順位付け手法は、情報処理装置100の処理機能を提供するプログラムに対するアドオンとして実現してもよいし、軽量なプログラミング言語などを用いて柔軟に記述してもよい。  In the above embodiments, the first ranking method and the second ranking method may be implemented as an add-on to a program that provides the processing functions of the
また、図示した各装置の各構成要素は機能概念的なものであり、必ずしも物理的に図示の如く構成されていることを要しない。すなわち、各装置の分散・統合の具体的形態は図示のものに限られず、その全部または一部を、各種の負荷や使用状況などに応じて、任意の単位で機能的または物理的に分散・統合して構成することができる。 Also, each component of each device illustrated is functionally conceptual, and does not necessarily need to be physically configured as illustrated. In other words, the specific form of distribution and integration of each device is not limited to the one shown in the figure, and all or part of them can be functionally or physically distributed and integrated in arbitrary units according to various loads and usage conditions. Can be integrated and configured.
また、上述してきた各実施形態は、処理内容を矛盾させない範囲で適宜組み合わせることが可能である。 Moreover, each of the embodiments described above can be appropriately combined within a range that does not contradict the processing contents.
[8.効果]
  実施形態に係る情報処理装置100は、検索部131と、順位付け部132とを有する。検索部131は、検索ワードに基づくデータ検索を行う。順位付け部132は、検索部131による検索結果に対して、第1の順位付け手法により順位付けを行い、第1の順位付け手法による順位付け結果のうち順位が上位のデータを抽出して、抽出した順位が上位のデータに対し、第1の順位付け手法よりも高精度な第2の順位付け手法により順位付けを行う。[8. effect]
 The
  このように、実施形態に係る情報処理装置100は、検索結果に対して、高速な順位付け手法による順位付けを行い、順位付け結果の絞込みを行った後、高精度な順位付け手法による順位付けを行う。このため、情報処理装置100は、検索結果の順位付けの精度と検索結果の応答速度とをバランスを最適化できる。  As described above, the
  また、情報処理装置100において、順位付け部132は、第2の順位付け手法による順位付けを、順位付けを行うたびに、抽出するデータの順位をより上位に変更するとともに、順位付けに用いる情報を変更して、規定の回数に到達するまで繰り返し実行する。このため、情報処理装置100は、順位付けの精度を高めることができる。  Further, in the
  また、情報処理装置100において、第2の順位付け手法は、第1の順位付け手法よりも順位付けに用いる情報数が多い。このため、情報処理装置100は、第1の順位付け手法よりも第2の順位付け手法の順位付けの精度を高めることができる。  Further, in the
  また、情報処理装置100において、第2の順位付け手法は、第1の順位付け手法により用いられる情報数と同数以下の情報を用いる場合であっても、第1の順位付け手法より情報を処理する際に費やすリソース及び電力よりも、リソース及び電力を多く費やして情報を処理する。このため、情報処理装置100は、第1の順位付け手法よりも第2の順位付け手法の順位付けの精度を高めることができる。  Further, in the
  また、情報処理装置100において、順位付け部132は、第1の順位付け手法として、検索ワードに合致する検索結果の閲覧回数又は検索ワードに紐付く購入回数に基づいて、検索結果の順位付けを行う。このため、情報処理装置100は、応答速度に比重をおいた軽量な順位付けを実現できる。  In the
  また、情報処理装置100において、順位付け部132は、第2の順位付け手法として、検索ワードと検索ワードに合致する検索結果とのマッチ度に基づいて、第1の順位付け手法による順位付け結果のうちの上位のデータの順位付けを行う。このため、情報処理装置100は、応答速度よりも精度に比重をおいた順位付けを実現できる。  Further, in the
  また、情報処理装置100において、検索結果は、電子商取引におけるサイト内検索に入力された検索ワードに合致する商品に関する文書である。また、文書は、検索処理により検索ワードに合致すると判定された商品の固有名称である商品名、マーケティングコピーとして文書内に記述された商品説明、及び商品に対する評価として文書内に記録されたレビューのうちの少なくともいずれかを含む。このため、情報処理装置100は、検索ワードと検索結果のマッチ度を様々な角度から評価して順位付け結果に反映できる。  Further, in the
  また、情報処理装置100において、順位付け部132は、第2の順位付け手法の代わりに、順位付けするデータに付与されたラベルの順序関係に従ってモデルの出力するスコアが高くなるように機械学習された学習済みモデルを用いて、検索結果の順位付けを行う。このため、高精度の順位付けを迅速に行うことができる。  Further, in the
以上、本願の実施形態をいくつかの図面に基づいて詳細に説明したが、これらは例示であり、発明の開示の欄に記載の態様を始めとして、当業者の知識に基づいて種々の変形、改良を施した他の形態で本発明を実施することが可能である。 As described above, the embodiments of the present application have been described in detail based on several drawings, but these are examples, and various modifications and It is possible to carry out the invention in other forms with modifications.
また、上述してきた「部(section、module、unit)」は、「手段」や「回路」などに読み替えることができる。例えば、特定部は、特定手段や特定回路に読み替えることができる。 Also, the above-mentioned "section, module, unit" can be read as "means" or "circuit". For example, the identifying unit can be read as identifying means or a specific circuit.
      1      情報処理システム
    10      端末装置
  100      情報処理装置
  110      通信部
  120      記憶部
  121      ドキュメントDB
  122      サイト情報DB
  130      制御部
  131      検索部
  132      順位付け部
  133      提供部1
 122 Site information DB
 130 control unit 131
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| JP2020127058AJP7309669B2 (en) | 2020-07-28 | 2020-07-28 | Information processing device, information processing method, and information processing program | 
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| JP2020127058AJP7309669B2 (en) | 2020-07-28 | 2020-07-28 | Information processing device, information processing method, and information processing program | 
| Publication Number | Publication Date | 
|---|---|
| JP2022024449A JP2022024449A (en) | 2022-02-09 | 
| JP7309669B2true JP7309669B2 (en) | 2023-07-18 | 
| Application Number | Title | Priority Date | Filing Date | 
|---|---|---|---|
| JP2020127058AActiveJP7309669B2 (en) | 2020-07-28 | 2020-07-28 | Information processing device, information processing method, and information processing program | 
| Country | Link | 
|---|---|
| JP (1) | JP7309669B2 (en) | 
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| KR102753339B1 (en)* | 2022-11-29 | 2025-01-14 | 한국전자통신연구원 | Method and apparatus for searching groupware bulletin board | 
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| JP2008299655A (en) | 2007-05-31 | 2008-12-11 | Ntt Resonant Inc | Information retrieval device | 
| US20130124534A1 (en) | 2011-11-15 | 2013-05-16 | Long Van Dinh | Apparatus and method for information access, search, rank and retrieval | 
| JP2017509070A (en) | 2014-03-28 | 2017-03-30 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | Data search process | 
| JP2018151995A (en) | 2017-03-14 | 2018-09-27 | ヤフー株式会社 | Information providing device, information providing method, and information providing program | 
| JP2019067226A (en) | 2017-10-03 | 2019-04-25 | ヤフー株式会社 | INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM | 
| JP2019125316A (en) | 2018-01-19 | 2019-07-25 | 日本電信電話株式会社 | Retrieval device, retrieval method and program | 
| US20200183985A1 (en) | 2018-10-24 | 2020-06-11 | Alibaba Group Holding Limited | Intelligent customer services based on a vector propagation on a click graph model | 
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| JP6300984B1 (en)* | 2017-04-19 | 2018-03-28 | ヤフー株式会社 | Information processing apparatus, information processing method, and program | 
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| JP2008299655A (en) | 2007-05-31 | 2008-12-11 | Ntt Resonant Inc | Information retrieval device | 
| US20130124534A1 (en) | 2011-11-15 | 2013-05-16 | Long Van Dinh | Apparatus and method for information access, search, rank and retrieval | 
| JP2017509070A (en) | 2014-03-28 | 2017-03-30 | アリババ・グループ・ホールディング・リミテッドAlibaba Group Holding Limited | Data search process | 
| JP2018151995A (en) | 2017-03-14 | 2018-09-27 | ヤフー株式会社 | Information providing device, information providing method, and information providing program | 
| JP2019067226A (en) | 2017-10-03 | 2019-04-25 | ヤフー株式会社 | INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM | 
| JP2019125316A (en) | 2018-01-19 | 2019-07-25 | 日本電信電話株式会社 | Retrieval device, retrieval method and program | 
| US20200183985A1 (en) | 2018-10-24 | 2020-06-11 | Alibaba Group Holding Limited | Intelligent customer services based on a vector propagation on a click graph model | 
| Publication number | Publication date | 
|---|---|
| JP2022024449A (en) | 2022-02-09 | 
| Publication | Publication Date | Title | 
|---|---|---|
| US12386845B2 (en) | Method and system for presenting a search result in a search result card | |
| US11556865B2 (en) | User-centric browser location | |
| JP6698040B2 (en) | Generation device, generation method, and generation program | |
| TWI471737B (en) | System and method for trail identification with search results | |
| KR101506380B1 (en) | Infinite browse | |
| US20140289239A1 (en) | Recommendation tuning using interest correlation | |
| US20060287988A1 (en) | Keyword charaterization and application | |
| EP2188712A2 (en) | Recommendation systems and methods | |
| JP2001265808A (en) | System and method for information retrieval | |
| JP6405343B2 (en) | Information processing apparatus, information processing method, and program | |
| JP6501936B1 (en) | INFORMATION PROCESSING APPARATUS, INFORMATION PROCESSING METHOD, AND PROGRAM | |
| US20160299951A1 (en) | Processing a search query and retrieving targeted records from a networked database system | |
| JP6593873B2 (en) | Information analysis apparatus and information analysis method | |
| JP4939637B2 (en) | Information providing apparatus, information providing method, program, and information recording medium | |
| US10643142B2 (en) | Search term prediction | |
| US10387934B1 (en) | Method medium and system for category prediction for a changed shopping mission | |
| JP6568284B1 (en) | Providing device, providing method, and providing program | |
| JP7309669B2 (en) | Information processing device, information processing method, and information processing program | |
| TW201523305A (en) | Search system, search criteria setting device, control method for search criteria setting device, program, and information storage medium | |
| JP2013011940A (en) | Information providing server, information retrieval system, information retrieval method, and information retrieval program | |
| US20110264518A1 (en) | Learning a ranker to rank entities with automatically derived domain-specific preferences | |
| JP2012043290A (en) | Information providing device, information providing method, program, and information recording medium | |
| JP7203398B1 (en) | PAGE GENERATOR, WEB PAGE PRODUCTION METHOD, AND PROGRAM | |
| JP7104257B1 (en) | Information processing equipment, information processing methods, and information processing programs | |
| RU2839310C1 (en) | System and method for ranking search results in search engine | 
| Date | Code | Title | Description | 
|---|---|---|---|
| A80 | Written request to apply exceptions to lack of novelty of invention | Free format text:JAPANESE INTERMEDIATE CODE: A80 Effective date:20200826 | |
| A621 | Written request for application examination | Free format text:JAPANESE INTERMEDIATE CODE: A621 Effective date:20210719 | |
| A977 | Report on retrieval | Free format text:JAPANESE INTERMEDIATE CODE: A971007 Effective date:20220413 | |
| A131 | Notification of reasons for refusal | Free format text:JAPANESE INTERMEDIATE CODE: A131 Effective date:20220531 | |
| A521 | Request for written amendment filed | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20220728 | |
| A02 | Decision of refusal | Free format text:JAPANESE INTERMEDIATE CODE: A02 Effective date:20221213 | |
| A521 | Request for written amendment filed | Free format text:JAPANESE INTERMEDIATE CODE: A523 Effective date:20230313 | |
| C60 | Trial request (containing other claim documents, opposition documents) | Free format text:JAPANESE INTERMEDIATE CODE: C60 Effective date:20230313 | |
| A911 | Transfer to examiner for re-examination before appeal (zenchi) | Free format text:JAPANESE INTERMEDIATE CODE: A911 Effective date:20230323 | |
| C21 | Notice of transfer of a case for reconsideration by examiners before appeal proceedings | Free format text:JAPANESE INTERMEDIATE CODE: C21 Effective date:20230328 | |
| TRDD | Decision of grant or rejection written | ||
| A01 | Written decision to grant a patent or to grant a registration (utility model) | Free format text:JAPANESE INTERMEDIATE CODE: A01 Effective date:20230606 | |
| A61 | First payment of annual fees (during grant procedure) | Free format text:JAPANESE INTERMEDIATE CODE: A61 Effective date:20230705 | |
| R150 | Certificate of patent or registration of utility model | Ref document number:7309669 Country of ref document:JP Free format text:JAPANESE INTERMEDIATE CODE: R150 | |
| S111 | Request for change of ownership or part of ownership | Free format text:JAPANESE INTERMEDIATE CODE: R313111 | |
| R350 | Written notification of registration of transfer | Free format text:JAPANESE INTERMEDIATE CODE: R350 |