
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
ここにツイート内容が記載されますhttps://b.hatena.ne.jp/URLはspanで囲んでください
Twitterで共有ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

こんにちは。技術本部 Contract One Engineering Unit の伊藤です。Sansan株式会社でAI 契約データベー...こんにちは。技術本部 Contract One Engineering Unit の伊藤です。Sansan株式会社でAI 契約データベース「Contract One」の開発を担当しています。 Contract Oneでは契約書検索をコア機能として提供していますが、実運用では社名の表記揺れや新旧社名による検索漏れが課題となっていました。たとえば「さんさん」と入力しても「Sansan株式会社」にヒットしてほしいですし、旧社名「三三株式会社」を検索しても新社名に紐づく契約書がヒットするようになって欲しいという要望がありました。 そこでElasticsearchの同義語検索機能を導入し、複数の表記を吸収して検索できる仕組みを追加しました。これにより検索精度は大きく改善しましたが、大規模な同義語辞書を使う中で一部性能が劣化する部分がありました。本記事では、その調査過程と得られた知見を共有します。





