Movatterモバイル変換


[0]ホーム

URL:


はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマーク
  • テクノロジー
  • 大規模同義語辞書でElasticsearchのIndex作成が重くなる問題とその対策 - Sansan Tech Blog
  • Twitterでシェア
  • Facebookでシェア

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されますhttps://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

12usersがブックマークコメント2

    ガイドラインをご確認の上、良識あるコメントにご協力ください

    0/0
    入力したタグを追加

    現在プライベートモードです設定を変更する

    おすすめタグタグについて

      よく使うタグ

        大規模同義語辞書でElasticsearchのIndex作成が重くなる問題とその対策 - Sansan Tech Blog

        ガイドラインをご確認の上、良識あるコメントにご協力ください

        0/0
        入力したタグを追加

        現在プライベートモードです設定を変更する

        おすすめタグタグについて

          よく使うタグ

            はてなブックマーク

            はてなブックマークで
            関心をシェアしよう

            みんなの興味と感想が集まることで
            新しい発見や、深堀りがもっと楽しく

            ユーザー登録

            アカウントをお持ちの方はログインページ

            記事へのコメント2

            • 注目コメント
            • 新着コメント
            tofu-kun
            あいまい検索の精度調整、難しいよね

              その他
              sh19910711
              "N-gram は文字列を細かく分割して多数のトークンを生成します。そこに大量の同義語エントリを扱う仕組みが加わると、トークン数の増加に対して指数関数的に FST 構築のコスト(時間・CPU)が増大"

              その他

              注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

              リンクを埋め込む

              以下のコードをコピーしてサイトに埋め込むことができます

              プレビュー
              アプリのスクリーンショット
              いまの話題をアプリでチェック!
              • バナー広告なし
              • ミュート機能あり
              • ダークモード搭載
              アプリをダウンロード

              関連記事

                usersに達しました!

                さんが1番目にブックマークした記事「大規模同義語辞書...」が注目されています。

                気持ちをシェアしよう

                ツイートする

                大規模同義語辞書でElasticsearchのIndex作成が重くなる問題とその対策 - Sansan Tech Blog

                こんにちは。技術部 Contract One Engineering Unit の伊藤です。Sansan株式会社でAI 契約データベー...こんにちは。技術部 Contract One Engineering Unit の伊藤です。Sansan株式会社でAI 契約データベース「Contract One」の開発を担当しています。 Contract Oneでは契約書検索をコア機能として提供していますが、実運用では社名の表記揺れや新旧社名による検索漏れが課題となっていました。たとえば「さんさん」と入力しても「Sansan株式会社」にヒットしてほしいですし、旧社名「三三株式会社」を検索しても新社名に紐づく契約書がヒットするようになって欲しいという要望がありました。 そこでElasticsearchの同義語検索機能を導入し、複数の表記を吸収して検索できる仕組みを追加しました。これにより検索精度は大きく改善しましたが、大規模な同義語辞書を使う中で一部性能が劣化する部分がありました。記事では、その調査過程と得られた知見を共有します。

                ブックマークしたユーザー

                • tofu-kun2025/09/05tofu-kun
                • yosunaka2025/09/05yosunaka
                • honeybe2025/09/05honeybe
                • yuiseki2025/09/04yuiseki
                • chi-bd2025/09/03chi-bd
                • sh199107112025/09/03sh19910711
                すべてのユーザーの
                詳細を表示します

                ブックマークしたすべてのユーザー

                同じサイトの新着

                同じサイトの新着をもっと読む

                いま人気の記事

                いま人気の記事をもっと読む

                いま人気の記事 - テクノロジー

                いま人気の記事 - テクノロジーをもっと読む

                新着記事 - テクノロジー

                新着記事 - テクノロジーをもっと読む

                同時期にブックマークされた記事

                いま人気の記事 - 企業メディア

                企業メディアをもっと読む

                はてなブックマーク

                公式Twitter

                はてなのサービス

                • App Storeからダウンロード
                • Google Playで手に入れよう
                Copyright © 2005-2025Hatena. All Rights Reserved.
                設定を変更しましたx

                [8]ページ先頭

                ©2009-2025 Movatter.jp