Movatterモバイル変換

検索対象

並び順

ブックマーク数

セーフサーチ

期間指定

1 - 40 件 / 84件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

全文検索の検索結果1 - 40 件 / 84件

全文検索に関するエントリは84件あります。検索、search、elasticsearch などが関連タグです。人気エントリには『Elasticsearch運用ノウハウ | メルカリエンジニアリング』などがあります。

全文検索の関連エントリー

Elasticsearch運用ノウハウ | メルカリエンジニアリング
- 510 users
- engineering.mercari.com
- テクノロジー
- 2022/03/11
こんにちは、メルカリMicroservices SREチームの藤本(@jimo1001)です。私は現在、Embedded SRE としてサーチインフラチームに入り活動しています。このサーチインフラチームは、Elasticsearchを使用した検索基盤を管理し、様々なマイクロサービスに検索機能を提供するチームです。この検索基盤は非常に巨大なプラットフォームで、メルカリ全体のマシンリソースの高い割合を占めており、メルカリの検索を支える非常に重要なものです。私の Embedded SRE としてのミッションは検索基盤の信頼性の向上と自動化を推進することです。今回は、メルカリの検索基盤で利用している Elasticsearch における運用のノウハウを紹介したいと思います。 Elasticsearch とは Elasticsearch は、Elastic社が開発する Apache Lucen
誰でもわかる全文検索入門
- 488 users
- zenn.dev/segavvy
- テクノロジー
- 2020/12/20
全文検索エンジンも、事前に検索対象のデータを調べてこのような索引を作っておくことで、高速な検索を実現しています。インターネット検索の例たとえばインターネット検索の場合、まず各サイトからデータを収集して、その中から索引に載せる単語を選んで索引を作ります。索引のデータは下の図の右側のような表になっています。各単語と、それがどのサイトのどこにあったのかを記録しておく形です。検索の時は、この索引データを調べます。例えば利用者が「理解」という言葉で検索したら、索引の「理解」のところを調べます。そうすると「サイトAの8文字目と18文字目、サイトGの……」と出現場所がわかるので、すぐに結果を返せます。なお、この図では索引の単語の並び方が適当ですが、実際には本と同じように「あいうえお順」などに並べておいて、すぐに単語を見つけられるようにしてあります。索引にない単語この仕組みの場合、索引にある単
「モノタロウの1900万商品を検索するElasticsearch構築運用事例」のポイント深掘り〜第50回 Elasticsearch勉強会後記〜 - MonotaRO Tech Blog
- 306 users
- tech-blog.monotaro.com
- テクノロジー
- 2022/12/23
こんにちは。 EC基盤グループサーチチームの山村です。この記事は、 Elastic Stack (Elasticsearch) Advent Calendar 2022 の 23日目です。 2か月ほど前になりますが、2022年10月26日に実施された第50回 Elasticsearch勉強会で発表させていただきました。私が外部での発表するのは、2016年6月のSolr勉強会以来で、非常に緊張しました。日々の業務にかまけて、ブログが後回しになっていたことで大変遅くなってしまいましたが、上記の発表で話した内容とスライド資料から、話したかったポイントを抜粋するとともに、勉強会で不足していた部分について補足をします。当日、発表を終えたところで気が抜けてしまい、Twitter で頂いていた質問に満足に答えられませんでしたので、この場で補足説明を含めて出来るだけ回答したいと思います。
Elasticsearchで日本語検索を扱うためのマッピング定義 - ZOZO TECH BLOG
- 293 users
- techblog.zozo.com
- テクノロジー
- 2021/11/05
こんにちは、検索基盤部検索基盤ブロックの渡です。私は検索基盤ブロックで、主にZOZOTOWNの検索周りのシステム開発に従事しています。以前の記事では、Elasticsearchのマッピング設定の最適化について取り上げました。そして、今回は日本語による形態素解析を実現するまでの手順をご紹介します。 techblog.zozo.com 目次目次はじめに Elasticsearchで全文検索を実現させる手順全文検索のためのマッピング定義 Analyzerの構造日本語対応のAnalyzer 日本語対応のためのプラグイン追加 kuromoji Analyzerを指定したマッピング定義の例 kuromojiプラグイン機能カスタムしたAnalyzerのマッピング定義 Analyzerの動作確認 modeを選択した場合のマッピング定義の例 Analyzer適用の注意点 kuromoji以外の

全文検索の関連エントリー

医薬品検索でMySQLの全文検索機能を使った話 - KAKEHASHI Tech Blog
- 292 users
- kakehashi-dev.hatenablog.com
- テクノロジー
- 2024/09/11
AI在庫管理の開発チームでバックエンドエンジニアをしている沖です。今回は、AI在庫管理の医薬品検索において、MySQLの全文検索機能を使った話を紹介しようと思います。この記事は秋の技術特集 2024の 8 記事目です。今までの医薬品検索では満足できないユーザーがいたなぜMySQLの全文検索機能を採用したのか全文検索機能を導入する全文検索インデックスを付与したテーブルを作成するパーサー照合順序と正規化全文検索インデックスを使用して検索するデータを最適な状態に保つためにおわりに今までの医薬品検索では満足できないユーザーがいた AI在庫管理には、医薬品の在庫一覧画面など、医薬品名で絞り込む画面がたくさんあります。この絞り込み機能を実現するために、これまではSQLのLIKE検索を利用していました。 LIKE検索は、使い慣れたSQLを用いて部分一致検索を実現できる便利な方法です
オンラインドキュメントと日本語全文検索
- 282 users
- voluntas.medium.com
- テクノロジー
- 2022/08/18
自社では Sphinx というドキュメントツールを利用しているのですが、残念ながらこれに付属している検索機能の日本語検索はかなり厳しいです。また残念ながら Sphinx 開発側も検索周りを改善するという予定は直近ではないようです。そして検索というのはとても難しい技術なため自分のような素人では導入して「普通に期待する動作」をさせるまでの距離はとても遠いです。ただ、なんとかして日本語全文検索を実現したいという思いはここ10 年くらいずっと思っていました。これは自社の Sphinx テーマを作ってくれている社員ともよく話をしていたのですが、どうしてもリソースをつぎ込めずにいました。まとめ日本語検索に対応している Meilisearch を採用したドキュメントスクレイパーの実行は GItHub Actions (Self-hosted Runner) を採用した自社 Sphinx テーマの検
「あのページ何だったっけ……」を激減して情報収集効率を爆上げできる履歴全文検索アドオン「Falcon」レビュー
- 259 users
- gigazine.net
- テクノロジー
- 2023/02/08
インターネットで調べ物をしていると、「過去に閲覧したページをもう一度閲覧したいけど、タイトルを忘れて検索できない！」という困った状態が頻繁に発生します。ブラウザ拡張機能「Falcon」を使えば、閲覧したページの本文を自動保存して「記事内のかろうじて覚えているワード」を用いた全文検索が可能になるとのこと。めちゃくちゃ便利そうだったので、実際にインストールして使ってみました。 Falcon - Chrome ウェブストア https://chrome.google.com/webstore/detail/falcon/mmifbbohghecjloeklpbinkjpbplfalb Falcon – 🦊 Firefox (ja) 向け拡張機能を入手 https://addons.mozilla.org/ja/firefox/addon/falcon_extension/ FalconにはCh
静的サイト向けの全文検索エンジンと UI ライブラリの Pagefind
- 239 users
- azukiazusa.dev
- テクノロジー
- 2024/01/06
Pagefind is a fully static search library that aims to perform well on large sites, while using as little of your users’ bandwidth as possible, and without hosting any infrastructure. デモとして、このブログに Pagefind を導入してみました。ヘッダーの検索アイコンをクリックすると検索フォームが表示されるので、キーワードを入力して検索してみてください。使い方 Pagefind は構築済みの UI ライブラリと、CLI コマンドとしてインデックスを作成するためのツールから構成されています。まずは UI ライブラリの部分から見てみましょう。 UI ライブラリ Pagefind の UI ライブラリは、検索フ
【Elasticsearch】1900万点に及ぶ商品データ作成の時間を約67%短縮できた構成と工夫 - MonotaRO Tech Blog
- 229 users
- tech-blog.monotaro.com
- テクノロジー
- 2022/10/18
初めまして、EC基盤グループサーチチームの壷井です。モノタロウでは2019年10月頃より新規検索システムの設計・開発を進め、今年の4月頃にECサイト(monotaro.com) 検索ページの裏側の検索システムを従来のSolrからElasticsearchに100%移行*1しました。この移行は将来の商品点数やリクエスト数の増加を見据えたバックエンドの大規模な改修で、ここまで約2年半ほどプロジェクトを進めてきました。今後もECサイトのすべてのページの完全移行に向け引き続き開発・運用を行っていきます。今回はこのプロジェクトのなかで私が担当してきたElasticsearchへの日々のデータの洗い替え（日次更新と呼んでいます）ワークフローのシステム構成と工夫などについてお話します。モノタロウの検索システムの紹介日次更新のシステム構成処理の流れ ① リアルタイムデータ同期 ② 日次商品デー
静的サイトに特化した全文検索ライブラリ「Pagefind」、さくらのレンタルサーバで動かしてみた
- 215 users
- www.publickey1.jp
- テクノロジー
- 2024/01/17
先日、静的サイトに特化した全文検索ライブラリとして「Pagefind」というソフトウェアがあることを、下記の記事が話題になったことで知りました。参考：静的サイトに特化した検索ライブラリ Pagefind を試す | grip on minds 実は、いまお読みのPublickeyはまさに、Movable TypeというCMSを用いて生成された静的なWebサイトです。現在、PublickeyではGoogleが提供している「Googleカスタム検索エンジン」を全文検索エンジンとして採用しています（右上の虫眼鏡アイコンから呼び出せます）。しかしPublickeyでは以前からGoogleに依存しない、自前の全文検索エンジンを持てないかと模索しており、まさにPagefindは私が探し求めていたソフトウェアだったと言えます。そこでさっそくPagefindがPublickeyに導入できるかどうか、
「ベクトル検索 vs 全文検索」〜Amazon Bedrockの埋め込みモデルを用いたプロトタイピング〜 - コネヒト開発者ブログ
- 211 users
- tech.connehito.com
- テクノロジー
- 2023/12/09
※ この記事は、AWS (Amazon Web Services) の技術支援を受けて執筆しています。はじめにこの記事はコネヒトアドベントカレンダー 8日目の記事です。コネヒト Advent Calendar 2023って？コネヒトのエンジニアやデザイナーやPdMがお送りするアドベントカレンダーです。コネヒトは「家族像」というテーマを取りまく様々な課題の解決を目指す会社で、ママの一歩を支えるアプリ「ママリ」などを運営しています。 adventar.org こんにちは！コネヒトの機械学習エンジニア y.ikenoueです。突然ですがみなさん、Amazon Bedrockをご存知でしょうか。 aws.amazon.com Amazon Bedrock(以下、Bedrock)は、テキスト生成AIをはじめとする基盤モデル (Foundation Model)*1を提供するAWS
さようならElasticsearch、よろしくElastic Cloud - Nota TechConf
- 203 users
- scrapbox.io/nota-techconf
- テクノロジー
- 2022/05/19
by yuiseki yuiseki.icon 2022/5/19 20:25 - 20:40 （明らかに15分で収まる内容の資料ではないですが、資料はモリモリで発表はスカスカでもScrapboxで盛り上がれるか、という仮説の検証を兼ねています） yuisekiですyuiseki.icon Gyazoのプロジェクトマネージャー兼ソフトウェアエンジニアです本日お集まりいただいたみなさん、ありがとうございます本日お集まりいただいたみなさんノバウサギ…？nyanco.icon ユニコーンガンダム…？issac.icon タイマーちゃん！takker.icon 12年間運用を続けているB2C SaaSの検索インフラの実態（14分まで、1分間） Gyazoは2021年、「画像の瞬間発見」をテーマに、検索に力を入れていた Nota Tech Conf 2021 Springでのyuiseki.i
Zennの検索スピードを5倍に高速化した話
- 196 users
- zenn.dev/team_zenn
- テクノロジー
- 2025/06/04
@dyoshikawaです。先日、以下のリリースでZennのサイト内検索の高速化を行いました。結論を先に述べるとCDNキャッシュやPostgreSQLの全文検索インデックスを活用して対応しました。この記事では本パフォーマンス改善の取り組みについて紹介します。 Zennの構成 ZennはGoogle Cloud上に構築されており、フロントエンドNext.jsとバックエンドRailsをそれぞれCloud Run上にホスティングしています。上の図では省かれていますが、CDNにはCloudflareを利用しています。データベースはCloud SQL for PostgreSQLを利用しています。検索速度とDB負荷に課題 2025年2月頃、某AIクローラーによる検索ページへの集中アクセスによりDBインスタンスのCPU使用率が100%近くに張り付いてしまうという事象が発生しました。生成AIサ
pixivの全文検索基盤とElasticsearchによるリプレイス - pixiv inside
- 195 users
- inside.pixiv.blog
- テクノロジー
- 2024/08/26
まもなく17周年を迎えるpixivでは、長年にわたり作品などの全文検索基盤としてApache Solrを使用してきました。しかし、サービスの規模が拡大する中で、従来の基盤に問題が生じていました。これを受けて、pixivでは全文検索基盤のリプレイスを実行しました。今回のリプレイスにより、pixivでは検索結果の更新反映時間や検索APIのレイテンシが大幅に短縮されました。また、今後のスケールに対応可能になり、新機能開発においても全文検索が容易に利用できるようになりました。本記事では、pixivの全文検索基盤の歴史や、今回オンプレミス環境でElasticsearchクラスタを構築し、リプレイスを完了するまでの取り組みについてご紹介します。こんにちは。pixivのnamazuです。最近、私たちのチームで進めていたpixivの全文検索基盤のリプレイスが完了しました。この機会に、pixivの全
DuckDB で日本語全文検索
- 181 users
- voluntas.ghost.io
- テクノロジー
- 2025/04/26
DuckDB-VSS と PLaMo-Embedding-1B を利用することで、ベクトル検索を実現できますが、DuckDB-FTS (Full-Text Search) と形態素解析ライブラリである Lindera を組み合わせて日本語全文検索を実現できます。 DuckDB-FTS + LinderaDuckDB の全文検索拡張は日本語には対応していないないのですが、スペース区切りでトークン化することで、日本語の全文検索を利用する事が出来ます。トークン化には Meilisearch にも利用されている信頼と安心の Lindera を利用することにしました。今回この参考コードを Lindera の作者であり検索の専門家でもある Minoru OSUKA 氏にレビューいただきました。本当にありがとうございます。以下は参考コードです。 [project] name = "duckdb-ft
医薬品検索にベクトル検索を導入したら、デフォで検索ニーズをほぼ満たせそうだった話
- 175 users
- zenn.dev/minedia
- テクノロジー
- 2024/09/17
どんな人向けの記事？医薬品のような難しい検索ニーズにこたえるためにベクトル検索を利用する知見を見てみたい MySQLの全文検索と、ベクトル検索の精度や速度を比較してみたいベクトルDBとEmbeddingモデルを利用した簡単なベクトル検索の実装方法を知りたい医薬品の検索ニーズは多様なので、ベクトル検索で解決できるか試したい 1つの医薬品を指す名称は、複数存在するため医薬品検索は意外と面倒な問題です。例えば、日本人なら頭痛や生理痛、発熱したときに「ロキソニン」を飲んだことがあるかもしれません。この名称は商品の名称ですが、成分の名称は「ロキソプロフェンナトリウム水和物」です。さらに、ロキソプロフェンには錠剤以外にもテープやパップといった剤形の違いがあります。そして最後に、ロキソプロフェンを作っている会社は複数あるので、末尾に「トーワ」や「ファイザー」などの組み合わせが存在します。ロキ
分散型SNS「マストドン」、待望の全文検索機能を追加。他サーバーの公開投稿もまとめて検索可能に【やじうまWatch】
- 160 users
- internet.watch.impress.co.jp
- テクノロジー
- 2023/09/27
魔窟と化した全文検索サーバーとふっかつのじゅもん - Cybozu Inside Out | サイボウズエンジニアのブログ
- 159 users
- blog.cybozu.io
- テクノロジー
- 2021/06/16
サイボウズのクラウド黎明期から運用し続けていたSolrサーバーを Elasticsearchに置き換えるプロジェクトが先日完了しました。プロジェクト完了報告もかねてプロジェクトのあらましを公開したいと思います。はじめにこのプロジェクトの主軸は『魔窟と化したレガシー技術をどう捌くか？』になります。このプロジェクトの報告をする前に、いくつかエクスキューズをさせていただきます。クラウド黎明期を支えてくれたSolrには畏敬の念に近い感謝をもっていますレガシーな技術に対してマウントやディスリスペクトの意図はありません魔窟にかかわることになってしまった人に対して負の感情は一切ありません今回の採用している構成はElasticsearchのあるべきアーキテクチャではありません今後、Neco 環境への移行を通して継続的に改善していきますサイボウズでのSolrの使い方と用語説明サイボウズ
PostgreSQLの全文検索機能を試してみる | フューチャー技術ブログ
- 135 users
- future-architect.github.io
- テクノロジー
- 2025/08/29
夏の自由研究2025ブログ連載の4日目です。技術コンサルをしているお客さんとPrismaのドキュメントの読書会をしていて、全文検索機能がPrismaにも、PostgreSQLにも標準で用意されているということを知りました。PostgreSQLで全文検索はというと、PGroongaとか、pg_bigmを使うとかがトップ出てくるし、そもそも検索をしたくなったらElasticSearch使う、みたいに思っていました。標準で全文検索もできるなら運用コストもだいぶ下げられそうです。かつて、Python製ドキュメントツールの、ブラウザで動く全文検索エンジンの日本語対応をやってみたり、FM-indexという高速文字列解析の世界という書籍で紹介されていたアルゴリズムを使ったブラウザで動く検索エンジンを作ったり、転置インデックスをS3に置く検索エンジンを作ってみたり貧乏低コスト検索エンジンの第一人者(自
OpenSearchで日本語全文検索をするためのドメイン知識を整理する - ドワンゴ教育サービス開発者ブログ
- 135 users
- blog.nnn.dev
- テクノロジー
- 2025/03/13
導入ドキュメントとインデックスドキュメントインデックスアナライザ Tokenizer n-gram 形態素解析 Character Filter Token Filter マッピングフィールド型文字列配列 null Multifields 検索クエリ Leaf Query match match_bool_prefix match_phrase multi_match query_string Compound Query Boolean Query あとがき We are hiring! 導入 ZEN Study の新しい教材基盤 (Kotlin) では、現在コンテンツ管理のための全文検索機能の導入中で、AWS OpenSearch Service を利用する予定です。 aws.amazon.com この記事は、OpenSearch導入にあたって各種概念モデルの概要を把握す
DuckDB を用いて日々のストック記事をハイブリッド検索する
- 128 users
- www.yukioh.net
- テクノロジー
- 2025/04/30
Toggle dark mode DuckDB を用いて日々のストック記事をハイブリッド検索する Apr 30, 2025 今回は、DuckDB を使って、日々ストックしている Web 記事などのハイブリッド検索（全文検索とベクトル類似度検索の組み合わせ）を実現する試みについてまとめます。モチベーション自分は普段、情報収集や後で読みたい記事の保存に Readwise Reader というサービスを利用しています。RSS フィードの購読や記事のアーカイブができ、非常に便利なツールです [1] 。この Readwise Reader にも検索機能（全文検索）はあるのですが、どこか微妙さを感じていました。特に日本語の記事を探す際に意図した記事が見つからないことが多々あり、不満ポイントでした (海外サービスあるある)。そんな矢先、時雨堂さんの「DuckDB でハイブリッド検索」の記事を拝
セマンティック検索の活用で、Elasticsearchの検索が根本的に変わる！？ - Taste of Tech Topics
- 122 users
- acro-engineer.hatenablog.com
- テクノロジー
- 2023/04/14
こんにちは、@shin0higuchiです😊 業務では、Elasticsearchに関するコンサルティングを担当しています。最近すっかり春らしく、暖かくなってきました。新年を迎えたばかりの感覚でしたが、あっという間に時が経ちますね。さて、今回の記事では、Elasticsearchの検索を根本的に変える可能性を秘めたセマンティック検索に関して書かせていただきます。概要 Elasticsearchは元々、キーワードベースのアプローチを主に取っており、クエリで指定されたキーワードを対象のドキュメント内で検索し、それらの出現頻度や位置に基づいて結果をランク付けしています。この方法では、文脈や意図に関係なく、単純にキーワードの一致度に基づいて検索結果が返されます。一方、セマンティック検索とは、ユーザーのクエリの背後にある文脈と意図を理解しようとする検索手法で、キーワードだけに頼るのではな
「Cloudflare + OpenSearch + Lambdaで始める全文検索開発入門」というテーマで喋りました #devio2021 | DevelopersIO
- 121 users
- dev.classmethod.jp
- テクノロジー
- 2021/10/05
Developers.IO 2021 Decadeという弊社オンラインイベントにて、「Cloudflare + OpenSearch + Lambdaで始める全文検索開発入門」というテーマでお話させていただきましたので、紹介します。セッション概要現在開発に携わっているプロフィールビュアーサービスProfllyでは、検索エンジンとしてAmazon OpenSearch Serviceを採用しています。サーバーレス環境において、コストを抑えつつ快適にOpenSearchを利用できる開発環境を準備すべく、Cloudflareを利用したOpenSearch + Lambdaの構築方法を解説します。動画スライドアジェンダ Amazon OpenSearch Service + Lambdaを組み合わせた全文検索開発のためのローカル環境OpenSearch構築 Cloudflareを利用
Aurora MySQL 5.7とRailsで実現する全文検索機能 - dely Tech Blog
- 119 users
- tech.dely.jp
- テクノロジー
- 2023/06/23
こんにちは。クラシル開発部、バックエンドエンジニアの松嶋です。 delyに入社してから約3年間、私はSREチームに所属していましたが、昨年10月にバックエンドに転向しました。バックエンドに転向してからは、主にクラシルアプリの公式レシピおよびCGMコンテンツの検索機能に関する開発・改善に取り組んでいます。クラシルは、2016年2月にサービスを開始してから、管理栄養士監修の「誰でも安全に・おいしい料理を作ることができるレシピ動画」を5万件以上提供してきました。昨年12月には、クラシルのブランドリニューアルを行い、今後はシェフや料理研究家を中心としたクリエイターとともに多様化したユーザーの食の好みや課題解決に応えられるよう、幅広い食のコンテンツを提供するプラットフォームを目指しています。ブランドリニューアルの詳細に関しては、こちらを御覧ください。 www.kurashiru.com この
SQLiteでLinderaを使った日本語全文検索 - *iroi*
- 117 users
- blog.chairoi.me
- テクノロジー
- 2023/12/03
これははてなエンジニアアドベントカレンダー2023 3日目の記事です。はてなエンジニア Advent Calendar 2023 - Hatena Developer Blog はてなエンジニアのカレンダー | Advent Calendar 2023 - Qiita 昨日は id:pokutuna さんの blog.pokutuna.com でした。私も若い頃に同僚とGitHub上で白熱してしまい観光名所になってしまっていたような気がします。気を付けていきましょう。さて、この記事では SQLiteでLinderaを使った日本語全文検索をする話を紹介します。モチベーション laiso.hatenablog.com 上の記事でも話題になっているように個人開発ではDBのコストは問題です。同様に全文検索したいときにもコストに頭を悩ませているのではないでしょうか？たとえば Amazon
ブラウザでオフライン日本語インスタント全文検索を実現する
- 114 users
- voluntas.ghost.io
- テクノロジー
- 2025/04/29
DuckDB の FTS (Full Text Search) 拡張と Lindera を利用する事で、日本語全文検索を実現できますが、DuckDB-Wasm と Lindera-Wasm を利用する事でブラウザで日本語全文検索を実現できます。Wasm なので完全オフラインで、利用できます。さらに、クライアントのリソースということもあり一文字ずつ入力された値に対して Lindera-Wasm で形態素解析して、SQL を実行することでインスタント検索も実現できます。 DuckDB-Wasm (FTS 拡張) + Lindera-Wasm技術的には特に難しいことはしておらず、DuckDB-Wasm の FTS 拡張に Lindera-Wasm で形態素解析した結果を引数として渡して実行しているだけです。デモサイトを用意しておきました、もし良ければ試してみてください。 DuckDB-Wa
Elasticsearch Is Open Source. Again!
- 111 users
- www.elastic.co
- テクノロジー
- 2024/08/30
Search and analytics, data ingestion, and visualization – all at your fingertips.
Meilisearch: Open-source AI search engine
- 91 users
- www.meilisearch.com
- テクノロジー
- 2021/08/13
Want more control over your search setup? Discover our flexible infrastructure pricing.
Twitter/Blueskyの自己ポストの全文検索サービスをNext.js App Router(RSC)で書きなおした方法/設計/感想
- 82 users
- efcl.info
- テクノロジー
- 2024/02/27
Twitter/Blueskyの自己ポストの全文検索サービスをNext.js App Router(RSC)で書きなおした方法/設計/感想 mytweetsという自分の Twitter/Bluesky の自己ポストの全部検索サービスをNext.js App Router(RSC)で書きなおしました。 mytweets は Twitter のアーカイブや Bluesky の API を使って自分のポストを S3 に保存しておき、 S3 Selectを使って全文検索ができる自分専用の Twilog のようなサービスです。自分の Tweets をインクリメンタル検索できるサービス作成キットと Tweets をまとめて削除するツールを書いた | Web Scratch 過去の Tweets を全文検索できる mytweets を Bluesky に対応した。自分用 Twilog みたいなもの
Elastic、AWSとの「Elasticsearch」に関する商標問題が解決したと発表。今後「Elasticsearch」を名乗るのはElasticのみに
- 78 users
- www.publickey1.jp
- テクノロジー
- 2022/02/17
Elastic、AWSとの「Elasticsearch」に関する商標問題が解決したと発表。今後「Elasticsearch」を名乗るのはElasticのみに Elasticは、Amazon Web Services（AWS）との「Elasticsearch」に関する商標問題の訴訟が解決したと発表しました。 Elastic and @amazon have resolved the Elasticsearch trademark infringement lawsuit. Learn more on our blog: https://t.co/738RR78bRD — Elastic (@elastic) February 16, 2022 発表によると、今後AWSおよびAWS Marketplace上でElasticsearchサービスと名乗るのは、Elasticが提供するElastic
noteの検索をCloudSearch からElasticsearchに移行しつつある話｜chov
- 73 users
- note.com/chov
- テクノロジー
- 2023/02/10
記事の概要を3行でまとめ検索システムの移行や導入は組織化しましょう指標に気を取られすぎないようにしましょう検索を見ると様々なドメインに触れるので知識が増えてお得はじめにnote株式会社で検索エンジニアをしているchovです。早速ですが、noteでは全文検索エンジンを以下の箇所で利用しています。ハッシュタグの検索ユーザの検索マガジンの検索記事の検索メンバーシップの検索 CloudSearchを利用した検索結果これまではCloudSearchを利用していましたが、2022年の4月ごろからElasticsearchへの移行プロジェクトを始め、この記事が公開される2023年2月時点でほとんどの検索をElasticsearchに移行するところまで進みました。本稿では移行プロジェクトの進め方や検証の手法について解説しますが、これから全文検索エンジンの導入・移行を行う方の参考になれば
ElasticsearchとKubernetesの組み合わせはかなりいい　LegalForceの検索インフラ運用法と活用法 | ログミーBusiness
- 72 users
- logmi.jp
- テクノロジー
- 2021/05/10
リーガルテック領域のリーディングカンパニーである株式会社LegalForceが、「検索インフラTechTalk!」を開催しました。インフラ領域の中でも「検索インフラ」にフォーカスした今回は、検索インフラに関する具体的な事例や取り組みについて各スピーカーから発表がありました。浜地亮輔氏は、LegalForce社における全文検索インフラ活用事例について話しました。株式会社LegalForceのSREチームメンバー浜地亮輔氏（以下、浜地）：浜地から発表します。最近風邪気味で、咳き込むことがあるかもしれません。お聞き苦しいところ大変恐縮なんですが、ご了承ください。まず自己紹介です。浜地亮輔と申します。2020年9月に株式会社LegalForceにジョインして、SRE（サイト・リライアビリティ・エンジニアリング）で仕事をしています。Twitterでは、@aibouというIDで日々活動しています。
運用コストを低く抑えつつ全文検索機能を実現したい: SQLite3 で全文検索を実現する fts5 、ベクトル検索を実現する sqlite-vss
- 71 users
- shunyaueta.com
- テクノロジー
- 2024/02/22
運用コストを低く抑えつつ全文検索機能を実現したい: SQLite3 で全文検索を実現する fts5 、ベクトル検索を実現する sqlite-vss 2024-02-22 ドキュメント数が 1 万件に満たない状況で全文検索をしたいドキュメントは頻繁に更新はされずに日時の更新で十分オンラインでのインデキシングを考えなくてよいので、バッチで十分みたいな状態でポータビリティが高く運用コストが低い状態で全文検索を実現したいなと調べていたら SQLite3 が良さそうだったというお話。全文検索を実現する拡張機能: https://www.sqlite.org/fts5.htmlfts5 から relevancy による order by が使えるようになったらしく、version 4 以前は、relevance をチューニングして改善するのは難しそうだなと思った。この拡張機能が作成された経緯としては
日本語が使える、Rust製の全文検索エンジン「Bayard」を試してみた！！ - 虎の穴ラボ技術ブログ
- 69 users
- toranoana-lab.hatenablog.com
- テクノロジー
- 2021/03/03
こんにちは、虎の穴ラボの古賀です。みなさま、全文検索エンジンを使っていますか？クラウドだと「Amazon Elasticsearch Service」や「Azure Cognitive Search」など、さまざまな選択肢があると思います。今回は、虎の穴ラボの社内のWebツールに導入できそうな、簡易的な全文検索エンジンにどのようなものがあるか調べた際に見つけた、「Bayard」という全文検索エンジンを試してみました。「Bayard」は、Rust製の高速かつ軽量で日本語の全文検索ができる検索エンジンです。導入手順が比較的簡単で、Webツールの検索機能の改善に使えそうです。 Bayardとは？ Bayardは、Raft Consensus Algorithm と gRPC を実装する、 Rustで記述された全文検索およびインデックス作成のサーバーです。 Tantivy（Rust製全文
MySQLで全文検索機能を試したら実行速度が遅かったので調査してみた - iimon TECH BLOG
- 66 users
- tech.iimon.co.jp
- テクノロジー
- 2024/12/16
◼️ はじめに ◼️ 前提条件マシン環境データベースについて ◼️ データ挿入に関して ◼️ 100万レコードでLIKE検索(前後の部分一致)と全文検索の比較 LIKE検索全文検索 ◼️ EXPLAINで実行計画を確認 LIKE検索のEXPLAIN結果全文検索のEXPLAIN結果 ◼️ EXPLAIN ANALYZEを確認 LIKE検索のEXPLAIN ANALYZE結果全文検索のEXPLAIN ANALYZE結果 ◼️ リソース使用状況確認全文検索のクエリのプロファイリングを確認 ◼️ INNODB_FT_INDEX_TABLEを確認 ◼️ テストデータを修正最初に作成したレコード内容の一部新たに作成したレコード内容の一部 LIKE検索全文検索 ◼️ まとめ ◼️ 最後に ◼️ はじめにこんにちは！株式会社iimonでフロントエンジニアをしているあめくです！本記事は
Ruby on Railsと素のPostgreSQLで日本語全文検索 - 2020-12-22 - ククログ
- 64 users
- www.clear-code.com
- テクノロジー
- 2020/12/22
PostgreSQLに超高速な日本語全文検索機能を追加するPGroongaを開発している須藤です。今回はPGroongaやpg_bigmなど拡張モジュールを使わずにPostgreSQLの組み込み機能だけで日本語全文検索を実現する方法を紹介します。PGroongaを使う方法はRuby on RailsでPostgreSQLとPGroongaを使って日本語全文検索を実現する方法を参照してください。 Heroku PostgresなどDBaaSとして提供されているPostgreSQLではPGroongaを使えません。（DBaaSとして提供しているベンダーがPGroongaをインストールしてくれないから。）PostgreSQLの組み込み機能だけでは日本語全文検索を満足に実現することができないので、DBaaSのPostgreSQLを使っていると次のように日本語全文検索で困ってしまいます。日本人のプ
Go製の全文検索エンジンOmochiを作った.
- 61 users
- zenn.dev/yukiyada
- テクノロジー
- 2022/07/26
1.はじめに膨大な量の電子データから目的となるデータを取得・抽出する情報検索。その技術は広く普及し、多くの人々が、様々な場面でその恩恵を受けています。GoogleやBingをはじめとした、世の中に大きなインパクトを与えるWeb検索がその代表例ですが、物件検索や論文検索、メール検索などその応用は様々です。さて、今回取り組んだのは、Goによる転置インデックスを用いた全文検索エンジンのスクラッチ実装です。研究で自然言語処理を学んだことをきっかけに、情報検索や転置インデックスといったトピックに強い興味が湧いたので、Elasticsearch等には頼らず、ゼロから実装を行いました。以下、リポジトリになります。本記事では、Omochiの設計・実装に関する説明を行なっていきます。 2.転置インデックス型・全文検索エンジンOmochi リポジトリのREADME.mdにも記載がありますが、今回実装した
新刊『検索システム ― 実務者のための開発改善ガイドブック』の発売を開始しました
- 59 users
- www.lambdanote.com
- テクノロジー
- 2022/05/16
PDF版を先行発売していた新刊、『検索システム ― 実務者のための開発改善ガイドブック』（打田智子・古澤智裕・大谷純・加藤遼・鈴木翔吾・河野晋策共著）の発売を開始しました。本書は、Webサイトをはじめ現代のITシステムで当たり前のように提供されている「検索」の仕組みを実装、運用、改善したい人のためのガイドです。これから作りたい人はもちろん、より進んだユーザー体験を提供したい人まで、検索システムの実務にかかわる多くのエンジニアのために書かれました。以下のような側面から、「よい検索システム」を提供するための知見が網羅的に整理されています。全文検索エンジンを支えるデータ構造、アルゴリズム、テキスト処理検索の対象とするデータの整備さまざまな検索機能のためのユーザーインターフェース検索システムを定量的に評価し、それをもとに改善していく考え方検索クエリから検索者の本来の意図を推測する
青空文庫を全文検索できる「Aozorasearch」が話題に～「文明の発展に貢献できるレベル」／作者や年代、ジャンルで絞り込むこともできる【やじうまの杜】
- 54 users
- forest.watch.impress.co.jp
- テクノロジー
- 2023/06/15
自然な対話で商品検索！OpenAI と全文検索エンジンで対話型ゆるふわ検索 AI アシスタントを作ってみた | DevelopersIO
- 53 users
- dev.classmethod.jp
- テクノロジー
- 2023/06/12