Movatterモバイル変換

nakex1 id:nakex1

検索に関するnakex1のブックマーク (66)

ブラウザでオフライン日本語インスタント全文検索を実現する
DuckDB の FTS (FullText Search) 拡張と Lindera を利用する事で、日本語全文検索を実現できますが、DuckDB-Wasm と Lindera-Wasm を利用する事でブラウザで日本語全文検索を実現できます。Wasm なので完全オフラインで、利用できます。さらに、クライアントのリソースということもあり一文字ずつ入力された値に対して Lindera-Wasm で形態素解析して、SQL を実行することでインスタント検索も実現できます。 DuckDB-Wasm (FTS 拡張) + Lindera-Wasm 技術的には特に難しいことはしておらず、DuckDB-Wasm の FTS 拡張に Lindera-Wasm で形態素解析した結果を引数として渡して実行しているだけです。デモサイトを用意しておきました、もし良ければ試してみてください。 DuckDB-Wa
nakex12025/04/29
検索
リンク
OpenSearchで日本語全文検索をするためのドメイン知識を整理する - ドワンゴ教育サービス開発者ブログ
導入ドキュメントとインデックスドキュメントインデックスアナライザ Tokenizer n-gram形態素解析 Character Filter Token Filter マッピングフィールド型文字列配列 null Multifields 検索クエリ Leaf Query match match_bool_prefix match_phrase multi_match query_string Compound Query Boolean Query あとがき We are hiring! 導入 ZEN Study の新しい教材基盤 (Kotlin) では、現在コンテンツ管理のための全文検索機能の導入中で、AWS OpenSearch Service を利用する予定です。aws.amazon.com この記事は、OpenSearch導入にあたって各種概念モデルの概要を把握す
nakex12025/03/13
検索
リンク
pixivの全文検索基盤とElasticsearchによるリプレイス - pixiv inside
まもなく17周年を迎えるpixivでは、長年にわたり作品などの全文検索基盤としてApache Solrを使用してきました。しかし、サービスの規模が拡大する中で、従来の基盤に問題が生じていました。これを受けて、pixivでは全文検索基盤のリプレイスを実行しました。今回のリプレイスにより、pixivでは検索結果の更新反映時間や検索APIのレイテンシが大幅に短縮されました。また、今後のスケールに対応可能になり、新機能開発においても全文検索が容易に利用できるようになりました。本記事では、pixivの全文検索基盤の歴史や、今回オンプレミス環境でElasticsearchクラスタを構築し、リプレイスを完了するまでの取り組みについてご紹介します。こんにちは。pixivのnamazuです。最近、私たちのチームで進めていたpixivの全文検索基盤のリプレイスが完了しました。この機会に、pixivの全
nakex12024/08/26
検索
リンク
「ベクトル検索 vs 全文検索」〜Amazon Bedrockの埋め込みモデルを用いたプロトタイピング〜 - コネヒト開発者ブログ
※ この記事は、AWS (Amazon Web Services) の技術支援を受けて執筆しています。はじめにこの記事はコネヒトアドベントカレンダー 8日目の記事です。コネヒト Advent Calendar2023って？コネヒトのエンジニアやデザイナーやPdMがお送りするアドベントカレンダーです。コネヒトは「家族像」というテーマを取りまく様々な課題の解決を目指す会社で、ママの一歩を支えるアプリ「ママリ」などを運営しています。 adventar.org こんにちは！コネヒトの機械学習エンジニア y.ikenoueです。突然ですがみなさん、Amazon Bedrockをご存知でしょうか。aws.amazon.comAmazon Bedrock(以下、Bedrock)は、テキスト生成AIをはじめとする基盤モデル (Foundation Model)*1を提供するAWS
nakex12023/12/09
検索
リンク
あやふや書庫
『あやふや書庫』はあやふや文庫のまとめサイトです今までに捜査された「記憶に残る本・もう一度読みたい本」がたくさん保管されています
nakex12023/05/05
本
検索
リンク
駅近の24時間営業のサウナ施設をAIに質問→実際には存在しない施設だった体験談が話題に【やじうまWatch】
nakex12023/04/20
いつの時点まで学習してるかわからんし，商業施設は普通に検索したほうがいいんじゃない？飲食店なんかは特に変遷激しいよね。その点，店のSNSなら今日の日替わりや特典まで出て来るかもよ。
人工知能
検索
リンク
検索クエリからファジーにキーワードを抽出する（スミス・ウォーターマン法に基づく実装） - Giftmall Inside Blog
TL;DR 表記揺れがふくまれる検索クエリにマッチしたコンテンツを表示するための手法として、スミス・ウォーターマン法に基づくあいまい検索を実装して検索精度を向上しました。この手法は機械学習システムを使わないためメンテナンスコストが低く、その一方で速度面でも実用的な性能を持ちチューニングしやすいのが特長です。はじめにこんにちは、ギフトモールで検索エンジンなどを開発している @samayotta です。私たちギフトモールはプレゼントに特化したECサービスを提供しています。ギフトECにおいても、ユーザのニーズにマッチする商品を探すための検索機能は重要となります。例えば、弊社が運用しているギフトECサービスの一つであるギフトモールは、ユーザが入力する文字列の検索クエリから関連するキーワードを検出し、そのキーワードに紐づいているコンテンツ(商品、記事、etc.)を提示する検索機能を持っています
nakex12022/12/15
検索
リンク
オンラインドキュメントと日本語全文検索
自社では Sphinx というドキュメントツールを利用しているのですが、残念ながらこれに付属している検索機能の日本語検索はかなり厳しいです。また残念ながら Sphinx 開発側も検索周りを改善するという予定は直近ではないようです。そして検索というのはとても難しい技術なため自分のような素人では導入して「普通に期待する動作」をさせるまでの距離はとても遠いです。ただ、なんとかして日本語全文検索を実現したいという思いはここ10 年くらいずっと思っていました。これは自社の Sphinx テーマを作ってくれている社員ともよく話をしていたのですが、どうしてもリソースをつぎ込めずにいました。まとめ日本語検索に対応しているMeilisearch を採用したドキュメントスクレイパーの実行はGItHub Actions (Self-hosted Runner) を採用した自社 Sphinx テーマの検
nakex12022/08/18
検索
リンク
なぜグーグルは終わったのか？若者「ググらないｗ TikTokで調べますよ普通ｗ」
ぬまくろー @ponacrow Z世代はもうググらない。ニュースもお金の使い方も「TikTok」で学ぶ(NewsPicks) #Yahooニュース news.yahoo.co.jp/articles/e0cf5… こういうの見るともう自分って老害なんだなと思う2022-07-30 12:03:50
nakex12022/07/30
YouTubeなども含めて動画で見るのは無駄が多すぎて…と自分は思うのだけど，知識のないジャンルの入り口にはいいのかもね。
検索
リンク
在野研究者のレファレンス・チップス | 皓星社（こうせいしゃ）図書出版とデータベース
第14回　天才魔術師と同じ魔法が使えるようになるために――「当たり前」を超えて2022年7月29日公開小林昌樹（図書館情報学研究者） ■そんなの当たり前前回、NDLサイトに秘蔵された「調べ方案内」を見つけるには、NDLがHP上に用意した独自分類を下りていって見つけたりせず、単にGoogleから直接「トピッ […]…続きを読む第13回　パスファインダー（調べ方案内）の見つけ方2022年6月24日公開小林昌樹（図書館情報学研究者） ■ある日の会話「なんで日本の図書館ではレファレンス・サービスが広まらなかったんでしょう？」「それは、サービスが目に見えないからさ。カタロガーの仕事は目録カードって形で残るからまだしも、 […]…続きを読む第12回　自分の調べ物に最適の雑誌記事索引を選ぶには――記事索引の採録年代、得意ジャンルを知っておく2022年5月27日公開小林昌樹
nakex12022/05/29
研究
検索
リンク
ネット検索は｢ググる｣から｢タグる｣に…若者が飲食店選びで食べログを避けてインスタを使う本当の理由 "#"検索数は世界平均の3倍…日本は｢タグ付け文化｣先進国
「口コミ」提唱から半世紀…広がる消費者発信メディアいまやその言葉を聞かぬ日はないほどに口の端に上る「口コミ」という言葉は、ジャーナリスト・ノンフィクション作家の大宅壮一が1960年代に生み出したといわれている。もともとは「口頭でのコミュニケーション」の意味で、テレビや新聞などのマスコミュニケーションとの対比のもとに提唱された。大宅氏の時代には、小規模なコミュニケーションが念頭に置かれていたと思われるが、現在ではインターネット、特にソーシャルメディアやSNSの発達によって口コミの影響力は巨大なものとなった。デジタルマーケティングの発展した英語圏では、早くからそのような状況が理論化されていった。口コミが生み出され集まる場所という意味で、Consumer Generated Media（消費者発信メディア。略称CGM）という言葉も盛んに使われるようになる。日本でも、レシピを共有する「クッ
nakex12022/05/28
漠然と「なんかいい感じのないかなー？」くらいの精度の調べ物の話。グルメやファッションなど娯楽目的ならそれでいいかもだけど。
検索
リンク
さようならElasticsearch、よろしくElastic Cloud - Nota TechConf
by yuiseki yuiseki.icon2022/5/19 20:25 - 20:40 （明らかに15分で収まる内容の資料ではないですが、資料はモリモリで発表はスカスカでもScrapboxで盛り上がれるか、という仮説の検証を兼ねています） yuisekiですyuiseki.icon Gyazoのプロジェクトマネージャー兼ソフトウェアエンジニアです本日お集まりいただいたみなさん、ありがとうございます本日お集まりいただいたみなさんノバウサギ…？nyanco.icon ユニコーンガンダム…？issac.icon タイマーちゃん！takker.icon 12年間運用を続けているB2C SaaSの検索インフラの実態（14分まで、1分間） Gyazoは2021年、「画像の瞬間発見」をテーマに、検索に力を入れていた NotaTech Conf 2021 Springでのyuiseki.i
nakex12022/05/19
検索
リンク
Elasticsearchで日本語検索を扱うためのマッピング定義 - ZOZO TECH BLOG
こんにちは、検索基盤部検索基盤ブロックの渡です。私は検索基盤ブロックで、主にZOZOTOWNの検索周りのシステム開発に従事しています。以前の記事では、Elasticsearchのマッピング設定の最適化について取り上げました。そして、今回は日本語による形態素解析を実現するまでの手順をご紹介します。tech blog.zozo.com 目次目次はじめに Elasticsearchで全文検索を実現させる手順全文検索のためのマッピング定義 Analyzerの構造日本語対応のAnalyzer 日本語対応のためのプラグイン追加 kuromoji Analyzerを指定したマッピング定義の例 kuromojiプラグイン機能カスタムしたAnalyzerのマッピング定義 Analyzerの動作確認 modeを選択した場合のマッピング定義の例 Analyzer適用の注意点 kuromoji以外の
nakex12021/11/07
検索
リンク
https://web.archive.org/web/20080305225407/http://www.c-sawat.com/index2.html └ https://web.archive.or..
https://web.archive.org/web/20080305225407/http://www.c-sawat.com/index2.html └ https://web.archive.org/web/20080723202836fw_/http://www.c-sawat.com/release/yumeoto/dl.html これじゃねユメミルオトメ：音楽＆映像主題歌：the everlasting light ～約束の夢～ ---------------------------- 自分に架せられた運命に立ち向かう強い決意と愛する人を想い、まっすぐに見つめる主人公琴音の姿が表現された主題歌に仕上がりました。 https://www.alchemics.co.jp/users/bandit/vocal9999_damepo.html によると、 (*1)#7(3:5
nakex12021/06/07
音楽
検索
リンク
AWS、ElasticsearchとKibanaのフォークによる「OpenSearch」プロジェクトを発表。Elasticとの溝は埋まらないまま
AWS、ElasticsearchとKibanaのフォークによる「OpenSearch」プロジェクトを発表。Elasticとの溝は埋まらないままAWSは、オープンソースの検索エンジンと可視化ツールの「OpenSearch」プロジェクトを発表しました。これは検索エンジンおよび可視化ツールとして人気のElasticsearchとKibanaをフォークしたものです。 Introducing the #OpenSearch project: a community-driven, open source fork of Elasticsearch & Kibana. https://t.co/VmlP14DiIC pic.twitter.com/YFAI0KkIx3 —AWS Open Source (@AWSOpen) April 12, 2021 すでにGitHub上には、Elastics
nakex12021/04/13
オープンソース
検索
aws
リンク
Elasticsearchで関連キーワード機能がどれだけ低コストで実装できるかの旅路 - エムスリーテックブログ
クエリに対する関連キーワード機能エムスリーエンジニアリンググループAI・機械学習チームの中村(@po3rin) です。好きな言語はGo。仕事では主に検索周りを担当しています。 Overview 最近の仕事で医師に質問ができるサービスで「Elasticsearchを使ってなるべく低コストで関連キーワード機能を実装する」という案件に携わっていました。本記事では関連キーワード機能を低コストで実装するための技術調査の結果と、実際に採用した方法をご紹介します。今回紹介する方法は機械学習などは使わず、なるべく低コストである程度の品質を目指すものです。この記事を読むことで検索アプリケーションにサクッと関連キーワード機能を実装できるようになるでしょう。 Overview 検索における関連キーワード機能とは実装の前提条件実装パターンの紹介 (1) ログで出現した単語を数えあげる (2) ログに対
nakex12021/03/31
検索
リンク
「よろしい。ではDBも内製だ」　IIJのインシデント調査システムが内製すぎる件 | ログミーBusiness
IIJ Technical NIGHTは、2020年9月11日にオンラインで開催した技術勉強会です。ここで熊坂氏が、SOC（Security Operation Center）のアナリストを支援するインシデント調査システム「CHAGE（チャゲ）」を社内で開発した理由と、その実装について紹介しました。IIJのインシデント調査システム熊坂駿吾氏（以下、熊坂）：IIJの熊坂から、社内で作成しているインシデント調査システムに関して紹介いたします。「インシデント調査システムが内製すぎる件」というところで、IIJの中で作成しているCHAGE（チャゲ）を紹介します。まず私は2015年にIIJに新卒入社しまして、2018年度からSOCで業務を行っています。アナリスト的なことは詳しくやっていなくて、どちらかというとアナリストたちが業務を行うための環境の整備をしています。具体的には、Windowsのメン
nakex12021/02/23
検索
データベース
リンク
画像ファイルやデータベースの文字列を「grep」のように検索できる「ripgrep-all」
Linuxのコマンドラインで文字列を検索する際に必要不可欠なコマンドといえば「grep」です。しかし、grepは動画ファイルやPDFファイルの文字列を検索できないのが弱点。そんなgrepの弱点を克服し、動画ファイルのメタデータやデータベースのレコード、画像ファイル内の文字列まで検索可能なコマンドが「ripgrep-all(rga)」です。GitHub - phiresky/ripgrep-all: rga: ripgrep, but also search inPDFs, E-Books, Office documents,zip, tar.gz,etc. https://github.com/phiresky/ripgrep-all rgaはLinuxに限らずWindowsやmacOSでも利用することが可能。今回はUbuntu 20.04でrgaを利用してみます。以下のコマンドを
nakex12020/12/05
検索
リンク
Elasticsearchを理解するためにLuceneを使った検索エンジン構築に入門してみた - 好奇心に殺される。
Java / Lucene / Elasticsearch Elasticsearchを理解するためにLuceneを使った検索エンジン構築に入門してみた Elasticsearchを理解する為にLuceneに入門しました。今回は簡単な検索エンジンを構築します Overview こんにちは pon です。Elasticsearchで思わぬ挙動にでくわすと、Javaすらやったことのない僕に出来ることはネットの海を彷徨うだけでした。これはよくないと思い、Elasticsearchの仕組みをある程度理解できるように Lucene に入門しました。今回はLuceneのパッケージを利用して簡単な検索エンジンを動かしてみようと思います。Elasticsearch内部でどのようにLuceneを使っているのか知りたい人は必見です。 Lucene とは https://lucene.apache.org/ E
nakex12020/09/28
検索
リンク
ZOZOTOWNの検索基盤におけるElasticsearch移行で得た知見 - ZOZO TECH BLOG
こんにちは。ZOZOテクノロジーズZOZOTOWN部検索チーム兼 ECプラットフォーム部検索基盤チームの有村です。 ZOZOTOWNでは、以前からキーワード検索時にはRDBと併用してElasticsearchを使用していました。本記事ではこれまでRDBで行っていたIDによる索引検索も含め、すべての検索をElasticsearchへ置き換えた事例と、その際に行った設定内容の一部をご紹介します。背景弊社CTOによるこちらの記事にもある通り、ZOZOTOWNでは現在マイクロサービス化を進めており検索システムについてもその対象となっています。検索の文脈では、全文検索/サジェスト/ロギング等関連する様々な課題への解決策として有効であるElasticsearchを採用しマイクロサービス化を進めています。また、もう1つの背景として検索のパーソナライズ化があります。これまでZOZOTOWNでは
nakex12020/06/22
検索
リンク
1234次のページ