Movatterモバイル変換

shunkeen id:shunkeen

正規表現に関するshunkeenのブックマーク (7)

正規表現でガチャを回せる投稿サイトを作った話
（映像もつくりました）正規表現ガチャ（英語名：Regech）という、正規表現から生成されるランダムな文字列でガチャを引ける投稿サイトをNext.jsで個人開発した話です。筆者について今までPHPやjQueryで開発をしてきた19歳です。制作期間は20日ほどです。もしよければ、読んで・遊んでいってもらえたら嬉しいです！つくったもの正規表現にマッチするランダムな文字列を生成するアプリです。例：(にゃん?)+→にゃにゃんにゃんにゃおもしろいガチャができたら投稿することでみんなで遊べるようになります。ぜひ、おもしろいガチャを作って投稿してください！正規表現の学習にもおすすめです。英語対応もしてみたので英語環境からアクセスするか、/en/にアクセスすると英語でも見れます。私のおすすめガチャ私のおすすめです。他にもおもしろいガチャが投稿されているので遊んでみてください！リ
shunkeen2023/01/28
なるほど、使ってるライブラリ的に「$^」とか絶対にマッチしない位置指定与えると、空文字しか出ないのか。あと「.*」とかで任意の文字列生成すると文字化けみたいになって笑う。「a{1000}」は画面が爆発した。
正規表現
ガチャ
リンク
キャッシュによるRubyの正規表現のマッチングの高速化の紹介 - クックパッド開発者ブログ
9月からRuby開発チームにインターンシップとして参加している@makenowjustです。総合研究大学院大学の学生で、普段は情報セキュリティに関する研究をしています。インターンシップでは、キャッシュ (メモ化) を利用したRubyの正規表現の高速化を行いました。 ReDoSと呼ばれる、バックトラックが爆発することでマッチング時間が膨大になる脆弱性があります (ReDoSについては、拙作ですがWEB+DB PRESSに掲載された記事があります)。近年、ReDoSは多く報告されており、Rubyもその例外ではありません (参考1、参考2)。今回実装した最適化は、ReDoSを防ぐことを目的としたもので、多くの正規表現のマッチング時間が文字列の長さに対して線形となります。 ReDoSが起こる正規表現の例として、/^(a|a)*$/が挙げられます。今回の修正の前後での実行時間を比較すると、
shunkeen2022/12/13
メモ化で線形時間になるのPEG（パックラット構文解析）みある。しかしVM型の正規表現エンジンにメモ化ぶち込む技量がすごいし、時間計算量と空間計算量のバランスの取り方も現実見てる感じあるし、つよつよ学生だ…
正規表現
Ruby
ReDos
アルゴリズム
リンク
GitHub - yoav-lavi/melody: Melody is a language that compiles to regular expressions and aims to be more readable and maintainable
You signed in with another tab or window. Reload to refresh yoursession. You signed out in another tab or window. Reload to refresh yoursession. Youswitched accounts on another tab or window. Reload to refresh yoursession. Dismiss alert
shunkeen2022/04/06
Haskellのdo記法で書くPersecを想起した。さながら手続き型正規表現特化言語＞“Melody is a language that compiles to ECMAScript regular expressions”
正規表現
javascript
Regex
リンク
Redirect
Click here to be redirected.
shunkeen2022/03/10
ReDos（脆弱な正規表現を利用することで起こるDoS）の話かな？＞“An attacker could use this security issue to perform a denial of service, by sending a specially crafted regex to a service accepting untrusted regexes.”
Rust
正規表現
セキュリティ
リンク
ReDoS 検出の最先端 recheck の紹介 / State of the Art of ReDoS Detection
YAPC::Japan::Online 2022 での発表資料です。 recheck:
shunkeen2022/03/06
PEG（Parsing Expression Grammar）のパックラット構文解析みたいに、空間計算量を犠牲にしてReDosをどうにかする正規表現エンジンとかないのかな＞”正規言語でない拡張に対しては、オートマトンの解析による検出は無力”
正規表現
セキュリティ
パフォーマンス
ReDos
リンク
正規表現を追い抜かせ！トライ木で複数固定文字列の探索をしてみた
GMO NIKKOのT.Iです。今回は当社のTRUE データフィードで使用している正規表現検索の効率化についての記事となります。前提（背景と目的）まずは宣伝（笑）当社公式サイトでは上記となっていますが、簡単にいうと・クライアントからデータを預かる・預かったデータを広告媒体毎のフォーマットの変換する・変換したデータを指定された場所に送信するということをやっています。その中のデータの変換時に禁止文言が入ったデータを行ごと除外するということをやっています。大量のデータに禁止文言が入っているかをチェックする必要がある... この記事では、複数文字列の探索について、正規表現よりもトライ木を使った方が速いことを確かめます。最初に問題設定を共有します。次に忙しい人向けにベンチマークの結果を発表します。実装言語に関する注意を挟んで、力まかせな実装を提示します。続いて、正規表現について簡単に説明し、正規表現
shunkeen2022/02/05
セルクマ。星なしの正規表現のみを解釈する非巡回DFA型エンジンとか見てみたい
トライ木
正規表現
文字列探索
アルゴリズム
リンク
正規表現検索の効率化
GMO NIKKOのT.Iです。今回は当社のTRUE データフィードで使用している正規表現検索の効率化についての記事となります。前提（背景と目的）まずは宣伝（笑）当社公式サイトでは上記となっていますが、簡単にいうと・クライアントからデータを預かる・預かったデータを広告媒体毎のフォーマットの変換する・変換したデータを指定された場所に送信するということをやっています。その中のデータの変換時に禁止文言が入ったデータを行ごと除外するということをやっています。大量のデータに禁止文言が入っているかをチェックする必要があるのですが、初期想定では精々10万件に対して100～1000個の禁止文言をチェックする程度（1億回程度）で十分と判断していました。ですが運用後に禁止文言が3万を超えてしまい、チェック処理が10万件×3万＝30億回のチェックを行う場合があり、処理時間がかなり長くなっ
shunkeen2022/01/06
仕様的には正規表現よりも狭い文字列探索アルゴリズムの範疇かも？正規表現エンジンがよしなにBitapとか、KMP法をやってたり、選言を並列化してたら爆速になってそう／複数検索だから、選ぶならラビン-カープか
PHP
正規表現
文字列探索
リンク
1