Movatterモバイル変換

検索対象

並び順

ブックマーク数

セーフサーチ

期間指定

1 - 40 件 / 57件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

regexpの検索結果1 - 40 件 / 57件

regexpに関するエントリは57件あります。正規表現、regex、programming などが関連タグです。人気エントリには『心のバリアを取り去って「正規表現」に取り組む一歩を踏み出すためのメモ｜DTP Transit 別館』などがあります。

regexpの関連エントリー

心のバリアを取り去って「正規表現」に取り組む一歩を踏み出すためのメモ｜DTP Transit 別館
- 1390 users
- note.com/dtp_tranist
- テクノロジー
- 2021/03/19
長年、後回しにしてきた「正規表現」。四の五の言わずにはじめようよ！と20年前の自分に伝えたく、まとめてみました。詳しい方が見ると、乱暴だったり、おかしなところがあると思いますが、入り口に立つことが大切だと考えています（書いた人は文系・グラフィックデザイン関連です）。はじめにたとえば、文章中に「コンピュータ」と「コンピューター」が混在していて、これを「コンピューター」に統一したいとき、あなたなら、どうしますか？単純な検索置換なら、次のような順番で処理できます。 ❶「コンピューター」を「コンピュータ」に一括置換する ❷「コンピュータ」を「コンピューター」に一括置換する ❸ ちょっと心配なので「ーー」（音引きの繰り返し）をチェックこれはこれでアリなのですが、1回の作業でできたらベターです。しかし、「コンピュ-タ」のように正しく音引き（ー）が入力されていない場合には単純な検索置換ではお手
正規表現の先読み・後読み
- 686 users
- zenn.dev/usamik26
- テクノロジー
- 2022/08/22
正規表現の「先読み（lookahead）」「後読み（lookbehind）」について紹介します。正規表現の「位置へのマッチ」正規表現は、文字列のパターンマッチに使われます。たとえば [0-9]{4} は数字4つが並ぶ文字列にマッチする表現です。多くの正規表現は「文字列」にマッチしますが、「文字列」ではなく「位置」にマッチする表現があります。これは、アンカーと呼ばれます。また、長さ0の文字列にマッチすると考えて、ゼロ幅アサーションとも呼ばれます。アンカーの例として、^（先頭）$（末尾）\b（単語の境界）などがあります。この例では、cat にはマッチします。一方、category や concat は cat を含みますが前後が単語の境界になっていないためマッチしません。先読み先読み（lookahead）は、位置にマッチする記法の一種です。位置の指定に正規表現を使います。(?=
正規表現の"正規"とは何か気になったら正規表現の歴史を紐解くことになってしまった話
- 617 users
- zenn.dev/yucatio
- テクノロジー
- 2021/10/31
正規表現の"正規"って何ある時ふと思いました。「正規表現の"正規"って何だろう？」「何を根拠に"正規"を名乗っているのか？」と。「誰かが『これが正規の表現だ』と言ったはず」で、「それは周りにどうやって"正規"だと認められたのだろう」ということが気になったので調べてみました。 "正規表現"という名前でなくて、"ジャックさんの表現"とか"記号ごちゃごちゃ表現"だったらこんな疑問も持たなかったのですけど。数学における"正規"とは一般に"正規"というと、"正規品"や"正規の手順"といったように"本物の(genuine)"や"公式な(official)"といった意味がありますが、数学の"正規"はちょっと違います。数学で"正規"(および"正則"、英語では"regular"または"non-singular")は、ある概念に強い制限をかけたもの、という意味です。強い制限をかけたものは取
正規表現の脆弱性 (ReDoS) を JavaScript で学ぶ
- 489 users
- nmi.jp
- テクノロジー
- 2022/02/18
先日、このようなツイートを書いたところ、かなりの反響がありました。 JavaScript の正規表現の脆弱性の例でいうと、例えば /\s+$/ は脆弱性があると言える console.time(); /\s+$/.test(" ".repeat(65536) + "a"); console.timeEnd(); 結構時間がかかるのがわかる。でも /\s+$/ を見て「これは危険だな」と理解出来る人はそんなにいない。JavaScript に限らないけれど。 — Takuo Kihira (@tkihira) February 17, 2022 これは一般に ReDoS (Regular expression Denial of Service) と呼ばれる脆弱性です。正確に理解するのが難しい脆弱性なので、少し解説してみたいと思います。結論長い記事になるので、最初に「とりあえずこれだけ知っ

regexpの関連エントリー

君はメールアドレスの正規表現を適当にググって使っていないか？
- 433 users
- zenn.dev/igz0
- テクノロジー
- 2025/02/25
/^[a-zA-Z0-9.!#$%&'*+\/=?^_`{|}~-]+@[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?(?:\.[a-zA-Z0-9](?:[a-zA-Z0-9-]{0,61}[a-zA-Z0-9])?)*$/ だ。いいね？なぜこの正規表現がいいのかちなみにこれの何がいいかというと「HTMLの標準仕様を定めるWHATWGの正規表現をそのまま使っている」ところ。つまり、各ブラウザのデフォルトの<input type="email" />のバリデーションと一致するという大きなメリットを得られる。これはMDNにも載っている列記とした「実用的な」正規表現だ。ちなみにRFCオタクがRFC準拠のおおよそ実用に耐えないであろうメールアドレスの正規表現を推してくるかもしれないが無視して良い。例えば、RFCに準拠している以下のようなメ
シンプル図解: 正規表現の (?= ) とか (?! ) とか (?<= ) とか (?<! ) とか - Qiita
- 426 users
- qiita.com/pal4de
- テクノロジー
- 2022/12/15
入社1年目、趣味は整理整頓、 @pal4de です。正規表現が大好きです。先日投稿した記事が好評いただき本当にうれしかったです。もっとたくさんの人に読んでもらいたい！！！さて、上の記事で紹介したのは単語境界 \b でしたが、これは先読み/後読みを駆使して下記の通りに表せると紹介しました。便利な\bですらショートハンドに過ぎず、真に強力なものは先読み(?=...)と後読み(?<=...) だということを主張したい！！！わかりすい図解も添えましたので、是非お楽しみください🏝️ 正規表現の記号は4種類先読みの紹介に入る前に、改めて正規表現を俯瞰してみましょう。誤解を恐れずに言えば、正規表現に出てくる記号の種類は4つしかないといえます1 2。このようにとらえてみると、正規表現と向き合うのがだいぶ楽になります。体系化された理解への第一歩ですね 🗿 図にもある通り、行頭 ^ も
アイヌ語仮名「ㇷ゚」に対する正規表現の罠
- 264 users
- zenn.dev/mkpoli
- テクノロジー
- 2023/08/31
導入アイヌ語は日本語と異なり、閉音節（子音で終わる音節）も存在するので、表記の際音素文字であるラテン文字なら、そのまま p, t, k, m, n, s, r などの子音文字を後ろの付ければ良いわけなので、アイヌ語ローマ字表記では、何も問題が生じない。しかし、元々開音節言語である日本語に特化したカタカナのような仮名文字で表記する際、鼻音 n は「ン」でなんとかなる（実はそれでもまずい事になっているけどここでは割愛する）が、p, t, k, m, n, s, r, h はどうしようもないので、特殊の捨て仮名（小書き仮名文字）を利用することになっている。具体的には以下のような特殊仮名文字（通称　アイヌ語仮名）である。ㇷ゚ -p ッ -t ㇰ -k ㇺ -m ㇱ -s ㇻ -(a)r, ㇼ -(i)r, ㇽ -(u)r, ㇾ -(e)r, ㇿ -(o)r お分かり頂けただろうか… 問題 r
君たちは正規表現におけるインド数字の罠にハマったことはあるかい？(١٢٣٤٥٦٧٨٩) - Qiita
- 234 users
- qiita.com/papi_tokei
- テクノロジー
- 2022/06/22
import re re.match(r'\d{4}-\d{2}', '٢٠٢٢-٠٦') Pythonで書いてはいますが、内容を補足します。「'٢٠٢٢-٠٦'」という文字列が、数字4文字+ハイフン+数字2文字にマッチするかどうか、という正規表現を書いています。一見するとどう見ても数字4桁ではないので、正規表現にマッチしないように見えますよね？？？？実は正規表現にマッチします！！！というのが今回の記事の内容になります。そもそも正規表現における数字の扱いとは今回はPythonの正規表現のライブラリを利用しているので、公式のリファレンスを見てみましょう。該当の部分には以下のような記述があります。 \d Unicode (str) パターンでは: 任意の Unicode 10 進数字 (Unicode 文字カテゴリ [Nd]) にマッチします。これは [0-9] とその他多数の数字を
Mozilla、今後はV8の正規表現エンジンをFirefoxにそのまま取り込むと表明。そのための互換レイヤを開発
- 175 users
- www.publickey1.jp
- テクノロジー
- 2020/06/08
Mozilla、今後はV8の正規表現エンジンをFirefoxにそのまま取り込むと表明。そのための互換レイヤを開発 WebブラウザにはJavaScriptを実行するためのJavaScriptエンジンが搭載されています。それはChromeであれば「V8」、Firefoxであれば「SpiderMonkey」と呼ばれ、それぞれのWebブラウザベンダがECMAScriptの標準に準拠したうえで独自に実装しています。そしてJavaScriptは以前から正規表現の機能を備えているため、正規表現を解釈し展開するための正規表現エンジンもそれぞれのWebブラウザベンダが実装を行っていました。その正規表現エンジンについてMozillaは今後、V8の正規表現エンジンのコードをそのままFirefoxのSpiderMonkeyに取り込むようにすると表明しました。 Mozillaはこれを実現するため、V8用の正規表
ReDoS 検出の最先端 recheck の紹介 / State of the Art of ReDoS Detection
- 128 users
- speakerdeck.com/makenowjust
- テクノロジー
- 2022/03/04
YAPC::Japan::Online 2022 での発表資料です。 recheck:
Regexp::AssembleのGo実装 rassemble-go を作りました - プログラムモグモグ
- 116 users
- itchyny.hatenablog.com
- テクノロジー
- 2020/10/26
PerlにはRegexp::Assembleという便利なライブラリがあります。複数の正規表現を受け取り、それらのいずれかにマッチする正規表現を構築するためのライブラリです。 my $ra = Regexp::Assemble->new; $ra->add( 'ab+c' ); $ra->add( 'ab+\\d*\\s+c' ); $ra->add( 'a\\w+\\d+' ); $ra->add( 'a\\d+' ); print $ra->re; # prints (?:a(?:b+(?:\d*\s+)?c|(?:\w+)?\d+)) このライブラリのGo実装を金曜日の夜から書き始めて、ようやく形になってきたので公開しました。 package main import ( "fmt" "log" "github.com/itchyny/rassemble-go" ) func main
Blog｜その正規表現の書き方で大丈夫？ ReDoS 攻撃の怖さと対策方法
- 105 users
- yamory.io
- テクノロジー
- 2020/06/19
ReDoS とは、Regular expression Denial of Service の略称で脆弱な正規表現を利用することで起こる DoS のひとつです。正規表現は利用者からの入力値の検証など色々な場面で利用されていますが、正規表現の記述は難しく、誤った記述をしてしまうと ReDoS の影響を受ける恐れがあります。本記事では ReDoS の概要から対策方法まで解説していきます。 ReDoS とはメールアドレスや電話番号の入力が正しい形式になっているかどうかを確認するために正規表現を使うことがあると思います。複雑な形式をマッチさせる正規表現を正しく書くことは難しく、書き方によっては処理に時間がかかることがあります。 ReDoS は、正規表現が使われている部分において、正規表現エンジンに対して処理時間が多くかかる入力を与えることでサービス停止が起こる脆弱性です。 Freezing
20日目: 正規表現が ReDoS 脆弱になる 3 つの経験則
- 76 users
- www.rcc.ritsumei.ac.jp
- テクノロジー
- 2021/12/21
はじめに皆さんこんにちは．3回生のらん（@hoshina350）です．文字列マッチングに便利な正規表現ですが，テキトーに書くと脆弱になり得るという情報を耳にしてから色々と原因や対策を調べていました．しかし，多くの記事で紹介されていた対策方法は，「独自の正規表現を使用しないー」とか「 * や + などの繰り返し表現はなるべく使わないー」とかいうなんともふわっとしたものでした．これでは「いやぁ確かにそうなんかもしれんけど…そうゆう訳にはいかんやんか…」と納得できません．つまり，「本質的に何が問題」で，「具体的にどんな特徴のある正規表現が脆弱になり得るのか」を知りたい訳です．そこで，様々な文献を調査してみました．本記事では調査して溜まった知見を紹介していきます．本記事は， Purdue大学のJames Davis教授による “The Regular Expression Denia
はじめに - 作って学ぶ正規表現エンジン
- 75 users
- makenowjust.github.io
- テクノロジー
- 2024/01/29
はじめに正規表現は様々なプログラミング言語で利用されている、テキスト処理のためのパターン言語です。正規表現はテキストエディタでの検索や置換、入力文字列のバリデーションなどプログラミングの様々な分野で実用されています。ある程度の規模のプログラムにおいて、正規表現を全く利用しない (利用していない) ということはほとんど無く、正規表現は今日のプログラミングにおいて非常に重要なパーツだと言えます。 JavaScriptやRubyといったプログラミング言語では正規表現はファーストクラスのリテラルとして実装されているため、とても簡単に利用できます。例えば次のRubyプログラミングでは変数fooに入った文字列の部分にfizzかbuzzが含まれるかどうかを、正規表現/fizz|buzz/を使ってチェックしています。 foo =~ /fizz|buzz/ さらに、計算機科学 (コンピューターサイエ
Goの正規表現が遅いって言う人がいたから、（速い）正規表現エンジンを作ったよ
- 54 users
- zenn.dev/yanother
- テクノロジー
- 2021/12/20
はじめに「Goの正規表現は遅い」そんなふうによく言われていました。（最近はあまり聞かなくなりましたが）たとえば、↓の記事ではPythonの正規表現と比較して1.5倍くらい遅いという結果になっています：この話には「Goの正規表現は最悪時間が短くなるように安定したアルゴリズムを採用しているから」という回答があります： ↑の記事の比較では、GoがPerlに対して約10倍以上高速という結果が出ているので、「Goの正規表現は遅くない！はい、論破ー！」というわけですね。なんでこうなるのかも↑の記事で説明されているとおりですが、Perl（などのバックトラック型エンジン）が入力長に対して指数関数的に実行時間が伸びていくのに対し、Goの正規表現エンジンは入力長に対して線形時間で実行時間が伸びていくアルゴリズムを採用しているため、入力が長くなると急激にGoのほうが有利になるからです：一方で、入力が
JSのウェブフレームワークで高速なルーターを実装する方法
- 52 users
- speakerdeck.com/usualoma
- テクノロジー
- 2022/06/25
https://nseg.connpass.com/event/251366/ での発表資料です。
Ruby の正規表現で素数かどうかを確認する方法
- 52 users
- yu8mada.com
- テクノロジー
- 2021/06/14
Ruby の正規表現で素数かどうかを確認する方法作成日 2018.09.11 更新日 2018.09.13 Regex Ruby Ruby の正規表現を使って, 素数かどうかを確認するメソッドを作ってみました. パフォーマンスは正直全然良くないのですが, 余興の様なものとしては面白いのではないかと思います. 正規表現の説明もします. そもそも素数というのは, どの様な数なのでしょうか. Wikipedia によりますと次のように定義されています: 素数（そすう、英: prime number）とは、1 より大きい自然数で、正の約数が 1 と自分自身のみであるもののことである。正の約数の個数が 2 である自然数と言い換えることもできる。なので 0, 1, 4, 6, 8, 9, 10, 12 といった数は素数ではなく, 2, 3, 5, 7, 11, 13 といった数が素数になります.
不必要な制御文字への対処 - pixiv inside
- 46 users
- inside.pixiv.blog
- テクノロジー
- 2020/05/13
こんにちは、晴れて2020新卒になったmipsparcです。最近は趣味の鉄道技術系同人誌の新版が出来上がって喜んでいます。本記事では、入力値には必ずと言っていいほど混入する不必要な制御文字への対処方法をご紹介します。ユーザーに文字列を入力してもらうことのあるすべてのサービスで活用できる話かと思います。不要な制御文字が入ることで生じる問題前提として、この記事は制御文字類が必ずしも邪魔と言いたいわけではありません。制御文字は多言語対応(特に右から左方向に記述する言語)などで重要なときもありますが、今回は問題が発生しうるケースのお話をします。「‪腐向け」「メリークリスマス‬」「ゾンビ」なんの変哲もない3つのイラストタグですが、どれも不可視の制御文字が混入しています。 $ php -r "var_dump(json_encode('腐向け'));" string(26) ""\u2
TypeScript 5.5 で追加された正規表現構文チェックを理解する
- 38 users
- zenn.dev/cybozu_frontend
- テクノロジー
- 2024/06/21
TypeScript 5.5で、@graphemeclusterさんによって正規表現リテラルの構文チェックが導入されました🎉 この構文チェックによって、正規表現に間違いがあった場合、事前にTypeScriptがエラーを出力してくれます。この機能について、次のことが気になったので調べてみました。どんな構文がエラーになるかなぜ導入されたかどうやってチェックしているか JavaScriptで実行できるがTypeScriptでエラーになる構文はあるか ESLintとのカバー範囲の違い本記事に関して、誤り等があれば指摘いただけると嬉しいです。どんな構文がエラーになるか TypeScript 5.5では、正規表現に関するエラーメッセージが40個程度追加されています。例えば、下記のような構文は、5.5でエラーになります。 // 存在しないフラグ var re = /a/b; // エラー
JavaScriptで平仮名(ひらがな)を判定する - Qiita
- 37 users
- qiita.com/thzking
- テクノロジー
- 2023/01/05
regex = /*ここに何らかの正規表現*/; regex.test("あいうえお"); // -> true regex.test("あぁ"); // -> true regex.test("aiueo"); // -> false regex.test("あいueo"); // -> false regex.test("あいうえお"); // -> false
正規表現とは何なのか、makenowjustが正規表現に興味を持ったきっかけ。深掘りRubyKaigi 2023 with spikeolaf & makenowjust 文字起こしレポート vol.1 - STORES Product Blog
- 29 users
- product.st.inc
- テクノロジー
- 2023/07/24
2023年6月15日に『深掘りRubyKaigi 2023 with spikeolaf & makenowjust』を開催しました。イベントの内容をほぼ全文文字起こし形式でお届けします。この記事は第1部です。 hey.connpass.com イベントのアーカイブはYouTubeでも公開しています。 www.youtube.com 登場人物ゲスト makenowjust/藤浪大弥さん spikeolaf/金子雄一郎さん STORES fujimura/藤村大介 shyouhei/卜部昌平 hogelog/小室直正規表現に興味を持ったきっかけ fujimura：最初は藤浪さん、makenowjustさんに正規表現の発表について伺おうと思います。まずは改めてRubyKaigi 2023でどんなことを発表したかを紹介いただけないでしょうか？ makenowjust：Rubyの正規
先読みと後読みを使ったパターン
- 29 users
- www.javadrive.jp
- テクノロジー
- 2021/03/11
正規表現ではパターンが対象の文字列とマッチするかどうかをチェックしますが、先読みや後読みでは文字列とマッチするかどうかは調べるけれどマッチした文字列としては取得しません。先読みと後読みでは利用方法に応じて、肯定先読み、否定先読み、肯定後読み、否定後読み、の 4 種類が利用できます。ここでは正規表現における先読みと後読みを使ったパターンの利用方法について解説します。
A New RegExp Engine in SpiderMonkey – Mozilla Hacks - the Web developer blog
- 28 users
- hacks.mozilla.org
- テクノロジー
- 2020/06/05
Background: RegExps in SpiderMonkey Regular expressions – commonly known as RegExps – are a powerful tool in JavaScript for manipulating strings. They provide a rich syntax to describe and capture character information. They’re also heavily used, so it’s important for SpiderMonkey (the JavaScript engine in Firefox) to optimize them well. Over the years, we’ve had several approaches to RegExps. Con
[Go] パフォーマンスが悪い正規表現パッケージの使い方をチェックするlinterを作った - My External Storage
- 28 users
- budougumi0617.github.io
- テクノロジー
- 2020/08/20
TL;DR regexpパッケージのコンパイル処理はプロセス初期化時などに一度だけ行うのが望ましい https://golang.org/pkg/regexp regexp.MustCompileなどこれをチェックするlinterを作った https://github.com/budougumi0617/regexponce gostaticanalysis/analysisutilを使えばすぐできた https://github.com/gostaticanalysis/analysisutil SSAは難しいけどおもしろい！ regexpパッケージをコンパイルを使うときのお作法 Goの正規表現を使いたいときはregexpパッケージを使う。このパッケージの使い方には注意すべき点がある。 https://golang.org/pkg/regexp/ 上記記事の以下の部分が注意点だ。正
GitHub - yoav-lavi/melody: Melody is a language that compiles to regular expressions and aims to be more readable and maintainable
- 26 users
- github.com/yoav-lavi
- テクノロジー
- 2022/02/19
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
Rob Pike's simple C regex matcher in Go
- 24 users
- benhoyt.com
- テクノロジー
- 2022/08/12
Rob Pike’s simple C regex matcher in Go August 2022 Back in 1998, Rob Pike – of Go and Plan 9 fame – wrote a simple regular expression matcher in C for The Practice of Programming, a book he wrote with fellow Unix hacker Brian Kernighan. If you haven’t read Kernighan’s “exegesis” of this code, it’s definitely worth the 30-minute time investment it takes to go through that slowly. With Go’s C herit
正規表現：文字列を「含まない」否定の表現まとめ | WWWクリエイターズ
- 17 users
- www-creators.com
- テクノロジー
- 2020/10/16
「〜を含まない」といった、否定の意味を持つ正規表現を記述する場合、下記のように、大きく分けて２種類のケースがあります。「特定の１文字を含まない」といった否定表現か、もしくは「正規表現パターンを含まない」といった表現かで、大きく解決の方針が異なる点に注意して下さい。特定の１文字だけを否定したい場合は非常にシンプルです。この場合、「文字クラス」、もしくはエスケープシーケンスで表される文字型を利用する事で表現できます。一方で、特定の正規表現パターンを否定したい場合、少し記述が複雑になります。今回は「否定先読み」を利用した表現を、この記事の後半にご紹介します。基本的な正規表現の記法はこの記事では触れませんので、不安な方はこちらの記事も合わせてご参照下さい：正規表現とは？基本構文とメタ文字一覧（サンプル付）それでは、順番に詳しく見ていきます。任意の一文字を含まない文字列の正規表現 a「
とほほの正規表現入門 - とほほのWWW入門
- 17 users
- www.tohoho-web.com
- テクノロジー
- 2021/07/28
正規表現とは正規表現の落とし穴本書における記法文字・文字列文字(A) 文字列(ABC) 任意文字任意文字(.) 行頭・行末行頭(^) 行末($, \z, \Z) いずれかの文字いずれかの文字([...]) グルーピンググルーピング((...)) AまたはB AまたはB(A|B) 繰り返し 0回以上の繰り返し(*) 1回以上の繰り返し(+) 0回または1回(?) n～m回の繰り返し({n}, {n,}, {n,m}) 最短マッチング最短マッチング(0回以上)(*?) 最短マッチング(1回以上)(+?) 最短マッチング(0回か1回)(??) 最短マッチング(n～m回)({n,m}?) エスケープシーケンスメタ文字(\x) 制御文字(\x) 文字コード(\xxx, \xxx) 定義済み正規表現定義済み正規表現(\x) キャプチャグループキャプチャグループ(\1, \2,
GitHub - pemistahl/grex-js: A JavaScript / WebAssembly library for generating regular expressions from user-provided test cases
- 17 users
- github.com/pemistahl
- テクノロジー
- 2022/08/13
grex is a library that is meant to simplify the often complicated and tedious task of creating regular expressions. It does so by automatically generating a single regular expression from user-provided test cases. The resulting expression is guaranteed to match the test cases which it was generated from. This project has started as a Rust port of the JavaScript tool regexgen written by Devon Govet
Pike VMとEarley法の関係についてRubyで実装して考えてみる | makenowjust-labs/blog
- 16 users
- makenowjust-labs.github.io
- テクノロジー
- 2023/08/06
正規表現マッチングの実装手法の1つとしてPike VMと呼ばれるものがあります。これはGo言語の正規表現実装やRustのregex crateで使われている手法であり、正規表現rrrと入力文字列wwwに対してO(∣r∣×∣w∣)O(|r| \times |w|)O(∣r∣×∣w∣)の計算量でマッチングができるのが特徴です。 Earley法はJay Earleyの提案した文脈自由文法 (CFG) の構文解析手法の1つです。すべてのCFGを構文解析できる手法で最悪計算量はO(∣w∣3)O({|w|}^3)O(∣w∣3)ですが、無曖昧であればO(∣w∣2)O({|w|}^2)O(∣w∣2)で、決定的であればO(∣w∣)O({|w|})O(∣w∣)で構文解析ができます。実装してみると分かりますが、Pike VMとEarley法には類似している点があり、Earley法をPike VMの発展系の
Regular expressions in JavaScript
- 12 users
- www.honeybadger.io
- テクノロジー
- 2023/05/26
Regular expressions in JavaScript By Adebayo Adams on May 11, 2023 The string is arguably the most essential data type in programming; every programming language and software in the world uses strings in one way or another. It enables humans to easily communicate with sophisticated programs and machines. One thing that would help you a lot as a programmer is understanding how to use and manipulate
JSで書かれたECMAScript RegExpパーサーの比較 | Memory ice cubes
- 12 users
- leaysgur.github.io
- テクノロジー
- 2024/08/06
OXCで正規表現パーサーを実装してるときに全部一通り読んでみて、みんな違ってみんな良いってなったので。候補はこちらの3つ。 https://github.com/jviereck/regjsparser https://github.com/DmitrySoshnikov/regexp-tree https://github.com/eslint-community/regexpp かのAST Explorerでも、RegExp部門ではこの3つがリストにある。 AST explorer https://astexplorer.net/ 前提 ECMAScript本体だと、ESTreeというデファクトがあるけど、残念ながらRegExpにはない。 ESTreeでのRegExpの扱いはこんな感じで、ただの文字列でしかない。 interface RegExpLiteral <: Literal
- javascript
- AST
プログラム中の文字列チェック機能の脆弱性を自動修正する技術を世界に先駆けて実現～専門知識をもたない開発者でもReDoS脆弱性の修正が容易に～ | ニュースリリース | NTT
- 11 users
- group.ntt
- テクノロジー
- 2022/03/23
日本電信電話株式会社（本社：東京都千代田区、代表取締役社長：澤田　純、以下「NTT」）と学校法人早稲田大学（本部：東京都新宿区　理事長：田中愛治　以下、「早稲田大学」）は、文字列のチェック機能の処理時間を長期化させコンピュータの負荷を大幅に増大させる攻撃を引き起こす脆弱性に対する実用的な自動修正技術を世界に先駆けて実現いたしました。文字列のパターンマッチに用いられる正規表現（※1）とは、特定の文字の並び（文字列）をルールに基づき簡略化して表現する方法で、Webサービスなどにおいてユーザの入力値が期待したものであるかの検証など幅広い場面で利用されています。難解な正規表現の仕組みやルールを深く理解し、検証すべき文字列を厳密に定義できていないと脆弱性になってしまうため、近年グローバルで大きな脅威となっています。この技術によって、専門知識をもたない開発者でもこうした正規表現の脆弱性の修正が可能とな
- Security
- あとで読む
GitHub - slevithan/regex: JS regexes + future. A template tag for readable, high-performance, native JS regexes with extended syntax, context-aware interpolation, and always-on best practices.
- 10 users
- github.com/slevithan
- テクノロジー
- 2024/06/10
Regex+ (aka regex, based on its package and tag name) is a template tag that extends JavaScript regular expressions with key features that make regexes more powerful and dramatically more readable. It returns native RegExp instances that run with native performance, and can exceed the performance of regex literals you'd write yourself. It's also lightweight, supports all ES2025 regex features, has
ノイズが多いテキストを対象にした正規表現を書きやすくするPythonモジュール regex - MNTSQ Techブログ
- 8 users
- tech.mntsq.co.jp
- テクノロジー
- 2022/08/03
MNTSQ(モンテスキュー)という契約書管理のSaaS製品を開発する会社で、アルゴリズムエンジニアをしている坂本です。契約書に書かれた情報を自動で抽出する仕組みを作っています。概要正規表現とはなにか正規表現を書きにくい、中ボス的なテキストが存在する regexモジュールのFuzzy match機能を使って、楽に中ボスを倒す Fuzzy matchの使用例裏話実は、採用ブログも兼ねていますこの記事を書いた人概要私も非エンジニア出身であるため、Techブログではあるものの、幅広い方に読んでいただきたいと思いました。このブログの内容をざっくり図解すると、こんな内容を扱います。正規表現とはなにかテキスト（＝文字列）に対して、マッチさせるパターンのことです。特定の文字を含むテキストを探すときに使います。例えば、テキスト１：「庭には２羽ニワトリがいる」パターン１：「
- python
Censys Search
- 8 users
- search.censys.io
- テクノロジー
- 2021/06/15
Services: 2.3B IPv4 Hosts: 214.5M IPv6 Hosts: 53.5M Virtual Hosts: 586.9M
The Regular Expression Visualizer, Simulator & Cross-Compiler Tool
- 7 users
- blog.robertelder.org
- テクノロジー
- 2020/07/29
This article is part of Series On Regular Expressions. For more examples of regular expressions to visualize, check out this this list of Regular Expression Test Cases. Your Regex: String To Search: Generate New Random Matching String The Regex As A C Program Common C Code For All Regular Expressions The C source code below is the common code that is required by any of the code samples that are g
GitHub - unjs/magic-regexp: A compiled-away, type-safe, readable RegExp alternative
- 7 users
- github.com/unjs
- テクノロジー
- 2022/07/19
You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert
（Gスプレッドシート）文字列から数字を抽出する - いきなり答える備忘録
- 7 users
- www.officeisyours.com
- テクノロジー
- 2020/08/16
Googleスプレッドシートで、文字列に含まれる数字だけを取り出す方法についてです。対象とするのは半角数字とします。数字は文字列として抽出し、0で始まる数字もそのまま抽出するものとします。取り出したい範囲に応じていくつかの方法を紹介します。 REGEXEXTRACT関数やREGEXREPLACE関数を使って、文字列から数字だけを取り出すことができます。手順サンプルデータと実行結果すべての数字を取り出してつなげる一連の数字ごとに抽出して記号で区切る一連の数字ごとに抽出して各セルに分割する数字のうち最初に現れる一連のものだけ抽出する数字のうち最後に現れる一連のものだけ抽出する数字のうち最初の1文字だけ抽出する数字のうち最後の1文字だけ抽出する全角数字やカンマ等の扱いについて手順サンプルデータと実行結果 B3:B9セルには全く同じ文字列が記録されています。これに対し、
- excel
正規表現：AND（かつ）の表現方法 | WWWクリエイターズ
- 6 users
- www-creators.com
- テクノロジー
- 2020/10/16
正規表現の「AND（かつ）」の表現正規表現において、複数のパターンの論理積「AND」、すなわち「A、かつB」といったパターンの並列表現はややトリッキーです。初学者にはややハードルが高いかもしれませんが、記事後半に解説を加えておきましたので、よくわからない方はご一読下さい。〇〇を含む、AND（かつ）、〇〇を含む AND（かつ）条件の例として、リテラル（＝ただの文字）のマッチを考えてみます。下記は、「ラーメンを含む、かつ、カレーを含む」という、お子様も大好きなメニューの定番をマッチングする正規表現です。 // ラーメンを含み、かつ、カレーを含む文字列の表現 ^(?=.*ラーメン)(?=.*カレー).*$ 注目すべきは、「(?=」「)」の括弧です。これは肯定先読みを言いますが、こちらについては、追って解説します。〇〇を含む、AND（かつ）、〇〇を含むまない同様に、否定先読みを組み合わせて