Movatterモバイル変換


[0]ホーム

URL:


Hatena Blog Tags
はてなブログ トップ
正規表現
このタグでブログを書く
言葉の解説
ネットで話題
関連ブログ

正規表現

(コンピュータ)
【せいきひょうげん】

検索・置換に便利に使える魔法呪文
検索・置換する文字列のパターンを指定できるため汎用性が高く、「先頭が○○で終端が××」「○○か××か△△のいずれかを含む」などの複雑なマッチングも一発で処理できる。

しかし、方言が多い。おのおののツールのマニュアルを読まずに正規表現をコピペすると痛い目にあう。

本来の意味では記号列の集合を表わす方法であり,regular expression の訳語。(他に正則表現・正則式などの訳語がある。)ただし,一般にコンピュータ上で扱われる多くの「正規表現」はそれに前方参照の拡張を加えたもので,そのような点ではもはや「正規表現」では無い。

正規表現の一例

  • .:任意の1文字
  • [0-9]:0から9の任意の1文字(文字クラス)
  • [^0-9]:0から9以外の任意の1文字(否定文字クラス)
  • A*:正規表現Aの0回以上の繰り返し
  • A+:正規表現Aの1回以上の繰り返し
  • ※ メタ文字以外の任意の文字はそれ自身をあらわす正規表現
    • など
このタグの解説についてこの解説文は、すでに終了したサービス「はてなキーワード」内で有志のユーザーが作成・編集した内容に基づいています。その正確性や網羅性をはてなが保証するものではありません。問題のある記述を発見した場合には、お問い合わせフォームよりご連絡ください。

関連ブログ

AWK文字列のダブルクォート「"」要否

コンピュータのプログラミングにおいて、スペースやダブルクォート(ダブルクォーテーション)の有無は決定的に重要です。スペースやダブルクォートのありなしで、ただそれだけのために、動かなったり、意図どおりの結果にならなかったりします。 プログラミング中にトラブル発生 このことは、プログラミング言語AWKにおいても同様です。 awkプログラム内では、文字列定数はダブルクォート(")で囲む必要があります。そういうルールになっています。 だから、'$2 == "hogehoge"{print $3}' という書き方になります。 一方で、部分文字列を含むのかの判定に正規表現を使用するには、部分文字列をスラッ…

ネットで話題

もっと見る

関連ブログ

AWKのパターンに変数を使用(シェルスクリプトの引数として指定した文字列でデータ検索)

1 正規表現を使った部分一致検索 2 シェルスクリプトによってデータ検索 3 AIによる解決とその解説 4 まとめ 1 正規表現を使った部分一致検索 テキスト処理のためのプログラミング言語AWKは、正規表現に対応しています。 AWKは、 awk 'パターン{アクション}' <入力ファイル>という形で実行しますが、そのパターンに正規表現が使えるのです。 その正規表現を利用すれば、部分一致検索が容易です。 パターンの箇所に「$3 ~ /(部分文字列)/」という形で記述すると、第3フィールドのデータが部分文字列を含む場合に一致します。 「~」(チルダ)が照合演算子で、左辺と右辺が「一致する」(左辺の…

食わず嫌いしていた正規表現を勉強し直したら、単純作業がめっちゃ楽になった話

はじめに この記事は WMMC Advent Calendar 2025 の 12 日目の記事です。(日付 2 回変わってるけど)昨日の記事 に続き、James がお送りします。 tech-kotalog.hatenablog.com adventar.org 今日のテーマについて さて、今日のテーマは 正規表現 です。なぜこのテーマを選んだのか、少しお話しします。 昨日の記事 の中で、PowerRename という機能を紹介しました。その中で「講義 ○○ 用」というフォルダ名から「○○」だけを取り出すために、 「講義 」を消してから、さらに「 用」を消す、という 2 段階の方法を載せました。…

Ruby × Rails × Wasm で動く正規表現エディタ Rubree をリリースしました

はじめまして、シモカワと申します。 この度、長く Rubyist に親しまれてきた Rubular の使い心地を受け継ぎつつ、現代的にアップデートした正規表現エディタ Rubree をリリースしました。 Ruby の正規表現エディタのカリスマ的存在である Rubular には、現代の Ruby 環境での利便性や拡張性の面でいくつか課題がありました。 古い Ruby バージョン上で動作している(執筆時点で Ruby 2.5.9)ため、処理速度や安全性の面で最新 Ruby の恩恵を受けられない OSS としてソースが公開されておらず、拡張や検証が難しい サーバー依存のため、文字列を入力するたびにバ…

技術書典19 か05で新刊「Rubyでつくってまなぶ 正規表現エンジン」を頒布します

今週末から開催される技術書典19で、新刊「Rubyでつくってまなぶ 正規表現エンジン」を頒布します。オフラインでも参加するので2025/11/16(日)は池袋・サンシャインシティ 展示ホールD(文化会館ビル2F)にいます。 techbookfest.org 電子版(PDF)は2025/11/15(土)からこちらで購入できるようになる予定です。 techbookfest.org 本書の内容 B5で122ページの書籍ということで、実装しながら学ぶのにちょうどよいボリュームになっているかなと思っています。「Rubyでつくってまなぶ 正規表現エンジン」というタイトルにあるように、一冊まるまる正規表現エ…

gawkインストールでawk正規表現が日本語対応

1 awk正規表現の日本語対応 2 あきらめようとしていたら… 3 Ubuntu環境を調査 4 gawkのインストール 5 awkの実行 6 awk正規表現の日本語対応 7 まとめ 1 awk正規表現の日本語対応 Ubuntu PCに保存したテキストファイルの中から、正規表現を使って、必要とするデータだけを取り出すawkを実行しました。 そうすると、半角英数字が入ったフィールドでの抽出は成功するのに、全角日本語のフィールドでは失敗します。 生成AIで調べると、awk正規表現が日本語などのマルチバイト文字に対応してないから、という回答でした。それが、2025年9月17日付けの「awk正規表現の日…

awk正規表現の日本語対応

1 awkの勉強 2 自習用のテキストファイル 3 正規表現を使ったコマンド 4 コマンド実行に失敗する原因 1 awkの勉強 Linux等でのファイル暗号化ツールGnuPG(gpg)が手に入った(2025年9月15日付け記事をご覧ください。)こともあって、データ抽出に利用しようと、プログラミング言語awk(オーク)の勉強をしました。 その中で、思いどおりに動作してくれない場面があったので、他の方の参考なるかもしれないと思い、記録に残しておきます。 Ubuntu Linuxデスクトップ 2 自習用のテキストファイル 自習用に、以下のようなテキストファイルを作りました。ファイル名はdata.tx…

正規表現の季節と聞いて、正規表現エンジンを作ってみた

Kernel/VM探検隊@関西 11回目や、Nextbeat Tech Bar: 楽しい正規表現に参加して、どうやら人間は正規表現エンジンを作っているらしいということを知り、私も作ってみたいという気持ちが高まったので正規表現エンジンを作ってみた。 どうやら「秋から冬は正規表現の季節」なのだそうだ。しかし、少し待ってほしい。今は夏ではないか?いや、本当にそうだろうか? 立秋(りっしゅう)は、二十四節気の第13。七月節(旧暦6月後半から7月前半)。 現在広まっている定気法では太陽黄経が135度のときで8月7日ごろ。暦ではそれが起こる日だが、天文学ではその瞬間とする。恒気法では冬至から5/8年(約2…


[8]ページ先頭

©2009-2026 Movatter.jp