UTF-8 への移行計画 以前からやろうやろうと思っていた、UTF-8 への移行計画を実施し ました。これまで手元のテキストファイルの類はすべて EUC-JP で 保存していたのですが、これをUTF-8 にしようという計画です。Emacs の設定 まずはEmacs の設定です。これまで euc-jp となっていた部分をutf-8 に置き換えました。 (set-language-environment "Japanese") (set-terminal-coding-system 'utf-8) (set-keyboard-coding-system 'utf-8) (set-buffer-file-coding-system 'utf-8) (setq default-buffer-file-coding-system 'utf-8) 新規に作成したファイルの文字コードを UTF
.emacs に下記のように記述するとEmacs の文字コードがUTF-8 で使える。 (set-language-environment 'Japanese) (set-terminal-coding-system 'utf-8) (setq file-name-coding-system 'utf-8) (set-clipboard-coding-system 'utf-8) (setq default-buffer-file-coding-system 'utf-8) (setq coding-system-for-read 'mule-utf-8-unix) (prefer-coding-system 'utf-8) (set-default-coding-systems 'utf-8) (set-keyboard-coding-system 'utf-8) (set-buff
たつをさんのUTF-8の文字にマッチする正規表現を読んで、なるほどと思いつつ「ビットパターンから生成することもできるのでは?」と感じました。 そこでRubyで書いてみました。こんな風に。 rs = Array.new [ "0xxxxxxx", "110xxxxx 10xxxxxx", "1110xxxx 10xxxxxx 10xxxxxx", "11110xxx 10xxxxxx 10xxxxxx 10xxxxxx", "111110xx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx", "1111110x 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx 10xxxxxx", ].each do |ps| s = "" ps.split(/ /).each do |bs| min = sprintf("%02X", eval("0b" +
2006年03月11日13:07 カテゴリLightweight Languages一日一行野郎UTF-8 vs. ISO-10646 これだとLiberalなUTF-8ですね。 [を]UTF-8 の文字にマッチする正規表現UTF-8の文字にマッチする正規表現の素直版。 新旧、というのか、LiberalなUTF-8とStrictなUTF-8の違いは、RFC2044とRFC2279を見ればはっきりします。要はU+11000より上を認めるかどうかということです。今のところUnicode.orgの定義では、U+0000 - U+10FFFF しか認めていないので、そちらの定義に従うと、むしろこの正規表現はさらに短く $RE_UTF8CHAR_STRICT = qr/(?:[\x00-\x7f]|[\xC0-\xDF][\x80-\xBF]|[\xE0-\xEF][\x80-\xBF]{2}

PerlとUTF8についての自分用メモ 2005-09-29-1 [Programming] 自分用メモなので網羅性はないです。 utf8 - ソースコード内に、UTF-8(か、UTF-EBCDIC)を有効/無効にするた めのプラグマ <http://perldoc.jp/docs/perl/5.8.1/utf8.pod>Perl 5.8 以降においての Unicode 文字列の扱い方 : NDO::Weblog <http://naoya.dyndns.org/~naoya/mt/archives/000611.html>Perl 5.8.x における日本語コード変換のメモ <http://www.hikoboshi.org/perl/doc/encode.html>Perl 5.8.x Unicode関連 <http://www.pure.ne.jp/~lea
1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く