HOME > 電算 >Python と文字コードPython と文字コードPython で行き当たりばったりに日本語処理をしてきたが、これではいかんと思っていくらかまとめてみた。(当然、このメモには間違いや誤解があろうと思う) 「python は『abc』を使うのが基本で『あいう』を使うのが例外だ」と考えると、「あいう」に対してできないことが多すぎて難しく見える。しかし、「『あいう』に対して使えるようなやり方なら『abc』にも問題なく使えて、ただ、『abc』には特権的に無作法な書き方が許されているのだ」と考えれば、ずっと簡単に理解できるように思う。 まとめ ユニコードは「文字コード」(バイト表現と文字の対応関係)ではないutf-8 は「文字コード」であるPython の unicode 型は「文字コード」にとらわれない型で、CPU やメモリ上で用いられるPython の str
This document is for an old version ofPython that is no longer supported. You should upgrade and read thePython documentation for the current stable release. Unicode HOWTO¶ Release 1.03 This HOWTO discussesPython 2.x’s support for Unicode, and explains various problems that people commonly encounter when trying to work with Unicode. For thePython 3 version, see <https://docs.python.org/3/howto
Python の unicodedata モジュール Unicode のちょっとしたテキスト処理をしようと思い、Python の unicodedata モジュールを使ってみました。これは非常に便利です。 unicodedata はPython に標準で付属するため、別途のインストールは不要です。次のようなことができます。 文字の名前を取得する 文字の名前を取得することができます。Unicode の文字にはすべて一意の名前がつけられています。ソースコード内で Unicode のコードポイントを使うときは U+20AC (EURO SIGN) などとコメントをつけておくと便利でしょう。 >>> unicodedata.name(u'A') 'LATIN CAPITAL LETTER A' >>> unicodedata.name(u'あ') 'HIRAGANA LETTER A' 文字の
2006年11月26日02:45 カテゴリLightweight Languagesperl,python &ruby - ord() vs. Unicode というわけで、ord篇はこちら。 404Blog Not Found:perl,python &ruby - chr() vs. Unicode とりあえずchrが長くなったのでordは別entryということで。 文字から数値へ(ord) まずはPerlの例。 #!/usr/local/bin/perl use strict; use warnings; use utf8; binmode STDOUT, ':utf8'; sub say { print @_, "\n" }; say ord "\x{61}"; say ord "\x{3b1}"; say ord "\x{5F3E}"; say ord "\x{2A6
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く