Unicode のコードポイントを指定して文字を得たり、逆にある文字のコードポイントを調べたり、ということをする機会は結構多いと思います。 が、Ruby でそれをやる方法をぐぐってもあまり上位に情報が出てこないなー、と思ったので簡単にまとめておきます。 Unicode コードポイントとは そもそも Unicode コードポイントとは何か。 Unicode というのは世界中の文字が集められた文字集合であり、Unicode に収録されている文字には順番に番号が振られています。 この番号のことをコードポイントといいます。 あるコードポイントが指す文字を表現するときに "U+" という文字の後ろに 16 進数表記のコードポイントを書いて表すことがあります。 例えば、コードポイント 0x3041 が指す文字 (ひらがなの 「あ」) を U+3041 と書いて表します。 各文字とコードポイントの関係は
7 Unicodeを使用したプログラミング この章では、Oracleのデータベース・アクセス製品とUnicodeを併用する方法について説明します。この章の内容は、次のとおりです。 Unicodeを使用したプログラミングの概要 Unicodeを使用したSQLとPL/SQLのプログラミング Unicodeを使用したOCIプログラミング Unicodeを使用したPro*C/C++プログラミング Unicodeを使用したJDBCプログラミング Unicodeを使用したODBCとOLEDBのプログラミング Unicodeを使用したXMLプログラミング Unicodeを使用したプログラミングの概要Oracleには、Unicodeデータの挿入と取出しを行うためのデータベース・アクセス製品がいくつか用意されています。Oracleでは、JavaやC/C++などの一般的に使用されているプログラミング環境に
男の子の絵文字の下位1byteは0x41なので、ルール2の表の1番に該当します。0x41-0x40=0x01なので、起点から1番目の文字であることがわかりました。 3.Unicodeでのコードポイントを求める 「1」で求めたUnicodeの起点に「2」で求めた数字を足せば、Unicodeでのコードポイントを求めることが出来ます。 男の子の絵文字に関して、「1」の結果はU+E000、「2」の結果は0x01でした。U+E000+0x01=U+E001 ということで男の子の絵文字はUnicodeではU+E001であることがわかりました。 Shift_JISのSoftBank絵文字を変換するJAVAのソースコード Shift_JISのエンコードで渡されたSoftBank絵文字をUnicodeのコードポイントに変換するJAVAのソースコードを以下に記載します。JAVAでは、エンコーディング
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く