市区町村の基幹的な業務で使う文字の基準が2026年度をメドに統一される。今まで様々な氏名や住所の漢字に対応するため各自治体が独自ルールを定めており、デジタル化の障害になっていた。デジタル庁は国として策定した標準ルールの普及に力を入れる。政府は自治体システムの仕様統一を進めており、その前提として、基幹業務システムにおける共通化した文字ルールの適用を促す。アルファベットを使う欧米と異なり、日本語

2023.05.10 官報に使われる「官報文字」というものがあります。 そこには渡辺さんの「辺」の異体字が140文字も登録されています。 日本語の常用漢字には2136文字ありますが、そこには邉や邊などは入っていません。 そこでJISの第四水準までを含むJIS X 0213という標準を定め、スマホやパソコンではここまでを標準的に表示できるようにしています。 ところが我が国の戸籍で使ってもよいとされている文字はそれを遙かに超えていて、少なくとも55,270文字もあります。 全ての国民の氏名をコンピュータで扱えるようになることを目指して、戸籍統一文字や住基ネット用の統一文字を網羅した「文字情報基盤」を2011年に策定し、それにあわせたフォントを作成し、無償で提供しています。 この「文字情報基盤」(MJ)には、58,862文字が含まれています。 しかし、このMJを全庁的に採用している自治体は、川口

UnicodeのUTF-16エンコーディングではほとんどの文字(コードポイント)は2バイトで表現されるが、Unicodeに後から追加収録された文字の多くは4バイトで表現される。4バイト文字がうまく扱えないプログラムというのはわりとよくある。しかし世界中で広く使われるようになった絵文字がよりによって4バイト文字であるせいで、そのような文字が扱えない問題がよいペースで解決に向かいつつある。それについて少し説明してみようと思う。 Unicodeが80年代から90年代初頭にかけてデザインされたときの目標の一つは、Unicodeに含まれる文字数を65536個以内に収めることだった。現代の文章を実用的なレベルで表すためには、漢字などを含めてもそれだけの種類の文字があれば十分だと考えられたのだ。当然これは1文字を2バイトで表すことを念頭に置いていた。つまりコンピュータの揺籃期から当時に至るまで単純に英語

Explore and convert Unicode Download (Version 1.24, 4.6MB,Mac OS X 10.9 or later) Freeware Donate if you likeit. Exploration Unicode number and UTF encodings for each codepoint • Related codepoints and decomposition • Browsing by plane, codepoint number or characterblock • Unihan data such as definitions, variants, pronunciations and older encodings for many Asian codepoints • Finding code poin
この記事で作るもの:Unicode 6.0のすべての文字を1ページで (PDF, 23MB) ヨハネス・ベルガーハウゼン, シリ・ポアランガン『世界の文字と記号の大図鑑 ー Unicode 6.0の全グリフ』(研究社, 2014)の著者はUnicode 6.0の全109242文字を2時間30分かけて見るビデオの作者ですか。今度は1024ページの書籍。「Decodeunicode」で画像検索すると原著が出てきますが、楽しみですね。(追記:世界の文字と記号の大図鑑) 「Unicodeのすべての文字を印刷した本って、前にもなかったっけ?」と思って本棚を探したのですが、勘違いでした。 頭に浮かんだのはThe Unicode Consortium『The Unicode Standard, Version 5.0』(Addison-Wesley Professional, 2006)(文献リストあり

UFUNK tire sa révérence sous sa forme actuelle ! Depuis 10 ans, je partage chaque jour avec vous mes découvertes et mes coups de cœur, explorant le meilleur de la création contemporaine. Aujourd’hui ce format ne me convient plus, et je souhaite me lancer dans de nouveaux challenges, et consacrer montemps à de nouvelles expérimentations entre art et design. Je vous invite donc à découvrir mon trav

About iOS6から利用できるunicode6な絵文字のキャプチャ画像とUnicodeコードポイント,UTF8,UTF16での文字コードの対応表です。 文字の並びはiPhone/iPadの並びと揃えています。 画像が多いので、GithubPagesでは分割版のhtmlにしています。統合版のhtmlはmasterブランチに入っているので、必要な方はそちらをご利用ください。 JSON配列(ソート済み/UTF16)はこちら TODO(不具合) 一部の文字は黒い四角のような画像になっていますが、iOS6のフォントにしかないグリフのため、まだ準備中です。 一部の文字は名前はまだ無い、ですが後日入れます。 国旗と囲い文字がまだおかしな事になってますが、数日中に直します。。。(値としては合っているけど、合字と結合文字の扱いをうまく捌けてない) smiley No. image name Unicod
というわけで、随分前のことなんですが、絵文字を入力できるマッシュルームアプリを作りました!絵文字マッシュ -Google Play のAndroid アプリ https://play.google.com/store/apps/details?id=jp.mstssk.emoji_mush公開したのは2013年11月18日なんですが、サボってblog書いてませんでした。 ※以下、絵文字について知ってることをつらつら書いています。間違ってたら、Twitterかコメント欄でツッコんでください。 KitKatで絵文字を改めてサポートした2013年10月31日にリリースされたAndroid 4.4 KitKat にて、絵文字への対応が一新され、カラフルな絵文字がしっかり表示されるようになりました。Android - 4.4 KitKat http://www.android.com/ve

※2014/4/17 記事の内容に関していくつか訂正させていただきました。 ご指摘いただいた皆様ありがとうございました。 誤字脱字を修正しました。 ソースコードの間違いを修正しました。 BOMの記述を分かりやすい表現に修正しました。 合字に関する記載を追記いたしました。 こんにちは。Yahoo! JAPANで通知プラットフォームの開発をおこなっています佐々木海(@Lewuathe)と申します。 普段は全社向けのPush通知プラットフォームやメール配信プラットフォームの開発、保守をしています。通知というのはPush通知にしろ、メール配信にしろ基本的には「テキストデータ」を送ることになります。プラットフォーム内ではこれらのテキストに対してさまざまな処理をかけることになるのですが、さすが日本語といったところでしょうか、一筋縄ではいかない部分が出てきました。具体的にはUTF-8でエンコーディング

ごあいさつ 皆様はじめまして、文字コードおじさんです。細々とカメラ屋を営んでおりましたが、エンジニアとしての技量を評価され、ALBERTのシステム開発・コンサルティング部で働くことを許されました。特技はサーバーの統廃合です。 今回は最初ということですが、Unicodeにおける全角・半角の取り扱いについて触れてみようと思います。なお、さも連載するかのように第1話と銘打っていますが、上層部の無慈悲な裁決によっては1話打ち切りもありえますので、その際はご容赦ください。 固定観念を捨てよう 「全角50文字、半角100文字まで」といったような文言を見かけたことがあると思います。 特にUnicode以前のレガシーな処理系では全角文字に2バイト、それ以外は1バイトという割り当てが慣習となっていました。 このため、「全角=2バイト文字、半角=1バイト文字」という観念が世間に定着しているのが現状です。 しか

リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く