インターネットなどで公開されているテキストファイルの大半がUTF-8形式となり、いまではShift JISコードのテキストファイルは少数派になりつつある。しかし、つい最近まで、WindowsでUTF-8といえば、“Byte Order Mark”(BOM)付きが普通だった。BOM付きのUTF-8形式テキストは、ExcelなどMicrosoft製品では快調に読めるものの、エラーになるサードパーティ・アプリケーションや、Linuxなどで問題を起こすなど、使いやすいものではなかった。このため、Windows 7、8の頃は、テキストファイルとしては、まだ以前からのShift JISコードを使うユーザーも少なくなかった。当時、筆者も原稿のファイルは、Shift JISを使っていた。 メモ帳がBOMなしのUTF-8で保存できるようになったのは、2019年のWindows 10 Ver.1903からであ
数字を処理するコンピューター上で文字を扱うためには、文字コードと呼ばれるバイト表現が重要となります。かつては国や言語ごとにバラバラの文字コードを使っていましたが、記事作成時点ではUnicodeにほぼ統一されているといえます。そんなUnicodeへの統一には絵文字が大きな役割を果たしたと、ソフトウェア開発企業のIbexaでシニアデベロッパーアドボケイトを務めるJani Tarvainen氏が解説しています。Emojis paved the way forUTF-8 everywhere https://developers.ibexa.co/blog/emojis-paved-the-way-for-utf-8-everywhere Tarvainen氏の母語であるフィンランド語には、アルファベットに「Ä」などのウムラウトや「Å」などのリングといった記号を伴うことがあります。これらの記号
アクセシブルな投稿 1 年ほど前に X では画像の投稿時に、代替テキストをつけられる機能がリリースされました。この機能によって、音声読み上げソフトを使用するユーザーは、よりアクセシブルなコンテンツを享受できるようになりました。[1] では、投稿者は代替テキストをつければアクセシビリティの高いコンテンツを提供したと言えるのでしょうか。 アクセシビリティについて語る記事では、コーディングや、UI/UX の文脈で語られることが多いように感じます。しかし、SNS などユーザー投稿型サービスにおいても、各ユーザー一人ひとりが意識して取り組むべきものであると思っています。 画像 先述の通り、X では画像の投稿時に、代替テキストをつけられます。画像の投稿の際は代替テキストをつけることを心がけましょう。 X のヘルプセンターでは良い画像の説明を作成する方法が紹介されています。 また、代替テキストがない場合
ZWS uses zero width characters instead of the typicalalphanumeric ones that URL shorteners use. When rendered, these characters appear invisible, but they're still there, which means that ZWS is able to use them to encode information about your URL. Hi, I'm Jonah, thecreator of ZWS. I hacked together the first version of ZWS back in 2019, mostlyjust to see if the concept would actually work.It
ユニコードが使えるようになって、利用できる文字が増えた。その中には、普通の文字に非常によく似たものがある。文字の形は、フォント側で決めるため、どのような形で表示するのかは、フォント次第なのだが、そもそもの定義からして、普通の文字によく似たものとして、漢字の部首を表すものがある。 ユニコードは、機能や言語などに応じてブロックにわかれている。部首が含まれているブロックには、「CJK部首補助」ブロック(U+2E80~U+2EF3。115個)、「康煕部首」(U+2F00~U+2FD5。214個)がある。 たとえば、「人」(U+4EBA)という文字によく似た部首は「康煕部首」のU+2F08にある。これでGoogleのインターネット検索を行うと、762万件ほどWebページが見つかる(写真01)。「人」(U+4EBA)のほうでは、57億件(写真02)なので、部首の比率は0.13%とかなり少ないのだが、7
これらは、MS-DOS時代からのルールである。ある意味、「command.com」のルールだとも言える。これらの文字がファイル名やフォルダー名に使えなくなったのは、コマンドラインで特別な意味を持つからである。MS-DOSはもともとコマンドラインですべての操作をする。このとき、コマンドラインで特別な意味を持つ記号文字に関しては、ファイルやフォルダー名での利用を禁止してコマンドラインやファイル名、フォルダー名の判定を簡略化した。 これらが今でも特殊扱いされていて、ファイルやフォルダーの名前に使えなくなっている。ただし、このことはNTFSやvFATなどのファイルシステムとしての仕様とは部分的にしか関係がない。パス区切り文字としての「\」と「/」は共通だが、他の文字は絶対ファイル名やパス名に入れられないのかというと、実はそうではない。ただし、ファイル名のAPIでもある程度の安全対策がしてあり、渡さ
Windows 11では、標準アプリケーションのメモ帳がUWP版に切り替わった。このメモ帳、一見、Windows 10までのものと同じようだが、かなり違う。なお、従来のWin32版(デスクトップアプリ)のNotepad.exeも、C:\Windows\System32にそのまま残っている。ただし、UWP版メモ帳のアプリ実行エイリアスが有効になっているため、「設定 ⇒ アプリ ⇒ アプリの詳細設定 ⇒ アプリ実行エイリアス」(Windows 11 Ver.21H2では、アプリ ⇒ アプリと機能)で無効にしないと、エクスプローラーなどからは起動できない。アプリ実行エイリアスを無効にしても、スタートメニューに登録してあるアイコンからはUWP版メモ帳が起動するが、コマンドラインからのnotepad.exeの起動やエクスプローラーからのアイコンクリックではWin32版メモ帳が起動する。 一見してわか
Unicode Consortiumは9月13日、Unicode標準のバージョン 15.0が利用可能になったことを発表した。バージョン15.0では4,489文字が追加され、合計で14万9,186文字になった。 追加文字には20個の新しい絵文字と 4,193個のCJK(中国語、日本語、韓国語)の表意文字とともに、2つの新しいスクリプトが追加され、合計161個のスクリプトが含まれる。 新しいスクリプトには以下のようなものがある。 ナグ・ムンダリ:インドで使われる言語であるムンダリを書くために使用される現代の文字 カンナダ語文字:インドでコンカニ語、アワディ語、ハビャカ語カンナダ語を書くために使用される文字 カクトビック数字:イヌイット語とユピック語の数を表示するために、アラスカ州カクトビックのイヌピアク語話者によって考案された文字 また、20の新しい絵文字にはヘアピック、マラカス、クラゲ、カン
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く