Movatterモバイル変換

daisukeeHTN id:daisukeeHTN

文字コードに関するdaisukeeHTNのブックマーク (27)

特殊文字（特殊記号）一覧表
これらの普段使用しない特殊な文字や記号は、MacBookの「文字ビューア」機能を使用することで表示させることができます。
daisukeeHTN2023/12/20
文字コード
リンク
矢印・特殊文字・記号一覧｜コピペ・標準フォントで使用可能 | 初代編集長ブログ―安田英久
daisukeeHTN2023/12/20
Web
文字コード
まとめ
リンク
全ての開発者が知っておくべきUnicodeについての最低限の知識
2003年には「プレーンテキストなんてものは全く存在しない」と言われ、テキストの解読には文字コードの情報が必須となっていました。しかし、2023年になるまでの20年の間に絵文字などのおかげでUnicodeの利用率は98％へと到達し、再び文字コードを気にせずにすむ時代がやってきています。そんな時代において、正しくUnicodeを使うために必要な知識をエンジニアのニキータ・プロコポフさんが解説しています。 The Absolute Minimum Every Software Developer Must Know About Unicode in2023 (Still No Excuses!) @ tonsky.me https://tonsky.me/blog/unicode/ Unicodeの歴史と利用率の推移をまとめたグラフは下図の通り。2000年代後半から急速に普及が進んでいったこ
daisukeeHTN2023/10/05
あとで読む
文字コード
リンク
皮肉記号 - Wikipedia
皮肉記号（ひにくきごう、英語: irony punctuation）とは、文章中で皮肉（irony）や嫌味（sarcasm）の意味合いを表現するために使用することが提案された各種の約物である。本項目では、約物以外の表現法も含めた、文章中で皮肉の意味合いを表現する各種の方法についても説明する。皮肉を表す文章には、疑問符(?)や感嘆符(!)のような、皮肉表現であることを示す標準的な方法がなく、いくつかの形式が提案されている。それらの中で、最も古く、最もよく使われるのは、1580年代にイギリスの印刷職人ヘンリー・デンハム（英語版）によって提案されたパーコンテーション・ポイント（percontation point）と、19世紀にベルギーの新聞出版者マルセリン・ジョバール（英語版）とフランスの詩人アルカンタ・デ・ブラーム（ポルトガル語版）によって使用されたアイロニー・マーク（irony mark
daisukeeHTN2023/05/28
言葉
文字コード
コミュニケーション
リンク
ChromeOS（Chromebook）でおすすめのテキストエディター4選
daisukeeHTN2023/05/25
google
PC
Chrome
ツール
文字コード
リンク
文字コード | 衆議院議員河野太郎公式サイト
2023.05.10 官報に使われる「官報文字」というものがあります。そこには渡辺さんの「辺」の異体字が１４０文字も登録されています。日本語の常用漢字には２１３６文字ありますが、そこには邉や邊などは入っていません。そこでＪＩＳの第四水準までを含むJIS X 0213という標準を定め、スマホやパソコンではここまでを標準的に表示できるようにしています。ところが我が国の戸籍で使ってもよいとされている文字はそれを遙かに超えていて、少なくとも５５，２７０文字もあります。全ての国民の氏名をコンピュータで扱えるようになることを目指して、戸籍統一文字や住基ネット用の統一文字を網羅した「文字情報基盤」を２０１１年に策定し、それにあわせたフォントを作成し、無償で提供しています。この「文字情報基盤」（ＭＪ）には、５８，８６２文字が含まれています。しかし、このＭＪを全庁的に採用している自治体は、川口
daisukeeHTN2023/05/11
PC
文字コード
リンク
Slackはハイライト部分をU+E000とU+E001で囲って表していそう - hogashi.*
Slack は、メッセージのどこからどこまでハイライトするかを、 Unicode の私用領域 *1の U+E000 と U+E001 を使って表しているらしく、こういうHTML を glitch とかで書いて、 <html> <head> <meta property="og:title" content="Slackでタイトルをハイライトする" /> <meta property="og:description" content="Slackで説明も好きな部分をハイライトする" /> </head> </html> そのページをSlack で展開させたりすることで、好きな部分を勝手にハイライトできて面白い *2 *3。ちなみに printf "\ue000寿司\ue001が光ったら成功"
daisukeeHTN2022/10/07
Slack
文字コード
リンク
𓁲 𓀀 𓀁 𓀂 𓀃 𓀄 𓀅 𓀆 𓀇 𓀈 𓀉 𓀊 𓀋 𓀌 𓀍 ..
𓁲 𓀀 𓀁 𓀂 𓀃 𓀄 𓀅 𓀆 𓀇 𓀈 𓀉 𓀊 𓀋 𓀌 𓀍 𓀎 𓀏 𓀐 𓀑 𓀒 𓀓 𓀔 𓀕 𓀖 𓀗 𓀘 𓀙 𓀚 𓀛 𓀜 𓀝 𓀞 𓀟 𓀠 𓀡 𓀢 𓀣 𓀤 𓀥 𓀦 𓀧 𓀨 𓀩 𓀪 𓀫 𓀬 𓀭 𓀮 𓀯 𓀰 𓀱 𓀲 𓀳 𓀴 𓀵 𓀶 𓀷 𓀸 𓀹 𓀺 𓀻 𓀼 𓀽 𓀾 𓀿 𓁀 𓁁 𓁂 𓁃 𓁄 𓁅 𓁆 𓁇 𓁈 𓁉 𓁊 𓁋 𓁌 𓁍 𓁎 𓁏 𓁐 𓁑 𓁒 𓁓 𓁔 𓁕 𓁖 𓁗 𓁘 𓁙 𓁚 𓁛 𓁜 𓁝 𓁞 𓁟 𓁠 𓁡 𓁢 𓁣 𓁤 𓁥 𓁦 𓁧 𓁨 𓁩 𓁪 𓁫 𓁬 𓁭 𓁮 𓁯 𓁰 𓁱 𓁳 𓁴 𓁵 𓁶 𓁷 𓁸 𓁹 𓁺 𓁻 𓁼 𓁽 𓁾 𓁿 𓂀 𓂁 𓂂 𓂃 𓂄
daisukeeHTN2022/08/04
コミュニケーション
素材
ツール
文字コード
リンク
“ヤギ=史上最高”“レモン=欠陥品”英語圏の絵文字には暗喩が隠されていて興味深い「ギャル文字みたい」何でその意味になったのかな？
こあたん🇦🇺こあらの学校 @KoalaEnglish180 同僚のオーストラリア人がよくヤギの絵文字🐐を送ってくるから「ヤギ好きなのかな、変わった人だな」と思ってたんだけど、英語圏では「Greatest of All Time(史上最高)」の頭文字をとってGoat(ヤギ)の絵文字が使われるんだって！調べてみたら他にも意外な意味で使われる絵文字がたくさんあって面白い！ pic.twitter.com/0AMBnJgJQt2022-05-06 18:22:16
daisukeeHTN2022/05/07
Twitter
言葉
文字コード
コミュニケーション
リンク
Unicodeに含まれる謎の記号「⍼」の起源を追ったレポートが公開中
大規模文字セットのUnicodeは世界中のあらゆる文字を収録することを目指して策定されており、「溶解する顔」や「妊娠中の人」といった個性的な絵文字も数多く登録されています。そんなUnicodeに登録されている正体不明の記号「⍼」について、ブリティッシュコロンビア大学でソフトウェアについて学んでいるジョナサン・チャン氏がまとめています。 U+237C ⍼ RIGHT ANGLE WITH DOWNWARDSZIGZAG ARROW · Jonathan Chan https://ionathan.ch/2022/04/09/angzarr.html 「⍼」は数学記号用のフォントなどに含まれている記号です。例えば、数式・化学式用フォント「Cambria Math」に含まれる「⍼」を拡大してみるとこんな感じ。カギカッコのような直角と稲妻形の矢印が組み合わさった日常生活では全く目にすることのない
daisukeeHTN2022/04/15
文字コード
読み物
リンク
Java 18正式リリース。デフォルトのCharsetが「UTF-8」に、シンプルWebサーバ搭載など新機能
Java 18正式リリース。デフォルトのCharsetが「UTF-8」に、シンプルWebサーバ搭載など新機能Javaの新バージョン「Java 18」が正式にリリースされました。Java 18 is now available! #Java18 #JDK18 #openjdk Download now: https://t.co/hTJU1ZzAWQ Releasenotes: https://t.co/Xdkj5TObNPAPI Javadoc: https://t.co/izFBPlYkd9 Features: https://t.co/3z0l5sXyDX pic.twitter.com/Ct1BvYmDYs —Java (@java) March 22,2022 Javaは6カ月ごとに「フィーチャーリリース」と呼ばれるバージョンアップが行われ、そのなかの1つのバージョンが
daisukeeHTN2022/03/23
Java
Web
文字コード
リンク
[Java] シフトJISの扱い - Qiita
目的Java における SJIS と MS932 の相違点と、扱う際の注意点をまとめます。 SJIS/MS932 での値を 0xHHHH 形式で表記していますが、１バイト目が上位、２バイト目が下位、つまり big endian (network byte order)です。いわゆるシフトJIS いわゆる「シフトJIS」には何種類もありますが、主なものは以下の２つだと思います。 SJIS (Shift_JIS)Microsoft が作成したシフトJIS符号化法を、JIS X 0208 に取り込んだもの。扱える文字集合は当時のJIS漢字(JIS X 0201/0208)の範囲のみ MS932 (Windows-31J)Microsoftは、日本語用の文字セットをコードページ932として管理しており、MS-DOS時代には各OEMベンダーでコードページの独自拡張を許可していた。しかしW
daisukeeHTN2022/02/24
Java
文字コード
リンク
本当は怖くないCP932 - Qiita
先に結論 CP932 は、Shift_JIS の独自実装符号化文字集合がいろいろ拡張されている拡張文字の有無で、Shift_JIS と判別可能 CP932ってなあに? 実はいろいろあるMicrosoftコードページ932 IBMコードページ932PC-9800仕様OEMコードページ932Windows-31J(MS932)Microsoftコードページ932Microsoftが、MS-DOS 用に作った Shift_JIS の実装 IBMコードページ932PC-9800仕様OEMコードページ932 IBM、NECが作った、Microsoftコードページ932 の拡張Windows-31J(MS932)Microsoftが互換性確保の為に、IBM、NECの拡張を吸収した、Windows 用の CP932 CP932 といったらほぼほぼこれを指す MS932 は、Java で
daisukeeHTN2022/02/24
Java
Windows
文字コード
リンク
ハイフンに似ている横棒を全て統一するᅳㅡ˗𐆑–᭸‒-─−▬𐄐—━‐‑ー﹣―ｰ﹘－⁃➖⁻！ - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
daisukeeHTN2021/11/03
文字コード
リンク
文字列を反転させたい｜nona
こんにちは。徒然なるままにTweetを眺めていたら、Tanakaさんがこのようなことを呟いていました。そういやRustのStringにreverseメソッドないなと思ったけど、まあよく考えたらUTF-8で文字逆転させるとか地獄のような話になるしそもそも長さが変わるケースとかあったりしそうで怖いわな･･･(´･_･`) — Hideyuki Tanaka (@tanakh) May 1, 2021 背景等はよくわからないですが、文字列の反転というのは確かに難しい問題ですし、どう難しいのかというのを、ちょっと真面目に考えて解説してみました。というノートです。本文での表記についてこれから文字とそのバイト表現の話をしていきます。文字のエンコードの方式で同じ数値でも色々意味が分かれてしまいますので、本文では以下のように表記することにします。 Unicodeコードポイント（以下、単にコードポイント
daisukeeHTN2021/05/03
文字コード
リンク
Unicode 版美乳テーブルを探せ
美乳テーブルとは「美乳テーブル」という物がある。「EUC-JP の文章を Shift_JIS だと誤認識されない様に、EUC-JP 固有のバイト値を文章先頭付近に埋め込んでおく」という物。具体的に、Shift_JIS には 0xFD と 0xFE が現れず、EUC-JP にはそれが現れるので、その値を含む文字コードを書いておこうという事で、その文字の集合に付いた名前。 “美” = 0xC8FE、“乳” = 0xC6FD。各文字エンコーディングの事情但し、これは EUC-JP での話。一応、文章の先頭付近に日本語の文字を書いておくのは、他の文字エンコーディングでも認識のヒントにはなるけど。逆に「Shift_JIS の文章を EUC-JP だと誤認識されない様にする」には、EUC-JP にはないバイト値の 0x80〜0xA0 を書けばいいんだろうけど、これは沢山ありそうだから、慎
daisukeeHTN2021/04/04
文字コード
リンク
「ASCIIをUTF-8にして」それが『できない』ことを理解してもらえなかった話 - Qiita
Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?
daisukeeHTN2021/04/03
文字コード
リンク
UTF-8のBOM付き・BOM無しの違いと確認方法 - ポップインサイト
文字コードの一種であるUnicodeにはBOM無しとBOM付きの2種類が存在します。BOMはバイトオーダーマーク（byte order mark）の略で、Unicodeで符号化したテキストの先頭に付与される数バイトのデータのことです。今回はUTF-8のBOM付き・BOM無しの違いと確認方法について紹介します。 BOM付き・BOM無しの違いについてプログラムがテキストデータを読み込む際に先頭の数バイトによりUnicodeのデータであることやどの種類の符号化形式を採用しているのかを判別しています。BOM付きのUTF-8であれば先頭の3バイトがBOMであり、＜0xEF 0xBB 0xBF＞というデータになります。Microsoft ExcelなどのアプリケーションによってはBOM付きでなければ符号化方式がUTF-8なのかUTF-16なのか、またはUTF-32なのか、あるいはまったく別の文字
daisukeeHTN2020/04/17
TeraPad、秀丸、メモ帳の仕様
仕事
Windows
ツール
文字コード
違い
リンク
BOMの地雷を踏み抜かない正しい文字コードとの接し方
こんばんは、寒暖の差が激しい日が続きますが、確実に春が近づいているのを感じているWebプログラマーの篠田です。以前にお話させて頂きました「Web制作で絶対に使ってはいけないエディタ！」で文字コードが重要というお話をしましたが、使ってはいけないエディタ以外でも油断していると罠に引っかかり、文字化けに苦しむというお話をご紹介したいと思います。テッパン文字コード「UTF-8」実はWebブラウザで日本語が取り扱える文字コードというのは４種類あります。簡単にご紹介していきましょう。創世記に活躍した過去の人「Shift-JIS」むかしむかし、iPhoneが存在していないWeb界隈でメジャーに使われていた日本語を取り扱える文字コードです。Microsoft製品の基本文字コードとして現在もExcelなどではよく見かけますが、最新のHTML5などで作られているWebページではまず見かけなくなっ
daisukeeHTN2020/04/17
"現在においてこの「BOM」を必要とする機会は殆ど無く、特に「UTF-8」においてはBOMがなくても動作するよう作られており、逆にBOMがあることで文字化けのリスクを負う"
Windows
Mac
Excel
文字コード
リンク
文字化けでよく出てくる漢字の意味を調べて愛でる
1992年三重生まれ、会社員。ゆるくまじめに過ごしています。ものすごく暇なときにへんな曲とへんなゲームを作ります。前の記事：無糖の飲みものに砂糖を入れる＞個人サイト＞ほりげー＞ライターwiki インターネットは文字化けと共にあるインターネットが普及して20年をゆうに超える。メール、添付ファイル、Webブラウザなど、様々な場面で我々は文字化けに苦しめられてきたし、今でもたまに苦しめられる。「文字が化ける」と書いて文字化け。そこにはお化けみたいで悪いイメージがあるが、それも仕方がない。読めないのだから。必要な情報が読めないのはシンプルに悪いことだ。DPZの記事を無理やり文字化けさせてみると、こうなる。でも、一方的に文字化けを避けていては、文字化けと仲良くなれない。文字が化けた先にあるのは文字だ。化ける前の文字ばかり愛していては、化けた後の文字がかわいそうではないか。我々は、化け
daisukeeHTN2020/03/26
Web
文字コード
読み物
リンク
12次のページ