Movatterモバイル変換


[0]ホーム

URL:


はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • Twitterでシェア
  • Facebookでシェア

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されますhttps://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

275usersがブックマークコメント24

    ガイドラインをご確認の上、良識あるコメントにご協力ください

    0/0
    入力したタグを追加

    現在プライベートモードです設定を変更する

    おすすめタグタグについて

      よく使うタグ

        Unicodeを斬りたい

        ガイドラインをご確認の上、良識あるコメントにご協力ください

        0/0
        入力したタグを追加

        現在プライベートモードです設定を変更する

        おすすめタグタグについて

          よく使うタグ

            はてなブックマーク

            はてなブックマークで
            関心をシェアしよう

            みんなの興味と感想が集まることで
            新しい発見や、深堀りがもっと楽しく

            ユーザー登録

            アカウントをお持ちの方はログインページ

            記事へのコメント24

            • 注目コメント
            • 新着コメント
            mandel59
            まずこの記事を斬るべきだろう

              その他
              deep_one
              後ろの方が相当おかしい。UTF-8で「文字コードが何種類もできてしまう」ことがあるのは「合字」とかの例であって、取りあげているのは「一文字あたりのバイト長が一定にならない」という問題の方。全く斬れてない。

                その他
                ockeghem
                あのー、些末な指摘で恐縮ですが、 char *bufp = original; while (bufp < original) { だと、ループには入らないのでは?

                  その他
                  houyhnhm
                  ナマクラな感じ。

                  その他
                  t-tanaka
                  浅い。これだと「が」が「か゛」の二文字になったりするぞ。NFC/NFDとかIVSとかって知ってます?

                  その他
                  kokorohamoe
                  UTF8にはサロゲートペアはありませんが異字体セレクタがあるので最大8バイト http://revilog.com/2014/04/10896.html

                    その他
                    naga_sawa
                    UTF-8はエンディアンの影響なしでは?/『byte順の影響がない』と言っているのに『どの2つのbyteを見てもビッグエンディアンなのか、リトルエンディアンなのかの順番の区別をつけることができます』って矛盾

                    その他
                    wasai
                    はてブのコメントを見てさらに勉強する

                    その他
                    totttte
                    “つまりUnicodeがUTF-8よりも上位の概念にあたるわけです。言ってみれば仕様と実装といったところでしょうか。”

                      その他
                      kasumani
                      Unicodeを斬りたい こんにちは。 Yahoo! JAPANで通知プラットフォームの開発をおこなっています佐々木海(@Lewuathe)と申します。 普段は全社向けのPush通知プラットフォームやメール配信プラットフォームの開発、保守をしてい

                        その他
                        UDONCHAN
                        有用情報

                          その他
                          takc923
                          斬るってそういう意味かよ!

                            その他
                            hidex7777
                            はてブ参照

                            その他
                            kat0usi
                            UTF8の文字境界を知りたければ0で始まっているか、1が2つ以上連続しているかをbyte毎に見てあげればいい

                            その他
                            shodai
                            雑学

                              その他
                              wasai
                              wasaiはてブのコメントを見てさらに勉強する

                              2014/04/17リンク

                              その他
                              enkunkun
                              あんまり納得できなかった

                                その他
                                tengo1985
                                黙って「プログラマのための文字コード技術入門」を読めばいい

                                  その他
                                  ockeghem
                                  ockeghemあのー、些末な指摘で恐縮ですが、 char *bufp = original; while (bufp < original) { だと、ループには入らないのでは?

                                    2014/04/17リンク

                                    その他
                                    ryonext
                                    わかりやすい記事でした

                                    その他
                                    bayaread
                                    こういう記事、いつも読んだ後「へぇ〜」ってなってからブコメを見てはてなの兄貴達の知識に脱帽する

                                      その他
                                      habarhaba
                                      斬ってるようには見えないんですが

                                        その他
                                        yrkhnshk
                                        確かにUnicodeとUncodeは似ている

                                          その他
                                          rryu
                                          合成文字必須のチベット文字に比べれば、ひとつの文字が複数のUnicodeスカラ値から構成されることを忘れられる日本語はまだ簡単な方だと思う。

                                          その他
                                          gerarad
                                          Yahooは会社としてこんなクソみたいな記事を公開してどうしたいんだ?

                                            その他
                                            y-kawaz
                                            あぁ、切るってそういうことか。そして浅い。

                                              その他
                                              houyhnhm
                                              houyhnhmナマクラな感じ。

                                              2014/04/16リンク

                                              その他
                                              t-tanaka
                                              t-tanaka浅い。これだと「が」が「か゛」の二文字になったりするぞ。NFC/NFDとかIVSとかって知ってます?

                                              2014/04/16リンク

                                              その他
                                              mandel59
                                              mandel59まずこの記事を斬るべきだろう

                                                2014/04/16リンク

                                                その他
                                                naga_sawa
                                                naga_sawa UTF-8はエンディアンの影響なしでは?/『byte順の影響がない』と言っているのに『どの2つのbyteを見てもビッグエンディアンなのか、リトルエンディアンなのかの順番の区別をつけることができます』って矛盾

                                                2014/04/16リンク

                                                その他
                                                deep_one
                                                deep_one後ろの方が相当おかしい。UTF-8で「文字コードが何種類もできてしまう」ことがあるのは「合字」とかの例であって、取りあげているのは「一文字あたりのバイト長が一定にならない」という問題の方。全く斬れてない。

                                                  2014/04/16リンク

                                                  その他
                                                  kokorohamoe
                                                  kokorohamoeUTF8にはサロゲートペアはありませんが異字体セレクタがあるので最大8バイト http://revilog.com/2014/04/10896.html

                                                    2014/04/16リンク

                                                    その他

                                                    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

                                                    リンクを埋め込む

                                                    以下のコードをコピーしてサイトに埋め込むことができます

                                                    プレビュー
                                                    アプリのスクリーンショット
                                                    いまの話題をアプリでチェック!
                                                    • バナー広告なし
                                                    • ミュート機能あり
                                                    • ダークモード搭載
                                                    アプリをダウンロード

                                                    関連記事

                                                      usersに達しました!

                                                      さんが1番目にブックマークした記事「Unicodeを斬りたい」が注目されています。

                                                      気持ちをシェアしよう

                                                      ツイートする

                                                      Unicodeを斬りたい

                                                      ※2014/4/17 記事の内容に関していくつか訂正させていただきました。 ご指摘いただいた皆様ありがとうご...※2014/4/17 記事の内容に関していくつか訂正させていただきました。 ご指摘いただいた皆様ありがとうございました。 誤字脱字を修正しました。 ソースコードの間違いを修正しました。 BOMの記述を分かりやすい表現に修正しました。 合字に関する記載を追記いたしました。 こんにちは。Yahoo! JAPANで通知プラットフォームの開発をおこなっています佐々木海(@Lewuathe)と申します。 普段は全社向けのPush通知プラットフォームやメール配信プラットフォームの開発、保守をしています。通知というのはPush通知にしろ、メール配信にしろ基的には「テキストデータ」を送ることになります。プラットフォーム内ではこれらのテキストに対してさまざまな処理をかけることになるのですが、さすが日語といったところでしょうか、一筋縄ではいかない部分が出てきました。具体的にはUTF-8でエンコーディング

                                                      ブックマークしたユーザー

                                                      • techtech05212023/11/14techtech0521
                                                      • kiryuanzu2019/02/03kiryuanzu
                                                      • ymm1x2018/02/20ymm1x
                                                      • taichi6962017/02/21taichi696
                                                      • challysen1982017/02/21challysen198
                                                      • dustytrombone2017/02/21dustytrombone
                                                      • toya2017/02/20toya
                                                      • shiba_yu362017/02/20shiba_yu36
                                                      • totttte2016/09/19totttte
                                                      • yatmsu2014/06/18yatmsu
                                                      • hidari-yori2014/06/10hidari-yori
                                                      • heatman2014/05/15heatman
                                                      • Yeshi2014/05/11Yeshi
                                                      • mwng2014/05/04mwng
                                                      • yamashiro01102014/04/27yamashiro0110
                                                      • flakwing2014/04/24flakwing
                                                      • sig2014/04/24sig
                                                      • khq2014/04/20khq
                                                      すべてのユーザーの
                                                      詳細を表示します

                                                      ブックマークしたすべてのユーザー

                                                      同じサイトの新着

                                                      同じサイトの新着をもっと読む

                                                      いま人気の記事

                                                      いま人気の記事をもっと読む

                                                      いま人気の記事 - テクノロジー

                                                      いま人気の記事 - テクノロジーをもっと読む

                                                      新着記事 - テクノロジー

                                                      新着記事 - テクノロジーをもっと読む

                                                      同時期にブックマークされた記事

                                                      いま人気の記事 - 企業メディア

                                                      企業メディアをもっと読む

                                                      はてなブックマーク

                                                      公式Twitter

                                                      はてなのサービス

                                                      • App Storeからダウンロード
                                                      • Google Playで手に入れよう
                                                      Copyright © 2005-2025Hatena. All Rights Reserved.
                                                      設定を変更しましたx

                                                      [8]ページ先頭

                                                      ©2009-2025 Movatter.jp