Movatterモバイル変換


[0]ホーム

URL:


はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマーク
  • テクノロジー
  • Gitはどうやってテキストファイルとバイナリファイルを自動識別しているのか? - Qiita
  • Twitterでシェア
  • Facebookでシェア

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されますhttps://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

286usersがブックマークコメント31

    ガイドラインをご確認の上、良識あるコメントにご協力ください

    0/0
    入力したタグを追加

    現在プライベートモードです設定を変更する

    おすすめタグタグについて

      よく使うタグ

        Gitはどうやってテキストファイルとバイナリファイルを自動識別しているのか? - Qiita

        ガイドラインをご確認の上、良識あるコメントにご協力ください

        0/0
        入力したタグを追加

        現在プライベートモードです設定を変更する

        おすすめタグタグについて

          よく使うタグ

            はてなブックマーク

            はてなブックマークで
            関心をシェアしよう

            みんなの興味と感想が集まることで
            新しい発見や、深堀りがもっと楽しく

            ユーザー登録

            アカウントをお持ちの方はログインページ

            記事へのコメント31

            • 注目コメント
            • 新着コメント
            gabill
            文字コード判定なんかも「え、そんないい加減な仕組みで動いてたの?大丈夫なのそれ?」と驚く。大丈夫じゃないからよく文字化けするんだけれども。

              その他
              mapk0y
              curl 7.55 で追加された binary を画面出力しない設定の実装も同じだった。一方 file コマンドは各ファイルフォーマットの定義を持っていて、デフォが binary で各フォーマットに該当するかどうかで判定する

              その他
              yarumato
              “先頭8000バイト以内にNULが有ったらバイナリファイル判定。この手法はGNU diffの1992年の変更に由来する。NULが無いバイナリファイルを検出できない問題。UTF-16は。。”

                その他
                gfx
                へえ〜。話がGNU diffの1992年の変更まで遡るのは面白い。

                  その他
                  tmatsuu
                  良い

                    その他
                    a-know
                    おもしろい

                      その他
                      tune
                      シンプルな解決策でコードもわかりやすく素晴らしい

                      その他
                      koba789
                      ヒューリスティクスとしてはかなりイケてる部類ではなかろうか

                        その他
                        vcc
                        “先頭 8000 バイト以内に NUL が有ったらバイナリファイル”

                        その他
                        nattou_org
                        なんと

                          その他
                          gologius
                          “tl;dr”

                            その他
                            tohshindainokawaisa
                            おもしろい

                            その他
                            mohno
                            バイナリ/テキストの判定、あったなあ。「先頭 8000 バイト以内に NUL が有ったらバイナリファイル」←バイト数は忘れたが、実際、この程度で判定できてて驚いたものだ。

                            その他
                            codehex
                            人間が読む殆どのファイルはNULが含まれないでしょ!?って割り切ってコード書いてるの好き

                              その他
                              oktnzm
                              適度な妥協点かと。

                                その他
                                ardarim
                                文字コードとの戦いは永遠に終わらない…

                                その他
                                progrhyme
                                へぇ

                                  その他
                                  mirucons
                                  こんな単純だったのか

                                    その他
                                    gabill
                                    gabill文字コード判定なんかも「え、そんないい加減な仕組みで動いてたの?大丈夫なのそれ?」と驚く。大丈夫じゃないからよく文字化けするんだけれども。

                                      2019/03/31リンク

                                      その他
                                      deokisikun
                                      へー!!!!! そしてUTF-16はこんな所でも話題になるのかw

                                        その他
                                        topiyama
                                        先頭8000バイト以内に0があればバイナリ。/ファイルの判定はfileコマンドに外部委託しても良い気がする

                                          その他
                                          mapk0y
                                          mapk0ycurl 7.55 で追加された binary を画面出力しない設定の実装も同じだった。一方 file コマンドは各ファイルフォーマットの定義を持っていて、デフォが binary で各フォーマットに該当するかどうかで判定する

                                          2019/03/31リンク

                                          その他
                                          daichirata
                                          偶然にも最近全く同じこと調べた

                                            その他
                                            maguro1111
                                            楽しい。こういう記事もっと読みたい

                                              その他
                                              asuforcegt
                                              意外とシンプル

                                                その他
                                                Fushihara
                                                歴史あるなあ

                                                  その他
                                                  Lagenaria
                                                  面白い記事だ。printable判定は筋が悪いと感じるのでこの方法が良いかな。

                                                    その他
                                                    aki03
                                                    へぇ

                                                      その他
                                                      itotto
                                                      おもしろい

                                                      その他
                                                      jusuke
                                                      “tl;dr”

                                                        その他
                                                        yarumato
                                                        yarumato“先頭8000バイト以内にNULが有ったらバイナリファイル判定。この手法はGNU diffの1992年の変更に由来する。NULが無いバイナリファイルを検出できない問題。UTF-16は。。”

                                                          2019/03/30リンク

                                                          その他
                                                          gla69
                                                          へーーーー!!!!

                                                            その他
                                                            braitom
                                                            へー。“先頭 8000 バイト以内に NUL が有ったらバイナリファイル。”

                                                            その他
                                                            MonMonMon
                                                            単純だがなるへそ

                                                            その他

                                                            注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

                                                            リンクを埋め込む

                                                            以下のコードをコピーしてサイトに埋め込むことができます

                                                            プレビュー
                                                            アプリのスクリーンショット
                                                            いまの話題をアプリでチェック!
                                                            • バナー広告なし
                                                            • ミュート機能あり
                                                            • ダークモード搭載
                                                            アプリをダウンロード

                                                            関連記事

                                                              usersに達しました!

                                                              さんが1番目にブックマークした記事「Gitはどうやってテ...」が注目されています。

                                                              気持ちをシェアしよう

                                                              ツイートする

                                                              Gitはどうやってテキストファイルとバイナリファイルを自動識別しているのか? - Qiita

                                                              Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure y...Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article?

                                                              ブックマークしたユーザー

                                                              • techtech05212023/05/25techtech0521
                                                              • mkusaka2019/12/31mkusaka
                                                              • zsiarre2019/04/08zsiarre
                                                              • lugecy2019/04/07lugecy
                                                              • tmatsuu2019/04/07tmatsuu
                                                              • t_mori2019/04/05t_mori
                                                              • komlow2019/04/04komlow
                                                              • mjtai2019/04/03mjtai
                                                              • dnsystem2019/04/03dnsystem
                                                              • a-know2019/04/03a-know
                                                              • tune2019/04/02tune
                                                              • hayashih2019/04/02hayashih
                                                              • Clomie2019/04/02Clomie
                                                              • tackman2019/04/02tackman
                                                              • makopy_inside2019/04/02makopy_inside
                                                              • koba7892019/04/02koba789
                                                              • what_alnk2019/04/01what_alnk
                                                              • vcc2019/04/01vcc
                                                              すべてのユーザーの
                                                              詳細を表示します

                                                              ブックマークしたすべてのユーザー

                                                              同じサイトの新着

                                                              同じサイトの新着をもっと読む

                                                              いま人気の記事

                                                              いま人気の記事をもっと読む

                                                              いま人気の記事 - テクノロジー

                                                              いま人気の記事 - テクノロジーをもっと読む

                                                              新着記事 - テクノロジー

                                                              新着記事 - テクノロジーをもっと読む

                                                              同時期にブックマークされた記事

                                                              いま人気の記事 - 企業メディア

                                                              企業メディアをもっと読む

                                                              はてなブックマーク

                                                              公式Twitter

                                                              はてなのサービス

                                                              • App Storeからダウンロード
                                                              • Google Playで手に入れよう
                                                              Copyright © 2005-2025Hatena. All Rights Reserved.
                                                              設定を変更しましたx

                                                              [8]ページ先頭

                                                              ©2009-2025 Movatter.jp