Movatterモバイル変換


[0]ホーム

URL:


BLOGTIMES

cles::blog

平常心是道
« :: »
2024/02/22

Google が AI によるファイル判別ツールをリリース

  google  cli  python 
このエントリーをはてなブックマークに追加

Google が AI によってファイルを判別するプログラムMagika*1*2を公開していました*3

通常、Linux で拡張子がない不明なファイルの詳細を知りたい場合には、ほとんどの人はfile*4 コマンドを使うことが多いと思います。ただし、ファイルがどのアプリケーションによって作成されたものなのかを判定するための一般的な方法はないため、file コマンドを使ったとしても内容が正しく判別されるとは限りません。file コマンドの場合には、ファイルの判定はファイルシステムテスト(ファイルが空か?特殊ファイルか?)、マジックナンバーテスト(ファイルの先頭にマジックナンバーが記載されているか?)、言語テスト(ファイルがテキストである場合には、どのような文字コードで書かれているか)の 3 つの判定が順に行われるとされています。つまり基本的にはヒューリスティックなルールを一定の順序で試してみて、該当するものがあるかどうかを判定していることになります。

これに対して、Magika は人間が作ったルールではなく、これをディープラーニングによるモデルで代替しようという試みです。

Googleが高精度かつ高速にファイル形式を判別するツール「Magika」公開 - PC Watch

Magikaはディープラーニングの力を活用し、平均精度99%以上を実現しつつ、1つのCPUで実行しても1秒間に120種類以上/数百万ファイルのファイル形式を判別できるツール。判別時間はわずか数ミリ秒で、モデル自体も比較的小さく、コアモデルは1MB未満だ。

インストールは pip で

イントールは Python 環境があればpip で一撃なので簡単に試してみることができます。

pip install magika

byhsur at 21:55[5年前][4年前][3年前][2年前][1年前] |
こんな記事もあります 「identification Magika GitHub
2024 年の人気エントリ Top 100
GitHub が全ての公開リポジトリへのシークレットスキャンを有効に
Celestica Seastone DX010 という 100GbE スイッチを手にいれた
ICANN がプライベートな TLD を .internal とすることに
Cloudflare が HAR File Sanitizer を OSS で公開
いにしえの MTOS を Docker で蘇らせる
Yubikey を SSH の公開鍵認証として使う
TeraTerm の背景色をお手軽に変更できる TTXCommandLineOptKai を TeraTerm5 対応に
教育用の穴だらけの Web アプリ「BadTodo」
JPCERT/CC が CWE-1003 日本語訳を公開
トラックバックについて
Trackback URL:
お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/14311
Trackbacks
このエントリにトラックバックはありません
Comments
愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
コメントはありません
Comments Form

コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。

OpenID を使ってログインすることができます。

Identity URL:Yahoo! JAPAN IDでログイン

« :: »
Copyright © 2004-2023 by CLES All Rights Reserved.
サイト内検索
検索ワードランキング
へぇが多いエントリ
閲覧数が多いエントリ
1 .アーロンチェアのポスチャーフィットを修理(99663)
2 .年次の人間ドックへ(99079)
3 .福岡銀がデマの投稿者への刑事告訴を検討中(99068)
4 .三菱鉛筆がラミーを買収(98678)
5 .2023 年分の確定申告完了!(1つめ)(98647)
最新のエントリ
cles::blogについて
誰が書いてる?
最近行った場所
サイトポリシー
タグ一覧
検索ワードランキング

Referrers

    Powered by CLES
    Nucleus CMS v3.31SP3/w memcached
    21375057(W:5682 Y:1545 T:0876)
    cles::blogのはてなブックマーク数
    benchmark


    [8]ページ先頭

    ©2009-2025 Movatter.jp