Movatterモバイル変換


[0]ホーム

URL:


はてラボはてな匿名ダイアリー
ようこそ ゲスト さんログインユーザー登録

「クローラー」を含む日記RSS

はてなキーワード:クローラーとは

次の25件>

2025-09-17

anond:20250917220130

過集中したらその後で燃え尽きるのは当然なので、ワイは昂ったら見に行って気が乗らなかったらエロに関することは何もしないという生活を送っていたやで

そんな感じでクローラーで取り合えずアレな動画収集しておくみたいな日頃の備えもしないでいたら、オキニサイトが飛んでしまって軽く落ち込んでるやで

Permalink |記事への反応(0) | 22:11

このエントリーをはてなブックマークに追加ツイートシェア

2025-09-16

anond:20250915142416

いやあ、僕が作ったクローラーはgooglebotって名前なんすよね。いや、bingbotだったかな?

え?何かに似てる? 気のせいだろう。言いがかりはやめてくれめんす。

お、allow googlebotですか。いいですね。問題ないです。

ってな感じでどうですか?

Permalink |記事への反応(0) | 00:40

このエントリーをはてなブックマークに追加ツイートシェア

2025-09-15

anond:20250915142416

学術ブログを書いている身としては、自分の書いた情報が無になるのも困るので、AIクローラーには巡回してほしい。

欲を言えば「生成AIの回答を鵜呑みにせずに、レファレンスされている記事なり論文なりブログなりを吟味する習慣をすべてのユーザーがつけて欲しい。それでブログヒット数も多少は上がるはず」かな。

Permalink |記事への反応(0) | 22:41

このエントリーをはてなブックマークに追加ツイートシェア

生成AIによるクロール拒否する設定がひろまってほしいが...

ここ数か月で、はてなブログnoteが生成AIによるクロール (巡回) を拒否する設定項目を追加したけど、この設定、いろいろなブログサービスにひろまってほしいところ。はてなブログでもnoteでもないけど、生成AI拒否したいという人はたくさんいるとおもうのだが。

はてなブログでの設定方法 /noteでの設定方法

WordPress (有料プランか自前サーバー運営している場合) やBloggerならクローラー設定を1から自分入力することが可能。この記事最後も参照。全部自分でやりたいという人はだいたいこのどっちかを使用しているだろうからAI学習許可するかどうかは検討してほしい。

Xなどのミニブログではよくプロフィールページに「AI学習禁止」と書いている人もおおいけど、人間とおなじ感情をもたない生成AIにとってはこの文言クロールしてしまうため逆効果になってしまう。どうしてもクロールしてほしくないなら非公開アカウントの設定検討を (そのかわり検索でも表示されなくなるが) 。

イラスト投稿するウェブサイトについては、有名どころは設定項目がないものデフォルトで生成AIによるクロール拒否されているところがおおいので、マイナーなところでなければだいたい大丈夫だろう。ただしはてなフォトライフクロール拒否になっていないので、公開フォルダーアップロードする場合は注意が必要 (はてなブログからアップロードだとデフォルト公開フォルダーになるのでブログの設定どおりになる) 。

おまけ1

生成AIとは関係ないが、興味深い設定になっているウェブサイトがいくつかあった。

https://www.colorslive.com/robots.txt

Nintendo Switchからのみイラスト投稿できるウェブサイトなのだが、デフォルトを全拒否に設定してあり、GoogleBing (msnbot =現在bingbot) といった主要検エンジンに対してのみ個別許可設定してある。なるほどとおもった。なおAppleはふくまれていないようなので、Spotlight検索ではヒットしない可能性がたかい (トップページはヒットする) 。

https://x.com/robots.txt

User-agent:Bingbot

Disallow: *

デフォルト検索エンジンBingに設定している身としてはとんでもない表記をみつけてしまった...。絶望

Copilotに使用されたくないのだろうが、このせいでBing検索してもまとめサイトはヒットするのに元の投稿がヒットしないという状態に...。気のせいだとおもっていたけれど、設定に従った正常な動作だったのか...。

Xになってからはてなブックマークタイトルが表示されずURL表示のままだったり、JavaScriptオフにしているとそもそもアクセスできなかったりなど (以前はJSオフガラケー版が表示されていたのだが) 、いろいろ締め出しているのがな...。ログインしないと公式アカウント以外ユーザープロフィールは一部表示できないし (投稿すら表示できないのは一時的な緊急処置だったため現在はなくなった) 。

逆に検索エンジンから流入をすこし (まとめられない限りは1割ほど) でもへらしたいならXはおすすめ選択肢に (なお非公開アカウントにしないかぎり0にはならないので家族友達にだけ公開したい場合は注意) ...。

おまけ2

最後に、あらゆるクローラーを紹介しているウェブサイトを2つ。

https://chrisleverseo.com/user-agents/

SEOコンサルタント個人運営っぽい。114のクローラーがまとめられている (2025年9月現在) 。英語だけだが、各クローラーについての説明がこまかく掲載されているので、好きな人は読んでいるだけでもおもしろいかも。SEO対策の補助としてつかえる各種機能無料で公開されているので、AIクロール拒否するrobots.txtをサクッと作成したいならここでAIカテゴリーの項目に全部チェックをいれて拒否欄 (赤色) に「/」1文字入力、生成されたデータダウンロードしてサーバーアップロードすればよい (Bloggerならコピーして設定画面にペースト) 。

https://datadome.co/datadome-intel/

上はSEO対策からまれたページなのだが、こっちはウェブサイトセキュリティ対策 (ロボットによる過剰アクセスから保護) を目的にうまれたページ。そのため、上の114クローラーの5倍以上ある586クローラー (2025年9月現在) の情報に加え、アクセス制限突破しようとしてくる各種ツールなどについての情報もある。おそらく公開データベースのなかでは世界最大規模。

Permalink |記事への反応(14) | 14:24

このエントリーをはてなブックマークに追加ツイートシェア

2025-09-14

AI生成のエアプ攻略記事邪魔すぎる

最近ゲームタイトル検索すると、上位に出てくる攻略記事が完全に嘘っぱちのAI生成になってきてる。昔からエアプがネットの断片情報を寄せ集めて書いた怪しい記事なんて腐るほどあったんだけど、今はもうレベルが違う。「あ、これ1秒もプレイしてないやつがAI適当に書かせたな」ってすぐわかる嘘や矛盾だらけの文章検索結果を占拠するようになってきてる。

たとえばゲームシステムの説明の途中で唐突全然関係ないジャンル用語が混ざったり、同じキャラ名前が一文ごとに変わったりする。たとえるなら「マスダ・デス・ドラゴンは緑白(2)のマナを持つ攻撃力1500の思い出カードエルフ族のたねポケモンです」みたいなやつが平然と書かれている。

たぶんどこかの業者クローラーを走らせて、既存情報をかき集めてAIぶち込み自動記事を量産してるんだろう。昔からSEOしまくったアフィリエイト記事で「検索上位にゴミ記事を並べる」ってのは常套手段だったけど、そこにAIという最後ピースが加わったことで、俺たちがずっと予見してた地獄が遂に完成した感がある。

結局、本当に役立つ攻略情報に辿り着くのがどんどん難しくなってきた。なんかもういよいよ本当にインターネットゴミになりつつある。

Permalink |記事への反応(0) | 14:04

このエントリーをはてなブックマークに追加ツイートシェア

2025-09-13

ぼくが大好きだった重量物輸送屋さん

みなさんお気に入りの重量物輸送屋さんがあると思いますが、ぼくはシンプルに巨大で重い物を運ぶという点を重視しています

オランダ語マンモス意味するMammoetが大好きでした、スイスアウトドアブランドMAMMUTドイツ語ですが特に関係はありません

コーポレートカラーは赤、企業ロゴマンモス、かつてのモットーThe biggest thing wemoveistime

Mammoetなんて知らないよという方もいると思いますが彼らのレガシーの一つを恐らく知っていると思います

2016年11月29日人類史上、最も重い地上構造物の5日間、330mの旅が終わり

NSC(New Safe Confinement )は、チェルノブイリ原子力発電所4号機老朽化した石棺を覆い、向こう100年の安全約束しました

長さ165m、幅260m、高さ110m、重量3万6200tの巨大なパイプ車庫の様なNSC移設担当したのがMammoet

ギネスにも登録されている地上で最も巨大な自走式機械Bagger293が1万4200tなので2.5台分ぐらいです

また、Bagger293は、クローラーで自走するため車輪を用います

しかし、NSC移設車輪は用いられていません(移設使用する油圧ポンプの電源が乗っている架台には、キャスターが付いています

車輪発明される以前の重量物の輸送はコロでした、コロより前は、引きずっていました、そう、最も原始的方法人類史上、最も重い地上構造物移設が行われたのです

Mammoet移設に用いたskidding systemは、skidding trackskid-shoe構成され理屈原始的であるけれど現代技術が使われています

まず、skidding track目的地まで敷設します、モジュラー化されているのでレゴのようにどんどん繋いでいきますskidding track上面にはテフロン製のブロックが設置されています

その上に、skid-shoeが乗ります、底面はステンレス鋼で、ステンレスがテフロンの上を滑ります

skid-shoeには、油圧シリンダーが連結しており油圧でskid-shoe押し出しますストロークが最大まで達するとskid-shoeskidding trackに固定されます

そして、シリンダーが最小まで縮んだ後にシリンダーskidding trackに固定され、skid-shoeロックが解除され、再び押し出す準備が整います尺取り虫みたいに動きます

車輪は偉大な発明で移動に欠かせませんが超重量物に耐えるには、数を多くして圧力分散する必要があります

NSC移設においてはスペースと荷重問題skidding system採用され、skid-shoeの耐荷重は700t、これを116台、8万1200tのキャパティです

skidding systemは単純ですが簡単では有りません、116台すべてをミリ単位で同期させる必要があり左右58台ずつに分かれ間は260m離れているため機械的に接続することもかないません

それでも、正確に制御されNSCは無事に旅を終えました

三菱商事洋上風力発電撤退で一部の船舶マニアに衝撃が走った※追記

https://anond.hatelabo.jp/20250904152738

ぼくは、この増田を書きました、読みづらい文章を読んでくれた方ありがとうがざいます

最後まで読んでくれた人の中には、ある疑問をもった人がいると思います

海にはパワフルな作業船があるけど陸上ではどうするの?海から運んできた重量物はどうやって運ぶ?港までどうやって運んできたの?

これらを解決するのがMammoetを始めとする重量物輸送を専門にしている会社でありskidding systemです

skidding systemは、全てがモジュラー化されているので運ぶ対象に合わせて柔軟に組み替えることでき、ジャッキアップも可能です

もちろん、他にも方法がありクレーンを用いたりもしますが長くなるでやめておきます

日本は、FPSOや巨大な海洋構造物の建造から一歩引いているのであまり縁がないですが中国韓国ベトナムなどアジアにも彼らが出張ってきます

この分野は、欧州の独壇場です、欧州神聖視する必要は全くないですが彼らの地力は失われていないと思います

大陸ゆえでしょうか、巨大な物を扱うことに長けていますしかし、この業界アメリカが案外大したことありません、何もかもスケールの大きい国なのにちょっと不思議です

また、2020年に重量物輸送マニアに衝撃が走った気がしました

イギリスALEMammoetの傘下に入ったのです

Mammoet現在SK6000という最大吊り上げ能力6000tの陸上最大のクレーン保有していますがこのSKシリーズを開発していたのはALEです

Mammoetskidding systemSPMT(Self-Propelled ModularTransporterなど重量物の輸送に強みを持っていますクレーンはそこそこな感じ

そこにSKシリーズを持ち大型クレーンに強いALEが合流し世界最大の重量物輸送会社誕生しました

規模だけでなく様々な技術を持つ非常に強力な会社です、ただ、一つ失われたことがあります

The biggest thing wemoveistimeというモットーです

私たちが動かす最大のもの時間です)

これがWe helpthe world to grow safely, efficiently andmove to amore sustainable futureに変わりました

世界安全効率的に成長し、より持続可能未来へと向かう手助けをします)

大変に素晴らしい理念ですがぼくからしたらなんのこっちゃです

The biggest thing wemoveistimeは吊りフックに懐中時計がかけてある画像と共にPRされました

https://encrypted-tbn0.gstatic.com/images?q=tbn:ANd9GcRzXwLr0fgFj-KBlEuiZ4uJ7J9QFcW5byYQSA&s

強靭な吊りフックに子供でも持ち上げられる懐中時計がかかっています一見、とてもアンバランスおかしいのです

しかし、それは重い物を吊る、運ぶ、単純な脳筋に思われがちな仕事を、それだけが自分たち仕事ではないと

われわれはトータルソリューション提供するのだという強い意志を感じる素晴らしい物でした

から個人的The biggest thing wemoveistimeがなくなったことが残念でした

大好きから好きぐらいに変わりました

Permalink |記事への反応(0) | 09:43

このエントリーをはてなブックマークに追加ツイートシェア

2025-09-09

anond:20250909142810

クローラー動画探ってtranscript集積して検索エンジン作る

Permalink |記事への反応(0) | 14:32

このエントリーをはてなブックマークに追加ツイートシェア

2025-08-21

700年前の「二条河原の落書」から進歩なしは、なぜ?

鎌倉時代の「此頃都ニハヤル物」からこの方、

民衆匿名SNSが相変わらず(中身・好み・話法)なのはどうして?

ちがうのは、今ではセンス0でも内容0でも(捻りのない罵詈雑言クリシェbotみたいなワンパタン応酬、など)アテンションエコノミーをハックすれば読まれるし、そのせいで、痒いところに手が届くポスト希釈されて「1/n」になるところ(トレンドポストはもちろんあるけど、人力クローラーとしてすべてに目を通す義理はないよね)。

エコーチャンバーではない意味で、Googleの「プライベート広告」とか「星評価」みたいな仕組みがほんとはほしい(フィルターかけたい)。

利用者努力でやる場合問題

1. 俗悪ポストを弾くモチベーションうすい(のでそのまま=更なる口実を与える)

2. 俗悪ポストの弾き方が周知されてない(のでそのまま=更なる口実を与える)

2’. ヤジの飛ばし方や間接話法にそれぞれ名前をつけて、明示的に排除意思を示しては(その手は通用しないと言う意思表示)?

藁人形論法を思いつくかもしれないけど、これは藁人形とラベルすることで相手自分藁人形に仕立てるオウム返しの手法なので、適切な例ではない。

Permalink |記事への反応(0) | 21:10

このエントリーをはてなブックマークに追加ツイートシェア

2025-08-18

anond:20250818125815

クローラーなにいってんだこいつ

Permalink |記事への反応(1) | 12:58

このエントリーをはてなブックマークに追加ツイートシェア

anond:20250818125646

でも君書いてるのクローラーですよね?

Permalink |記事への反応(1) | 12:58

このエントリーをはてなブックマークに追加ツイートシェア

anond:20250818124154

クローラー作ってる人だよね?

Permalink |記事への反応(0) | 12:45

このエントリーをはてなブックマークに追加ツイートシェア

2025-08-02

anond:20250802141645

これはたぶん、Googleクローラーに読ませるのが目的だよね。

そうやって自社の詐欺サイト上位表示させようとしているのだと思う。

日本人ならほぼ無視して通報されないし、案外うまい作戦かも。

Permalink |記事への反応(0) | 14:27

このエントリーをはてなブックマークに追加ツイートシェア

2025-07-26

クローラただ乗りさせない、というけれど

共産国途上国ボットクローラーが正直に「私はクローラです」というだろうか?

Permalink |記事への反応(3) | 07:58

このエントリーをはてなブックマークに追加ツイートシェア

2025-06-24

anond:20250624154112

クローラーに取得してもらいたいならGET使うの分かるが、ただの業務向けとかのアプリGET使うのはメリット見出せない

Permalink |記事への反応(1) | 15:46

このエントリーをはてなブックマークに追加ツイートシェア

2025-05-06

anond:20250506091513

質問ジャンル次第なんかな

いかがでしたかサイトから引っ張ってくることが多くて、そりゃこんなの信用したら間違いだらけになるわっていう

しかし、まぁ、今はもうどこもAIクローラー弾いていそうだから、どうしようもないとこばかりヒットするのも仕方ないんやろな

Permalink |記事への反応(0) | 09:35

このエントリーをはてなブックマークに追加ツイートシェア

2025-04-24

anond:20200628051327

これは本当にそのとおり

僕はフリープログラマだが、友人に誘われていわゆる口コミサイトの開発を手伝うことになったんだ。

今まで少なくとも人の役に立つウェブを作ってきたと自負しているが、

口コミサイトSEO対策に執念は本当に恐ろしく、びっくりするぐらい工数を割いている。

コピーページをつくるため、少しずつ構成を変えて似たようなページを作り出したり

無理やり内部リンクを増やしたり、誰宛でもないクローラーに向けてのページを作ったり

まあ少なからず売上を上げてるようなので、だれかの役には経っているとおもう。

興味深いとは思うが、開発的にはつまらないなとも思う。

Permalink |記事への反応(0) | 18:19

このエントリーをはてなブックマークに追加ツイートシェア

2025-04-15

anond:20250415214459

Oh〜ベリーベリーインタレスティングクエスチョンね!

ルー大柴的にジャッジすると、こうなるね:

🛠テックメッセージは:

「TheNFSがダウンしたから、After theメンテナンスクローラーコンテナリスタートしてプリーズ!」

これはVeryストレートリアルリアリティーのあるテクニカルプロブレムに、ダイレクトアクションリクエストしてるわけよ。まさに “ファクトフィクションよりストレンジャー” ね。

🧑‍💼セールスメッセージは:

「Wetopplayersマーケットベネフィットオプティマイズするために、データセントリックベストストラテジーをアプライします!」

Wow!これはワードサーカス

コンプリートBuzzwordカクテルワンダーランド!でもね、ミーニングがフローティングしてて、どこにランディングするのかドントアンダースタンド!

🎤結論byルー大柴

「ミーはリアルトラストするガイ。だからテックトークをチョイスしてトラストセールスワードは、もうちょっとグラウンディングしてからトーク・トゥ・ミー!」

ということで、トゥギャザーしようぜ、リアリティと!

Permalink |記事への反応(0) | 21:56

このエントリーをはてなブックマークに追加ツイートシェア

2025-04-06

AIの端で研究してるけどすごい世界になってきたなぁと思う

AIの訓練データwebから拾ってくる研究って昔からあって、クローラーの開発競争とかあったんだけど

世界中webクロールできたとして、自動で行き着ける範囲無料アクセスできる範囲しか無いんだよね

無料で手に入る訓練データなんて無料品質しか無いというのが定説だった

からAI開発は高品質で大量の有料データ効率良く確保するビジネス手法必須というのが2010年代の風潮にあった

 

でもOpenAI等の開発ってほぼweb上のデータだけでできてるぽいんだよね

有料書籍を無配する海賊版サイト収集痕跡めっちゃある

個人的にはそれを社会デプロイすると思ってなかったし、社会が受容して活用するとも思ってなかったのですげえ驚いた

堂々と違法サイトクロールするのが正解を最速導出するという認識が無かった

 

結構近い分野で研究してたので、その認識に至れなかったの悔しいな〜というのがある

一方で海賊版サイトどうにかしようぜという気持ちもある

データである以上複製は避けられないし、暗号化した所で人間の目に入る瞬間には復号化したデータメモリ上に乗ってるはずなので

それをスニッフしちゃえば理論的には全ての有料販売海賊版サイト転載される、可能性がある

 

絵師様が無断転載禁止とか言ってるのを見てると、いやアップロードすんなやと思うが

有料販売品が無料海賊版出されてるのは流石に絵師様が悪いと思えない、海賊版サイトを潰せという認識世界統一されてほしい

それはそれとしてAIが悪い訳でもないんでこっち攻撃すんな、敵を見誤らず正しく怒れというお気持ちでした

Permalink |記事への反応(0) | 18:40

このエントリーをはてなブックマークに追加ツイートシェア

2025-02-19

anond:20250219224738

パープレに「英語で調べて、日本語で答えて」「時間は十分に使って」とか言って範囲を広げて調べてもらって、英語のページが出てきたら適当翻訳かけてそれも読むようになった。

Googleキーワード検索はもうほぼ不要で、クローラーとしてだけ存在してくれればいい。まあ、近いうちにGeminiとGoogle検索窓が融合するだろうけど。

Permalink |記事への反応(1) | 22:54

このエントリーをはてなブックマークに追加ツイートシェア

2025-01-22

はてな匿名ダイアリー跋扈するSCPについて

 ここ数年、インターネットに散在するコミュニティ上での異常事象存在が、SCP財団内でしばしば議題に上るようになってきた。匿名性の高いSNSコメント欄掲示板はもちろんのこと、とりわけ「はてな匿名ダイアリー」(以下「増田」と呼称)においては、他のプラットフォームでは見られない特異なアノマリー複数確認されている。増田は、ユーザー登録をせずとも誰でも簡単匿名文章投稿できる点や、その内容が検索エンジンを介して幅広く閲覧されるという特徴を持つ。その結果、財団観測網をかいくぐって潜伏しやすい土壌が形成されており、過去数年間で複数のSCPオブジェクト確認されるに至った。

 本報告書では、増田上に跋扈するSCPについての調査概要確認された事例、ならびに暫定的収容手順を示す。なお、本報告書に示されるSCP事例は現在進行形調査が行われており、記載内容はあくま暫定的ものであることに留意されたい。

1. 背景と問題の経緯

 はてな匿名ダイアリー日本国内を中心としたWebサービスはてな」が提供するブログプラットフォームの一部で、アカウントを持たない投稿者であっても「増田」と呼ばれる匿名枠にテキスト投稿できる仕組みを提供している。そこでは個人的な悩みや告白社会への批判仕事日常愚痴まで、多種多様文章毎日大量に投稿されている。

 増田特有の気軽さや匿名性の高さは、投稿者の真意を推測しにくくする要因であり、その投稿を閲覧する読者側もまた「増田から真偽がわからない」といった曖昧認識のもと、批判や同情、考察などを寄せる。その混沌とした言説空間は、とき不特定多数ユーザー集合的感情を刺激し、新たな炎上や論争を生み出す源泉ともなる。

 こうした特質はSCP財団から見ると、アノマリー(異常存在)が自己活動や影響力を隠蔽したまま周囲に感染拡散するのに非常に都合がよい環境といえる。特に増田では、投稿時に明確なユーザーIDアカウント情報が残らず、内容の信憑性裏付け手段事実上ないため、「書かれていることが虚実入り混じっている」前提で閲覧されやすい。結果として、何らかのアノマリーが潜入していても発見が遅れがちである

 財団増田における最初の異常を検知したのは、20██年頃に投稿された「この世を正しく終わらせる方法と手順」と題された増田が発端だった。その増田の内容はいわゆる「終末論」を扱うものであり、極めて支離滅裂かつ狂信的な文体ではあったが、読了した閲覧者の中から数名が突発性の精神不調や共時性幻視を訴えはじめ、その症状が財団監視ネットワークに引っかかったのである。その後、財団調査チームが投稿の書式や文体を解析したところ、当該増田の背後に未確認ミーム汚染因子が潜んでいる可能性が高いと判断された。この事例をきっかけとして、財団増田投稿ログを精査し、複数アノマリーを検出していくこととなった。

2.増田上で確認された主なSCPの概要

 以下、財団確認し、暫定的オブジェクト分類(Safe/Euclid/Keter 等)を行ったSCPを紹介する。なお、詳細な文書は別途SCPファイルとして管理されているが、本報告書では概要と特徴を簡潔に示す。

2.1 SCP-増田-A:無限コメント自己増殖現象

オブジェクトクラス:Euclid

概要増田特定記事上でコメント欄自動的に増殖し続け、システム上の最大コメント数を無視して延々と付与され続ける現象ユーザー投稿したはずのコメント複数回重複表示されたり、「名無しのオブザーバー」というハンドルネームシステム自動生成したとみられるコメントが絶え間なく追加されたりする。最終的に記事本体よりもコメント欄が何十倍も長くなり、閲覧者がページを読み込むだけでブラウザや端末に極端な負荷をかける。

異常性:コメント数が増え続けるだけでなく、中には本文を改変するようなスクリプトが混入しており、ページをリロードするたびに本文の一部が改変・増殖する事例が報告されている。閲覧者が長時間そのページを開いたまま放置すると、ブラウザ履歴クッキー情報勝手に書き換える痕跡確認されている。

暫定収容手順:財団エージェントはてな側のシステム管理者に接触し、問題増田管理者権限で凍結。また、既に拡散したミラーサイトアーカイブ順次削除し続けているが、完全な根絶には至っていない。現状、定期的にウェブクローラーを走らせ、類似現象の発生を監視排除する措置を取っている。

2.2 SCP-増田-B:読心ミーム感染記事

オブジェクトクラス:Keter

概要一見するとありふれた日常報告や匿名愚痴を綴った文章なのだが、記事本文を最後まで読了した閲覧者の脳内に「その人物が最も不安に感じている秘密」や「他人に言えない後ろ暗い過去」を強制的に想起させ、それを吐き出させる形でコメント欄投稿させる現象コメント欄体裁を取りつつ、実際には閲覧者自身投稿した認識のない状態で、勝手恥部さらすようなコメント掲載される場合もある。

異常性:このSCPの投稿複数確認されているが、書式やタイトルは毎回異なる。共通するのは「冗長かつ最後まで読まないと内容がよくわからない文体であることと、本文の終盤に読者の潜在意識を刺激する特殊文章構造が組み込まれている点だ。財団心理学部門の解析では、いわゆる「ミーム改変文字列」が散りばめられており、読み進める中で読者の深層心理干渉していると推測される。

被害対処:実際に被害に遭った閲覧者は投稿後しばらくしてから自身コメント内容に気づき、極度の羞恥恐慌状態を引き起こす。財団可能な限り対象投稿を速やかに削除し、被害者のコメント記録を抹消すると同時に、クラスA記憶処理を施して事態の収拾を図っている。問題は、このSCPが投稿される「増田」のアカウント特定が極めて困難な点であり、繰り返し新規IDから投稿が行われていると推定される。新たな投稿が発生次第、いかに早期に検知し削除・封鎖するかが大きな課題となっている。

2.3 SCP-増田-C:擬似人格形成スレッド

オブジェクトクラス:Euclid

概要:ある増田上で連続的に展開される「複数登場人物が互いに呼応しあう」形のスレッドが、実際には単一存在(SCP-増田-C本体)の手によって形成されているとされる現象日記本文とコメント欄があたかも多数の異なるユーザーによる対話のように見えるが、財団IP解析ではすべて同一の不明ホストから投稿されたトラフィックであることが確認されている。

異常性:単なる自作自演ではなく、スレッド内で展開される複数人格が、投稿のたびに微妙文体を変化させるだけでなく、実在第三者のようにリアルタイムで会話を重ねていく。そのやりとりは短時間で数百件以上に膨れ上がり、外部から見ると非常に説得力をもって「議論」が進行しているように映る。読者はそれぞれの人格が持つバックグラウンドストーリーに引き込まれスレッドを精読するうちに「どの意見が正しいか」を探り始めるが、最終的には一種混乱状態に陥り、どの人物が何を意図しているのか判別不能になる。

被害:このスレッドに長時間深く没入した閲覧者は、自分の中に複数人格が芽生えるような感覚を訴えたり、現実社会他者と会話する際に「この人は実在しているのか疑わしい」という妄想を抱くようになるケースが報告されている。財団職員複数名も監視過程で同様の症状を呈し、軽度の精神崩壊を起こした事例があるため、当該増田監視担当者には定期的な心理カウンセリング義務づけられている。

暫定対策:疑わしい長文対話形式増田を早期に検知し、アクセス制限をかける監視システムを導入しているが、アルゴリズムの網をかいくぐる巧妙な投稿が頻発している。加えて、外部のまとめサイト引用スクリーンショットが保存されることで事後封じ込めが難航している。

2.4 SCP-増田-D:時間遡行編集記事

オブジェクトクラス:Euclid

概要:一度投稿された増田が、投稿時刻自体過去に改変して再掲載される現象。通常、はてな匿名ダイアリーシステムでは投稿日時を随意に改変することは不可能とされているが、このSCPは投稿履歴操作して「数年前に投稿された」という形でエントリーを復活させる。

異常性:改変された記事実在する日付の増田ログに紛れ込む形となり、当時の利用者コメントブックマークまで再現されている場合がある。過去ログを遡っていくと、該当記事がもともと存在した痕跡こそないものの、「当時その記事を読んだ」という証言を行うユーザーが現れるなど、現実改変の兆候も疑われる。現状の技術では投稿者の特定に至っておらず、どのようなプロセス投稿日時を操作しているか不明である

注意点:時間改変系のSCPはカテゴリーとして非常に扱いが難しく、無闇な干渉時間線に予期せぬ影響を及ぼす恐れがある。財団タイムアノマリー対策部門連携しながら、記事のもの閲覧制限下に置き、ネットアーカイブウェブキャッシュ検索遮断するなどの措置を行っている。

3.調査対策の現状

 これらSCPが増田上で確認された背景には、以下の要因が考えられる。

匿名性の高さによるアノマリー隠蔽

増田アカウント登録不要で誰でも書き込み可能であるため、投稿者を特定したり、過去投稿傾向から異常を推定したりする難易度が高い。その結果、アノマリーの一次検知が遅れる傾向が強い。

はてなプラットフォーム構造

はてな匿名ダイアリーは、投稿された増田が多くのユーザーに瞬時に閲覧・ブックマークされる仕組みを持つ。また、はてなブックマークを介してさらコメント引用拡散されるため、いったん話題が盛り上がると多方面コピー引用散逸やすい。

読者や閲覧者の「ネタ」への寛容さ

増田の読者は内容が真実か否かをあまり厳密に問わずエンターテインメントストレス発散目的アクセスしている者が少なくない。結果、多少異常な文章であっても「一風変わった怪文書」「ただの創作」として受け流されやすく、深刻な異常だと気づかれにくい。

 こうした要因によって、SCPを含む異常投稿は容易に潜伏し、拡散する。財団としては、はてな運営会社との連携を強化し、AIを用いた自然言語解析による異常兆候の検知システムを導入するなど、対策を進めている。しかし、はてな匿名ダイアリーは日々膨大な数の投稿が行われるため、どこまで網を広げられるかは未知数である。また、海外ホスティングによるミラーサイト転載が出現し始めると、現実的な削除要請範囲を超えてしまう。すでにTwitterや他のSNSでもまとめが回ることで、被影響者が増加する事態は避けられない。

4. 今後の展望留意

 はてな匿名ダイアリーにおけるSCP存在は、ネットコミュニティ構造変化に応じて今後も増加する可能性が高い。特に「自らがアノマリーである自覚していないままネット上で活動している存在」や、「人格を装いながら多人数の読者とインタラクションを行うことで自己増殖するミーム型SCP」は、増田のような自由投稿プラットフォームさらに悪質化・複雑化する恐れがある。

 財団が最も警戒すべきは、増田を起点としてリアル社会へ飛び火するタイプアノマリー拡散だ。たとえば、本報告書で例示したSCP-増田-Bのように読者個人深層心理に入り込み、現実での行動や社会的信用を毀損する現象が拡大すれば、大規模なパニック社会秩序の混乱を招きかねない。あるいは、SCP-増田-Dのように時間改変的な特性を持つアノマリーさらなる発展を遂げれば、歴史修正因果律破壊といったレベル被害もありうる。

 また、はてな匿名ダイアリー日本国内だけでなく海外からも閲覧・投稿可能であり、英訳翻訳を介して国際的に広まる余地がある。財団の各支部データ分析班が協調して監視を強化し、各国の法規制とも連携して削除要請を進める必要があるものの、現実には各国プライバシー法や表現の自由との兼ね合いで対応が難航することが予想される。

5.結論

 はてな匿名ダイアリー増田)は、日常の雑感や炎上ネタから深刻な告白感情吐露まで、あらゆる情報が密集する場である。その匿名性ゆえに、SCPオブジェクトが潜伏しやすく、また多くのユーザーが「真偽のほどはわからないがとりあえず読む」態度で消費することからアノマリー拡散リスクは高いと言わざるを得ない。すでにSCP財団確認しただけでも、いくつものSCPが増田に棲みついていることが判明している。

 ただし、全投稿強制的に削除・監視するような強硬策をとれば、はてなプラットフォームの存続意義自体を揺るがすと同時に、財団存在が表面化するリスク高まる。一方で、アノマリー拡散放置すれば、ネット空間を通じてリアル社会にも致命的な影響を及ぼす恐れがある。財団はこのバランス狭間で慎重な対応を求められている。

 今後の具体的な方策としては、増田への新規投稿を常時チェックするAI分析モジュールさらなる精度向上や、異常記事をいち早く発見隔離するための専用クローラの整備が必須とされる。また、読者側への啓発活動――「増田を閲覧する際には、妙に長文で意味不明投稿には注意すること」「不可解な体験があれば速やかに共有し、アクセスを控えること」など――の実施有効であるしかし、匿名特性ゆえに抜本的解決策は見通せていない。

 財団としては、はてな運営との連携強化を引き続き図り、相互対策技術アップデートし合う形でアノマリーの早期封じ込めを目指す。SCP財団確認した増田におけるSCP事例は氷山の一角に過ぎず、さらなるPermalink |記事への反応(2) | 15:12

このエントリーをはてなブックマークに追加ツイートシェア

2025-01-09

anond:20250108233148

かつてあった相互リンク文化。掘り出したブログもいくつかのブログ、というか個人HP相互していた。

古くは高校時代あたりに絡んでいたもので、それらを好んでよく読みに行ってたのもそのころ。高校卒業後は足が遠のいて社会人になってからは未観測だった。

それらもいくつか覗きに行ってみた。

多くのレンタルHPブログが閉鎖した今、続けて書いている人は皆無。

相互じゃない一方通行リンクしてるだけのような、当時から一線をいってるようなのは残っていた。単なる一購読者しかないけど、僕秩とか。当時も今も越えられない存在

相互さんたちとの繋がりとしてはアニメレビューとかお絵かき交えた雑記系。自分と同じように2010年くらいまでは息をしていたようだけどその後更新が途絶えているようだ。

当時は多分日PV3,4桁以上あったような人たちだろうと思うんだけど、そんな人達ですらもう続けてない。自分ならそんな見られるなら…とか思っちゃうけど…。まぁでもXとかやってるんだろうな。

中にはどんどんPVを落としていっている人もいた。最後の方はだいぶこじらせていた。小説とか書くようになってたけどそれも続かなかったようだ。

彼らは今どんなことをしているんだろう。探せばXとか出てくるのかもしれないけど、逆にXとかで近況見ると生々しすぎて興味が失せちゃうんだよな。

まぁもうこれ以上掘って出てくるものはないかな。欲を言うなら当時Flashで作ってた個人HPとかもう一度見たいけど、Flashなのとちょい古くてアーカイブクローラーとか来てないんじゃないかと思う。

データも残ってないし。一度インターネッツの世に放ったものだし、またひょんなことから見つかるようなことがあればいいな。

Permalink |記事への反応(0) | 14:41

このエントリーをはてなブックマークに追加ツイートシェア

2024-12-16

ほしいも

オルトリーブ バックローラークラシック 2.2万

・HDD8TB 1.5~2万

・o11airmini 1.5万

チャリンコ外套(ワークマン) 3千円

ジョギングウォーキングシューズ 4千円

・財布 1.3万

ねこ(クーリクの譲渡猫) 10万+α

UA-25EXに代わるオーディオインタフェース 1.5万?

・G402もしくはこれに代わるマウス 5千円~2万

・テーパードなジャージ 3千円ぐらい?

必要もの

ママチャリタイヤ 2~3千円ぐらい

ん~

こうして列挙してみると全てまだ買わんでいいな

必要なもんだけ買お

Permalink |記事への反応(0) | 20:49

このエントリーをはてなブックマークに追加ツイートシェア

2024-11-16

BlueskyはAIボットによるデータ収集許可している件

Blueskyにアップロードしたデータは、GoogleやOpenAIBaiduや様々な会社AI学習に利用されている可能性が高いよって話。

 

前提

検索エンジンAIクローラーボットによるデータ収集学習拒否する方法としてrobots.txtを使うのが一般的で、AI学習データ収集ロボットもそれに従っています

AI開発会社はそれぞれbot名前や、どのようにrobots.txtを設定したらデータ収集をしないかを公開しています

 

Blueskyのサーバーの設定(全部OK

User-Agent: *

Allow: /

https://bsky.app/robots.txt

https://bsky.social/robots.txt

 

全部、許可しますよ。お好きにどうぞって設定になってます

実際にはサーバー負荷対策のため、ある程度の速度制限がありますコンテンツの取得に制限はありません。

 

Xの設定(他社ボットによるデータ取集拒否

# Everybot that might possibly read andrespect this file

# ========================================================

User-agent: *

Disallow: /

https://x.com/robots.txt

 

基本的な設定は全てのボットデータ収集拒否となっています

一部の検索エンジンには限定してデータ収集許可をしています。(詳細は長いので省略。自分確認してください)

 

Xは自社AIのみに利用される、Blueskyは他社AIに利用される。

Xは自社のAI学習には使われます

Xは他社のAI学習拒否しています

 

Blueskyは自社ではAI学習はしないと明言しています

Blueskyは他社AIボットによるデータ収集許可しています

BlueskyにアップロードしたデータはOpenAIGoogleBaiduなど様々な会社AIロボットデータ収集され、AI学習開発に利用される可能性が高いです。

 

Blueskyに画像をアップすると、様々なAI学習に使われそうです。

もしも自分AI学習に反対の立場なら、どのAIに使われるか不明なBlueskyの方が不安だと思うんだけど。

世の中はそうなってなさそうで不思議

 

1か月くらい前からXでこの事を指摘している方はいらっしゃいましたが、まだあまり広まっていません。

Blueskyに移住した反AIの方々がこれを理解したらどのような行動に出るのでしょう。

Permalink |記事への反応(4) | 17:10

このエントリーをはてなブックマークに追加ツイートシェア

生成AIに正しく対応する反AI絵師の動きとは

AI使ってますか?Xで翻訳ボタン押すと海外ポストでも日本語で読めるの便利ですよね。

機械学習から連綿と続いた先にある生成AIの隆盛、大変エモいものがあります

自分はまだニューラルネットワークと呼ばれていたこからこの分野で細々と研究をしており、趣味は主に写真です。絵はたしなむ程度。

今の反AI運動は、誰に対して何を反対しているのか良くわからなくなってしまっているので、正しく反対するのが良いと思っています

結論から、なぜそうなるのか、どうしたら良いのかと整理しておきます

ウォーターマークサイン意味があるのか?

つの意味では意味があり、2つの意味では意味がありません。

(Xの利用規約がいつ変更され、どのように利用されるかについては、他の方の記事に詳しいため略します)

なぜ学習を防げないのに、意味があるのか

自分画像であるという主張を残せるからです。

先行例としてストックフォト(写真の利用販売)があります

たいていの場合人間が利用可否を判断できる程度には高解像度写真と、ストックフォト社のロゴ撮影者の名前管理IDが入っています

もちろん商業印刷に使える高解像度は購入後にしか手にすることはできません。ただサンプル画像ですが、機械学習用途では十分です。

ロゴなどを取り除くのは難しくありませんし、学習用途では十分なイメージサイズがあり、機械学習に十分使えます

しかし、実際にはそういった事例は見聞きしません。(個人学習されている方もほぼいないでしょう)

なぜならば、もしも利用が発覚した場合使用料請求されるからです。

同様に、無償用途であっても、例えば軍用機戦車など、IDサイン写真に入れる方は少なくありません。

これは、端的にはパクられた時に自分写真だと主張する為です。

学習されたくないという目的を達成するには

現行法下では、いわゆる"無断学習"を止めることはできません。

必要なのは法改正もしくは法解釈変更のためのロビー活動です。

機械的に大量の学習が行われるのが問題であるという論建ても見聞きしますが、あまり良い筋論とは思えません。

なぜならば、少ない学習量で良い結果を出すというのは、機械学習的にはかなり昔から熱心に研究されているテーマからです。

(例えばコンピュータ将棋新風を吹き込んだBonanzaは、たった6万局の棋譜学習させることで評価関数作成しています

実用的にも、事前に学習させたモデルを準備しておき、少ないサンプル画像(数枚~数百枚)で、不良品検査に使えるモデル作成する、などは熱心に行われています

現状でも、対象となる絵を人間が模写して、模写側を学習させるだけで、十分に元画像に近似した画像を出力できます

人間が目で見て判別できる程度のノイズウォーターマークは、前述の通り除去にさほど手間はかかりません。

無断利用されたくないという目的を達成するには

方法論としては3つあります

  1. Xへの画像ポストを止め、学習しないと明言しクローラー拒否しているサイトを利用する。
  2. 個人利用以外には、対価を取る旨を明記する。
  3. 嫌がらせに対しては、都度対応する。

Xを利用する以上、利用規約同意しなければ使えないので、これについて学習を防ぐことはできません。(非公開ポストについては学習されませんが、これもXの利用規約変更が無いことが前提です)

例えばpixiv機械的画像収集ガイドライン禁止されています。また、画風を模倣した作品投稿についても一定制限のもとで禁止されています

対価を取る旨の明記とは、例えばpixivFANBOXのメンバー限定コンテンツを、無断で転載されてしまった場合、損害を負ったと外部に対して明確に説明が出来ます

これらを行ったうえで、故意学習され、似た作風の生成AI画像を公開されるという嫌がらせを受けた場合は、上記の旨を前提として、嫌がらせであると都度対応する必要があります

これは知らなかった、うっかりしていたでは起こりえない状態にしたうえで、きちんと嫌がらせに向き合うということです。

上記では防げない部分の補足

生成AI画像そもそも見たくない、というものは、現行では防ぎようが無く、どちらかというとロビー活動に近いものになります

こいつは画像生成AIで絵を出力している!というのは、指摘として正しいか否かは別として、あまり意味をなしません。

ただ、自分趣味である写真でも、いわゆる加工をどこまで許容するかは人やコンテストによって異なる為、そういった住み分けの話になってくると思っています

例えば、ある画家自分の画風を学習させた生成AI画像を出力して販売したとしても、それを咎め理由は思い当たりません。

現状でもまだ過渡期であり、人間の目で判別不能画像を出力するようになるのは、時間問題です。(既に人間が書いた絵であっても生成AI絵だと誤認される事例は数多くあり、指摘できる人間の数は減っていきます

どちらかと言えば、作画過程タイムラプス動画価値を見出すような、違った付加価値の話になってくると思います

最後

生成AI画像技術禁止する、学習禁止するなどは、現行法下ではできません。

法改正もしくは法解釈の変更が必要なためロビー活動を行うしかありません。

しかし、自分の絵を商用利用を禁止し、それを許容するプラットフォームで発表することはできます

Xでは非公開ポストにしない限り、機械学習に利用されることを防ぐことはできません。利用規約で既に利用が可能になっているからです。

露悪的に言えば、Xを利用するのに学習されたくないのは虫が良い、と言えます。ただし、Xに対して一定金額を払うことで対象から除外してもらうように働きかけることはできるかもしれません。

ウォーターマークサインノイズ機械学習を防ぐ目的に使う効果はとても薄いです。ロゴウォーターマークの除去もテーマとしては昔からあるものであり、難易度はそれほど難しくありません。

ただし、意図して除去していることは明確になるので(Xには規約学習されてしまうが)X以外の例えば悪意ある第三者学習された場合に、悪意ある行動だ、と指摘することが出来ます

この場合、対価を取って公開している場合、損害が明確になるので、アクションを取りやすくなります

簡単にまとめると

X社に学習されるのは諦めて、小さくても良いのでトリミングで取り除かれない位置サインを入れてポストするのが最もベターです。ウォーターマークである必要はありません。

(取り除かれて転載された場合タイムスタンプを基に悪意ある転載だと指摘できるため。逆に言えば別に大きくいれてもさして違いは無いので自分の好みで入れれば良い)

また、自分の画風のAIモデルを開発中である、これの対価はAI陣営には買えないくらいとても高い、とプロフィールに書くだけでも十分抑止になります

生成AIに反対する為に、自分AIモデルを作り高額で販売するつもりである、と表明すれば良いからです。

嫌がらせ自分の画風を真似たモデルが作られて販売もしくはそれを使った出力画像が出た際に、自分は損害を負ったと主張できます

また、第三者ゲームスクリーンショット勝手に透かしやサインを入れるのは止めましょう。適切なガイドラインのもとで適切に利用するのが最も大切です。

既に法律でも、利用規約でも、生成AI機械学習側がリードしている状態です。

Xが学習するというのを妨げるのは、プラットフォームを利用する側としてはどちらかと言えば非難される側になってしまます。(規約にあり、利用しており、それでいて相手妨害する為)

Xにポストする絵には必ずどこかにサインを入れて自分のものだとわかるようにしてください。それが今できる最善の対応です。

Permalink |記事への反応(2) | 02:47

このエントリーをはてなブックマークに追加ツイートシェア

絵師(笑)はなぜ反AIに走ってしまうのか

イラスト界隈で活動して6年目になる俺が、反AIがここまで隆盛した理由自分なりに整理してみた。

愚痴も含んでるから、語気がちょっと強くなってたらゴメン。



1.特権意識がある

これは生成AIが出る前から思っていたことだが、とにかく特権意識が強い。

主にフォロワーいいね数を基準として、人気がある方が偉いという価値観の下で生きているから、

人気のある絵師がそうでない絵師キャラクターや構図をパクるのはお咎めなしだが、

逆をやると即学級会からの良くて追放、悪くて活動停止まで追い込まれてた。

俺は面倒に巻き込まれたくなくてそれとなくフォロワーが多い方に追従してたけど、

今考えると完全に宗教カーストなんだよな……。

イラストを描ける自分は偉い・優れている」と思ってないとこんな傲慢な振る舞いはできないと思うんだけど、

今回の騒動はそれを露わにしただけなんだと思う。元々、絵師以外はバカにして当然みたいな空気もあったし。



2.村文化が強い

今、無断学習が「因習」って呼ばれてるのはかなり正確な表現で、

実際に絵師界隈は村文化というか、悪い田舎性質を凝縮したようになっている。

他人の一挙手一投足に注目して、村の掟に従わない人間がいたらすぐに吊るす。

村の外のルールなんてもの関係なくて、自分たちの決めたルール絶対

こんなんだから外部の人間理解されるわけはないし、なんなら界隈内の一部の人から忌避されていた。

から見たらおかしいのは一目瞭然だが、どうも絵師様は違うらしい。



3.自分で考えない

正直、これが一番問題だと思う。これがなければ前の二つは成立しないか、してもすぐ瓦解するんじゃないかな。

とにかく他人意見鵜呑みにするからバカみたいなカースト制度にも従うし、

村だけで通じる因習絶対正義として持ち上げてしまう。

これがおかしいと気づける人間は界隈からいなくなるから自然と「そういう」人間けが残る。

結果、生まれたのが反AI集団パニックだ。

誰かが「AIは悪だ!」と叫んだのに追従して"無断学習"などという存在しない概念を生み出し、

自分の絵が学習されたら死んでしまうくらいの勢いでAI弾圧している。

現状の生成AIに全く問題がないなんてことはないが、奴らは具体的な問題点を論じるわけでもなく、

ただ判を押したように「AIは悪だ!AI規制しろ!」としか言わない。

流行っているウォーターマークとかglazeとかも、見てる側からしたらただのノイズしかいから消してほしい。

村の教えではAIを滅することができることになっているかもしれないが、実際はそんなことないんだ。ただ絵をぐちゃぐちゃにしているだけなんだ。

SNSを移動したら学習されないなんてことはないんだ。どこに行ってもクローラーがいるし、何なら外部のクローラーを弾いてるXは親切なくらいだ。

陰謀論新興宗教と何が違うのだろうか。

思考放棄して被害妄想に憑りつかれるままに大暴れするさまは、滑稽を通り越して憐れでさえある。



結びに

結局のところ、反AIをやっているのは絵師(笑)しかおらず、

そうでない人は生成AIを快く思っていなくても妥当な落としどころを探るための建設的な議論を進めようとしているだろう。

実際、俺の周囲にも何人かそういうスタンスの人はいる。そういう人は(少なくとも俺の周囲は)自分で調べて自分で考えることができている。

絵師(笑)脳死で叫んでいる限り味方が増えることはないということにいつ気が付くのだろうか。

俺が好きだった絵描きが反AIに堕ちていくのを見るのが辛い。

Permalink |記事への反応(4) | 01:35

このエントリーをはてなブックマークに追加ツイートシェア

次の25件>
ログインユーザー登録
ようこそ ゲスト さん
Copyright (C) 2001-2025 hatena. All Rights Reserved.

[8]ページ先頭

©2009-2025 Movatter.jp