
はてなキーワード:検索エンジンとは
以下ChatGPT
自分のホームページ(自前ドメイン+自前HTML)を一度でも作って運用すると、SNS中心の“受け手”視点から、仕様・検索・配信・所有・継続の“作り手”視点に脳が切り替わる。結果、情報リテラシーは跳ね上がり、ネットのニュースや流行の見え方が根本から変わる——しかも想像以上に。
Before(作る前):Web=SNSのタイムライン。良し悪しは「バズってるか」「見やすいか」
After(作った後):Web=プロトコル+ブラウザ+HTML/CSS/JS+CDN+検索エンジン。
ページは**文書(Document)**であり、配置(IA)、意味づけ(セマンティクス)、配信(HTTP/HTTPS/HTTP/2/3)、キャッシュ戦略が気になりだす。
→ 同じ記事でも「タイトルの付け方」「hタグ構造」「画像最適化」「OGP」「サイトマップ」がまず目に入るようになる。
プラットフォーム依存の脆さを体感:規約変更やシャドウバンで露出が消える。
自サイトの資産化:ドメインに紐づくURLはリンクされ、検索に積み上がり、10年後も生きる。
POSSE(Publish (on your) Own Site, Syndicate Elsewhere):まず自分のサイトに出してから外部へ配信する習慣が身につく。
3. “好き/嫌い”から“なぜ速い・なぜ遅い”へ
CoreWeb Vitals(LCP/FID/CLS)や画像の遅延読み込み、フォント最適化の重要性が腹落ちする。
広告・計測タグの重さに過敏になる。読者体験を壊さないためのパフォーマンス予算という概念が生まれる。
キーワード選定は“流入ゲーム”ではなく読者の課題→コンテンツ設計に帰着。
内部リンク・パンくず・スキーマ(構造化データ)・サイトマップの意味が実務として理解できる。
“書けば伸びる”ではなく“検索意図を満たす設計が伸びる”に目が覚める。
alt、見出し階層、コントラスト比、キーボード操作、焦点管理など、見えない品質が最重要になる。
デザインは飾りではなく“読み・理解・操作”のためのユーティリティだと分かる。
たまたま当たる1記事より、更新の継続・アーカイブ性・RSSのほうが効くと実感。
コメント欄・メールフォーム・X連携よりも、ニュースレターやRSS購読者の質に価値を見出す。
ドメイン、DNS、証明書、バックアップ、法務(特商法・プライバシーポリシー)に“運用者の責任”が生まれる。
その重みが情報の信頼性を引き上げる(=他人のサイトの苦労も見えるようになる)。
トレンドは“輸入”ではなく選別になる。自分の歴史に合うものだけを採用して積層していける。
A. 最小HTML(雛形)
<meta charset="utf-8" />
<metaname="viewport" content="width=device-width,initial-scale=1" />
<title>あなたの名前 |ホーム</title>
<metaname="description" content="自分のホームページ。制作物・日記・メモを置いていきます。">
<link rel="alternate" type="application/rss+xml"title="RSS"href="/feed.xml">
<meta property="og:title" content="あなたの名前 |ホーム">
<meta property="og:description" content="自分のホームページ。制作物・日記・メモ。">
<meta property="og:type" content="website">
<nav>Home /About /Posts</nav>
<footer>© 2025あなたの名前</footer>
GitHubPages(Jekyll標準。Rubyベース、Node不要)
CloudflarePages(静的ファイルを置くだけで高速CDN)
レンタルサーバー(静的HTML+SFTP/rsyncで十分)
C.ドメインの基本
DNSはA/AAAA/CAA/TXT最低限、HTTPS必須(Let’s Encryptで無料化)。
D. “最低限の品質チェック”5点
ログを読む:SearchConsoleと簡易アクセスログで“本文よりメタ情報”を磨く。
アーカイブ主義:記事は追記で更新。URLは変えない。Versioningを意識。
それまで世間に知られていなかった若い男性(マイナースポーツのアスリートなど)がテレビで報道されたり、SNSで知名度を獲得すると、検索エンジンでの検索数が急上昇する。
ある程度検索数が上昇した男性の名前を検索バーに入力すると必ず身長がサジェストキーワードとしてあがる。
国内調査の結果、10代後半の女性、20代全般の女性、40代後半の女性は著名な若い男性を身長とともに検索する傾向が非常に強かった。
その後、その著名な男性の身長が高ければ高いほど、10代後半の女性、20代全般女性は同様の男性の出身地や経歴、私服などより深く調べるために追加の検索を行う傾向が強く、40代後半の女性はそれ以上その男性について検索をしない傾向が強かった。
一方、その著名な男性の身長が低いほど、40代後半の女性は同様の男性について追加の検索を行う傾向が強く、10代後半の女性、20代全般の女性はそれ以上の検索をしない傾向が強かった。
また、身長の低い男性について深い関心を示した40代後半の女性群に絞って「他にどのような事柄を検索したか」などの追加の調査を行った結果、その女性たちの殆どが「10代後半から20代前半の息子を持つ母親」であることが強く推測された。
今度は検索ワードから「10代後半から20代前半の娘を持つ母親」であることが推測される40代の女性群を調査したが、身長の低い男性について深い関心を示す傾向はなく、むしろ10代後半の女性、20代全般の女性と同様の傾向(身長の高い男性に関心を示す傾向)があることがわかった。
つまり「10代後半から20代前半の息子を持つ母親」には身長の低い男性に強い関心を持つ者が多かった。
また、10代後半女性、20代全般女性が身長の高い男性のライフスタイルや経歴、画像など本人そのものに強い関心を寄せるのに対し、身長の低い男性に関心を持つ40代後半の女性はその男性のパートナー(妻、彼女、結婚など)に関心を寄せる傾向が強かった。
今後はその背景について調査したい。
BERT出た時もそうだったけど、ほんと自然言語処理屋さんってPoCでできる範囲しか興味なくて、どうやってデータクローリングするかとか、きちんと成立するシステムに仕立てる気が無いよね?と思ってたけど、ほんとそんな感想しか言えない書き込みだよな。
結局検索エンジン無いと成り立たないのにそことの連携は考えない場合多いし、少しは考えてますって言ってもモックレベルだからスケールしようとしたら普通に市販検索エンジン導入した方が安いのな。性能差ほとんどないのに。
そら、AWSやAzure、GCPやらのクラウドサービスでLLM組み合わせれば十分なるわけだよ。
自社研究所の研究成果()含めPoC商法に付き合わされてきた立場からすると、スケールしない物を完成したと言うなよと文句言いたくなる。
前からいるが、最近「生成AIは所詮検索したものを出してるだけ」みたいなこと言うツイートが多く見えるようになった。
んだったら指が6本になったり足が3本になったりするわけねーだろ!!
それならまだコラージュって言ってる方がマシだ。
という推測である(なので、意図通りに出力させるには○○を詳しく細かく指定してやる必要がある)。
文章系の生成だとわかりやすい。「Aという単語の次にはBという単語が来るだろう」という予想を連鎖していくものだ。
(画像系は多数のフィルタを通していくようなものなのだが説明が長くなるので割愛する)
あと、仮に本当に検索なんだとしたら、検索エンジンのための複製は著作権法上適法であると2009年に定まっている。
生成AIを廃したい立場から考えたら「検索と同じこと」という主張は寧ろ不利なもののはずなので、ドヤ顔する前に主張の仕方を考え直したほうが良い。
でもいまだに「それ検索したら自分で解決できるで」って質問を毎日毎日打ち返す日々を送る社内SEワイ氏。
AIが多少コードを書けるようになったところで、ワイ氏が定年退職するまでにワイ氏の立場が奪われるとはとても思えん。
AIがコード書いてくれるようになったからコーダーは絶滅する!とかいう危機感を持てる奴は、それだけで社会全体においては割合がかなり少ない上位層だということを自覚した方がいい。
まぁ、ちょっとコード書けるだけで年収800万みたいな世界ではなくなるかもしれんが。てかそれはもう違うだろうし。
https://rextester.com/LQJV8936
https://glot.io/snippets/hbuw17vwhv
https://onlinegdb.com/52LU2Dvdy
https://codepen.io/tahu-acie/pen/XJXRZZd
AIのいいところは、
「バシレイオス2世“ブルガロクトノス”あたりの東ローマ皇帝の時代を深く知るための書籍を教えて下さい。」
という質問にサクッと答えてくれるところだと思う。
従来の検索エンジンでは、「サクッと」知ることが出来る場合もあるが、そうでない場合も多かった。
バシレイオス2世期は、マケドニア朝の全盛期にあたり、軍事・行政・文化の各面で東ローマ帝国が最高潮に達した時代です。
以下の書籍は、概要から専門的研究まで網羅的にカバーしており、学術的知見を深めるのに最適です。
ジョルジュ・オストロゴルスキー『ビザンツ帝国史』(新版・筑摩書房)
マケドニア朝期を概観しつつ、バシレイオス2世の事績を政治・社会・文化の文脈で捉える。
ジョン・ジュリアス・ノリッジ『ビザンツ帝国衰亡史』(上下巻・新潮社訳)
読み物としても優れ、バシレイオス2世の功績や後継皇帝との比較が平易に記述されている。
ウォーレン・トレッドゴールド『東ローマ帝国:マケドニア朝から第十字軍まで』(創元社)
軍事史を重視する著者が、バシレイオス2世の対ブルガリア戦争や軍制改革について詳細に分析。
ジョン・フレイザー・ハルドン『中世東ローマ帝国:文化と国家の変容』(勁草書房訳)
10世紀前後の社会構造・官僚制・経済システムを批判的に検討。バシレイオス2世期の行政改革や財政政策が、いかに帝国強化に寄与したかを学術論文レベルで理解できる。
平易な導入書ながら、バシレイオス2世の役割を文化的・宗教的視点から考察。
地下聖堂建築や修道院運営との関連も扱い、制度史だけでない広がりを示す。
アントニー・カルデリス『ビザンツ帝国:東ローマの再考』(明石書店訳)
バシレイオス2世に関する一次資料の読み替えや、新出の碑文・文書を紹介しており、先端研究動向を掴める。
ロバート・オーフィランディス編『東ローマ軍制史』(戎光祥出版訳)
バシレイオス2世のブルガリア遠征の戦術的展開や兵站を詳細に記述。図版多数。
北方異民族(ブルガリア、ルーシなど)との外交・戦争史を分析。
バシレイオス2世による“ブルガロクトノス(ブルガリア殺し)”の背景と結果を外交政策の観点で理解できる。
バシレイオス2世期の記述が豊富で、歴史叙述の特徴や史料批判の視点を学べる。
ハルドン、カルデリスなど最新研究を通じ、行政・文化的変容を理解。
『年代記』や編年史で原典に当たり、学術的厳密さを身につける。
これらを併読することで、バシレイオス2世期の帝国像を多角的に理解できます。
まずLLMが訓練目標として、次のトークンの確率を最大化するという統計的最適化を行っていることは理解しているんだと思う
ここすら分かって無い人は「AIは統計じゃ無くてなんか凄いことをしている」と言ってるに過ぎない
次にLLMは学習過程でトークンの特徴や抽象特性が自己組織化することに重きを置いていて
これらが「統計的に学習しているわけではない」と勘違いしているんだと思う
LLMはあくまで目標達成のために自己組織化していてその処理はやっぱり統計的なんだけれど
学習データに無くてもそこから一般化・抽象化できることについては学習できるので
まるで統計以上のものを学習しているように見えて「統計的じゃ無い」と思うんだろうな
と思うんだろうけど、全体として見てみるとこうした推論もあくまで統計的処理の範疇なんだけどね
とはいえ、「なんだただの統計処理か」って思ってる人もチラホラいて
まるで古い検索エンジンみたいにベクトル化して距離測定して近い答えを持ってきてる、みたいな考えの人もいるので
いびりょのイラストが作成された当初は特に話題になることはなかったが、2018年のなんJのスレッドである「なんJ 昼のニート無職部 part3」に書き込まれた以下の書き込みに画像が添付され、それが広がりの起点とされている。
******
301 風吹けば名無し 2018/07/19(木)17:11:15.64ID:0V7RAyaFa
就労移行支援で面白かったのは利用者の若い男が皆同じ顔をしてた事
ザ・陰キャって顔
覇気のない抜けた顔
(悪い意味で)童顔
10人いたら8人がそんな顔
https://i.imgur.com/akAJmjk.jpg
人間顔で分かるんやなって
*****
上記の書き込みに対して同スレッド内では自分に容姿が似ているなどといった書き込みが相次いだ。その後は、いわゆる無職スレ・発達障害スレにレスのコピペとともに画像が貼られるようになり、次第にまとめブログに取り上げられるようになる。後の2019年6月頃にはふたば☆ちゃんねる内で、女版やイケメン版などといったコラが大量に作成され、boketeなど外部サイトでも反応が見られるようになるなど一種の祭りのような盛り上がりを見せた。そして、コミケでもチー牛のコスプレをする人物が現れるまでに至った。
また、この影響でグーグル他各種検索エンジンで「チーズ牛丼」と画像検索すると、本来の食べ物としての牛丼ではなく、このイラストに関連した画像ばかりがヒットするようになってしまった。(Google画像検索)
なんJの一部では陰キャやコミュ障、発達障害者などの代名詞としてこの画像がしばしば取り上げられたが、下記の情報を参考にするとこの頃のネット上の反応ではさほど悪意が含まれておらず、作者の意図したような自虐ネタとして面白がっている層が大半で、現在のようなイラストに似ている人物を揶揄する状況になったのは2020年以降と見られている。
この文章は、はてな匿名ダイアリー(通称「増田」)での議論を通じて、現代の知識獲得における根本的な問題を浮き彫りにした興味深い思想的対話です。
ポール・グレアムの『ハッカーと画家』から始まり、道徳の相対性、プラグマティズム、アフォリズム、そしてAIツールへの依存といった複数の哲学的テーマが交錯しています。
最初の投稿者は、ポール・グレアムの『ハッカーと画家』の「第3章 口にできないこと」から着想を得て、道徳には流行があるという洞察を提示しています。
この章は、時代ごとのタブーや偏見について考察したもので、現在の「正義」も将来の人々から見れば時代錯誤に映る可能性があると指摘しています。
投稿者はこれを芥川龍之介の『侏儒の言葉』の「道徳は便宜の異名である」「道徳は常に古着である」という表現と結びつけ、道徳の相対性と実用性を論じています。
芥川のアフォリズムは、道徳が絶対的な善悪ではなく、社会の便宜のための「左側通行」のようなルールに過ぎないことを示唆しています。
ある参加者が「道徳は道具だからその仕組みと使い方に熟練しなければならない」というプラグマティズム的解釈を提示すると、
別の参加者がAIに相談し、「これはプラグマティズムよりもアフォリズムだ」という回答を得て反論を試みます。
プラグマティズムは真理を実用性や実践的効果で判定する19世紀アメリカの哲学思想であり、
一方でアフォリズムは短い言葉で本質を突く表現形式を指します。
この混同を契機に、議論はAIツールの使用方法と問題点に焦点が移ります。
批判者は、理解していない概念をAIに丸投げして反論した気になる行為を厳しく糾弾しています。
この批判は、現代の情報社会における重要な問題を指摘しています。
批判者は、「検索エンジンだけ手にしても情報評価能力やレファレンス能力がない人間は何もできない」と指摘し、AIツールについても同様の問題があると論じています。
AIは「面倒な作業を愚直に高速でこなす秘書」であって、「自分の分からないことを考えてくれる魔法の道具」ではないという区別を強調しています。
興味深いことに、擁護側は「検索エンジンやAIに頼ることが新しい道徳になっている」と反論し、
これによって議論の本題である「道徳の流行性」が現実的な問題として浮き彫りになります。
確かに、現代では知らないことをすぐに検索で調べることが当然視され、
それを「間違っている」とは考えない社会規範が成立しています。
この議論は、増田(はてな匿名ダイアリー)という匿名掲示板の文化的コンテクストでも理解する必要があります。
増田は「在りし日のインターネットの生き残りのような殺伐とした場所」として機能し、
他方では相手を「バカ」「死んだほうがいい」と罵倒する言説が共存している状況は、
最終的に、この議論が浮き彫りにするのは知的探求における姿勢の重要性です。
同時に、理解していない概念を使用することの危険性も明らかになります。
批判者が指摘する「情報を評価できない、レファレンス能力がない人間」の問題は、AIツールの普及により一層深刻化する可能性があります。
ツールの利便性に依存することで、批判的思考や概念理解の能力が低下するリスクがあるからです。
AIや検索エンジンへの依存が「新しい道徳」となる一方で、従来の知的労働や深い理解を重視する価値観との間に摩擦が生じています。
どちらが「正しい」かを判定する絶対的基準は存在せず、時代の変化とともに価値観も変化していくという、まさに最初の問題提起が現実化している状況です。
ある章が特に技術的な内容じゃなかったんだけど、結構印象残ったからメモ
要約するとこんな感じの話。
その時代に流行ってる道徳って、みんな絶対的な「善」だと勘違いしがち。
でも、昔の人が本気で信じてたこと、例えば天動説を今の自分らが見ると馬鹿馬鹿しいって思うみたいに、今の俺らが信じてる「正義」も、後世の人達から見たら「あの時代の人たち本気でこんなこと信じてたの?アホやん」って思われる可能性が高い。(後略)
https://anond.hatelabo.jp/20250923220146
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
真理は不朽のもので、それゆえにより簡潔で明快な形で既に語られているものだ
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
そこに書かれてるのは道徳は道具なのでその仕組みと使い方に熟練しなきゃねというプラグマティズムだ。それを「不朽の真理」とか言い出す時点でなんもわかってないw
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
そうなの?AIは、これはプラグマティズムというよりかはアフォリズムだよ、と言ってる。それが正解なら真理という言い方は全然間違ってないよね
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
何言われてるかもわからんのにAIに泣きついてなんか反論した気になるとか
バカの底が抜けてんだろw
「プラグマティズムよりアフォリズム」って何だ?それらが二律背反の何かだと思ってるのか?
「何だ?」と質したところでAIがたまたま吐き出したフレーズでしかないという…
「アフォリズムだから真理だ〜」とかいうのはバカがじぶんでかんがえたのか?なんだそりゃ?バカすぎだろ。マジで死んだほうがいいわコイツ
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
いやそうではないだろう。
自分が知らないことでも、今の人達は検索エンジンを頼りにして答えるし、それをことさらに間違っているとは考えない。
君のように、話のテーマと実際の会話をシンクロさせることが出来ない人のほうが知性を感じないよ。
無理をしているのは君なのでは?
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
そうなんよなあ。
質問サイトにはおまえみたいななーんも知らん寂しいオッサンが張り付いて
新着質問にググって出たことを片っ端から「回答」してしまうもんだから
情報を評価できない、レファレンス能力がない人間が検索エンジンだけ手にしても何も出来ないのに、バカ過ぎて「調べればなんでも分かるんだ」という全能感を持ってしまった。
で、AIだ。
生成AIは面倒臭すぎる作業を言いつけるがままに愚直かつ超スピードでこなしてくれる秘書なんだけど、バカはじぶんのわからないことを考えてもらえる、正しい判断をしてもらえるまほうの道具だと思ってしまう。
バカに便利すぎる道具を与えても使いこなせないし、間違った万能感を持ってしまう。
ほんと死んだほうがいいよ。
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
なんにしろ君みたいな論破バカには、あんまり時間を使わないことにしてる。
それが僕のプラグマティズムだ。
AIの解説をもとにして書いてるだけだから、プラグマティズムとアフォリズムの言葉の使い方が間違っていたら、ご容赦を。
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
「なんかAIさまがそんな感じのこと言ってただけなんで、オデはなんにもわからないんで」
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
うん、それは、まあ、いわゆる、ブーメラン。 では。
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
何がどうブーメランなんだよ糞げエジw お前にはくやしがる資格すら無ぇんだよw
〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜〜
馬鹿いじりの記録は自分にとって情報価値はないのでレスバの類はほぼ無条件に日々の“整理”の対象である(積極的に削除しないと自分のエントリを見返すのが事実上不可能になり、考えたことメモとしての機能を失う)のだが、コレはAIと馬鹿の不幸な関係のサンプルとしてわかりやすいので、なるべくじゃまにならないようまとめておく
もしかして「共感性羞恥心」って意味がわからなくて検索したらそれが最初にでちゃった?
あるいはAIがそう答えた?
検索エンジンやAIがあなたにどれだけパーソナライズしてくれているかがわかるから。
お大事にね
ここ数か月で、はてなブログやnoteが生成AIによるクロール (巡回) を拒否する設定項目を追加したけど、この設定、いろいろなブログサービスにひろまってほしいところ。はてなブログでもnoteでもないけど、生成AIは拒否したいという人はたくさんいるとおもうのだが。
※WordPress (有料プランか自前サーバーで運営している場合) やBloggerならクローラー設定を1から自分で入力することが可能。この記事の最後も参照。全部自分でやりたいという人はだいたいこのどっちかを使用しているだろうから、AI学習を許可するかどうかは検討してほしい。
Xなどのミニブログではよくプロフィールページに「AI学習禁止」と書いている人もおおいけど、人間とおなじ感情をもたない生成AIにとってはこの文言をクロールしてしまうため逆効果になってしまう。どうしてもクロールしてほしくないなら非公開アカウントの設定検討を (そのかわり検索でも表示されなくなるが) 。
イラストを投稿するウェブサイトについては、有名どころは設定項目がないもののデフォルトで生成AIによるクロールが拒否されているところがおおいので、マイナーなところでなければだいたい大丈夫だろう。ただしはてなフォトライフはクロール拒否になっていないので、公開フォルダーにアップロードする場合は注意が必要 (はてなブログからのアップロードだとデフォルトが非公開フォルダーになるのでブログの設定どおりになる) 。
生成AIとは関係ないが、興味深い設定になっているウェブサイトがいくつかあった。
https://www.colorslive.com/robots.txt
Nintendo Switchからのみイラストを投稿できるウェブサイトなのだが、デフォルトを全拒否に設定してあり、GoogleやBing (msnbot =現在のbingbot) といった主要検索エンジンに対してのみ個別に許可設定してある。なるほどとおもった。なおAppleはふくまれていないようなので、Spotlight検索ではヒットしない可能性がたかい (トップページはヒットする) 。
Disallow: *
デフォルトの検索エンジンをBingに設定している身としてはとんでもない表記をみつけてしまった...。絶望。
Copilotに使用されたくないのだろうが、このせいでBingで検索してもまとめサイトはヒットするのに元の投稿がヒットしないという状態に...。気のせいだとおもっていたけれど、設定に従った正常な動作だったのか...。
Xになってから、はてなブックマークでタイトルが表示されずURL表示のままだったり、JavaScriptをオフにしているとそもそもアクセスできなかったりなど (以前はJSオフでガラケー版が表示されていたのだが) 、いろいろ締め出しているのがな...。ログインしないと公式アカウント以外ユーザーのプロフィールは一部表示できないし (投稿すら表示できないのは一時的な緊急処置だったため現在はなくなった) 。
逆に検索エンジンからの流入をすこし (まとめられない限りは1割ほど) でもへらしたいならXはおすすめの選択肢に (なお非公開アカウントにしないかぎり0にはならないので家族や友達にだけ公開したい場合は注意) ...。
最後に、あらゆるクローラーを紹介しているウェブサイトを2つ。
https://chrisleverseo.com/user-agents/
SEOコンサルタントの個人運営っぽい。114のクローラーがまとめられている (2025年9月現在) 。英語だけだが、各クローラーについての説明がこまかく掲載されているので、好きな人は読んでいるだけでもおもしろいかも。SEO対策の補助としてつかえる各種機能も無料で公開されているので、AIクロールを拒否するrobots.txtをサクッと作成したいならここでAIカテゴリーの項目に全部チェックをいれて拒否欄 (赤色) に「/」1文字を入力、生成されたデータをダウンロードしてサーバーにアップロードすればよい (Bloggerならコピーして設定画面にペースト) 。
https://datadome.co/datadome-intel/
上はSEO対策からうまれたページなのだが、こっちはウェブサイトのセキュリティ対策 (ロボットによる過剰アクセスからの保護) を目的にうまれたページ。そのため、上の114クローラーの5倍以上ある586クローラー (2025年9月現在) の情報に加え、アクセス制限を突破しようとしてくる各種ツールなどについての情報もある。おそらく公開データベースのなかでは世界最大規模。
Permalink |記事への反応(14) | 14:24
偽物騒動で高血圧管理・治療ガイドライン2025が出ている事を知って買おうとしたんだが、電子版がプロテクトありの電子書籍しかない。
プロテクト無しのPDF販売も選べる医療専門書用の電子書籍サイトでもプロテクト版しか販売してない。
仕方が無く印刷書籍を購入し、裁断して取り込み、現在OCR処理をかけているところ。
なんでこんなことをしたかというと、プロテクトされている電子書籍は、AIに喰わせることができないからだ。
例えば、NotebookLMなどに入れて活用する事ができない。
また、AI等がなくても、コピーアンドペーストができないし、検索もまともにできないケースがある。
AIが登場して、電子書籍におけるプロテクトのありなしの違い、プロテクト・DRMがない電子書籍の価値が俺の中で爆上げしている。
ちょと前であれば、電子書籍があるだけで御の字だったといえばそうなんだが、医療系ガイドラインをAIに喰わせて、自分の検査情報やら服薬情報やら、そういった物を喰わせると出てくる、とかそう言った活用が現実的になってるんだよな。
あと、Notebook LMやChatGPTプロジェクトなどで喰わせておくと、ページのソースも出してくれるから、めっちゃ賢い検索エンジン的に使用できる。
医療系ガイドラインはプロテクトのないデータで販売してほしい。違法コピーが心配なら、記名式という方法がある。メインは病院などでの販売なのだから、どかんと購入した人の名前を焼き込んでしまえばそうそう違法コピーするやつなぞいないと思われる。リテラシーが高い人が買うので。
とか書いているうちにOCR&Notebook LMへのインポートが終わった。
この文書は、日本高血圧学会が発行する「高血圧管理・治療ガイドライン 2025 (JSH2025)」からの抜粋です。このガイドラインは、日本における高血圧の診断、管理、および治療に関する最新の科学的根拠に基づいた行動指針を提供します。特に、家庭血圧測定の重要性、患者個別の最適化治療、生活習慣の改善(減塩、運動、減量、禁煙など)、および薬物療法の具体的な推奨に焦点を当てています。また、妊婦、小児、高齢者、特定の疾患(心不全、腎臓病、がん、睡眠時無呼吸症候群など)を持つ患者といった、様々なライフステージや病態に応じた高血圧管理についても詳細に記述されています。このガイドラインは、日本の高血圧管理水準の向上を目指し、医療従事者や国民への普及を強く願って作成されました。
また、過去に目の血管が詰まったことがあり、それをきっかけに治療を開始しています。
また、関連する章をピックアップしてください。
現在の血圧が141/95 mmHgで、脂質異常症をお持ちであり、過去に目の血管が詰まったご経験があり治療を開始されているとのこと、このガイドラインでは以下の治療が推奨され、関連する章は後述の通りです。
現在の血圧141/95 mmHgは、診察室血圧による分類ではI度高血圧に該当します。また、過去に目の血管が詰まったご経験(脳心血管病の既往と解釈されます)があるため、あなたは高リスク患者と見なされます。
高リスクの成人高血圧患者に対する降圧目標は、原則として診察室血圧で130/80 mmHg未満、家庭血圧で125/75 mmHg未満と強く推奨されています。特に脳卒中の既往がある高血圧患者では、脳心血管病の再発予防のために収縮期血圧130 mmHg未満への降圧治療が強く推奨されます。ただし、血圧低下に伴う有害事象(めまい、ふらつき、急性腎障害など)の出現には注意が必要です。
あなたの血圧レベル(140/90 mmHg以上)と高リスクの状況(脳心血管病の既往、脂質異常症の合併)を考慮すると、計画的かつ厳格な生活習慣の改善を図るとともに、ただちに降圧薬治療(薬物療法)を開始することが推奨されます。
あなたの病態と推奨される治療に関連する主な章は以下の通りです。
最近、ふと考えるんです。
テクノロジーがこれだけ進んで、AIが何でも答えてくれるようになった未来、僕らの社会ってどうなってるんだろうって。
これって、単なるSFの話じゃありません。もう僕らの目の前で起きている、とんでもなく大きな変化の話です。
AIっていう、人間の頭脳そのものを外付けできるような技術が出てきたことで、
社会を成り立たせていた一番大事なもの、つまりみんなが何となく共有していた「物語」が、音を立てて崩れ始めてる。
その先に待ってるのって、人類の輝かしい「進化」なんでしょうか?
それとも、国なんてものが生まれる前の、バラバラな「回帰」なんでしょうか?
そもそも「国」って、たぶん、みんなが同じ物語を信じることから始まるんですよね。
歴史を遡ると、8世紀頃に、時の支配者たちが一大プロジェクトを立ち上げてるんです。『古事記』とか『日本書紀』を作ったこと。
あれって、単なる神話集めじゃない。
「この国は、天照大御神っていう太陽神から続く天皇が治める国なんだ」っていう壮大な物語を、国民の心にインストールする、国家的なOS開発だったわけです。
「三種の神器」っていうアイコンも設定して、他の豪族とは格が違うんだよ、と。
このOSがインストールされたことで、列島に住む人々は初めて「俺たち、同じ神様と天皇をいただく一つのチームなんだ」っていう意識、つまり「日本人」の原型を持つようになった。
そのOSが、庶民レベルまで完全に浸透したのが、江戸時代っていう、超巨大な培養器の中でした。
幕府は、身分制度とか参勤交代で、社会がガチャガチャ動かないようにガッチリ固定する。
そして、外国からの影響をシャットアウトした「鎖国」っていう培養器の中で、浮世絵や歌舞伎、お相撲といった、超ドメスティックな文化が花開く。
この時代、人々はみんな同じような文化に触れ、同じような価値観を共有してた。
「日本人らしさ」っていう、僕らの文化的DNAが完成したのが、この江戸時代だったのかもしれません。
でも、その当たり前だった「みんなで見る物語」が、いつの間にか壊れ始めてた。
2000年代、インターネットが登場して、僕らはいつでもどこでも情報にアクセスできるようになりました。
でもその裏で、僕らの頭の中にはヤバい変化が起きてました。
複雑な問題にあった時、じっくり「どっちが正しいんだろう」と判断するんじゃなくて、手っ取り早く「正解を検索する」というクセがついちゃったんです。
昔は、図書館で本を何冊も比べたり、人に聞いたり、頭を抱えて悩んだりっていう、思考の「摩擦」がありました。
でも、検索エンジンはその面倒なプロセスを全部すっ飛ばして、「答えはこれだよ」って教えてくれる。便利ですよね。
でもそのせいで、僕らの思考の筋肉は、確実に衰えていきました。それに、昔はみんなで見てた「お茶の間劇場」も終わっちゃった。
昔は、家族みんなで同じテレビ番組を見て、次の日には学校や会社でその話題で盛り上がりましたよね。
良くも悪も、日本中が同じ物語を共有する「お茶の間劇場」があったんです。
でもSNSは、僕ら一人ひとりに「あなただけの快適な世界(フィルターバブル)」を用意してくれました。
もう、嫌いな意見や、自分と違う価値観に触れる必要はありません。
その結果、僕らは共通の話題を失い、「共有される物語」が生まれる土壌そのものが、なくなっていったんです。
そして、そこにAIがやってきた。これは、社会の分断を決定的なものにする、究極のテクノロジーかもしれません。
AIは、考える人にとっては自分の知性を何倍にも拡張してくれる最強の「翼」になる一方で、考えるのをやめた人にとっては思考の筋肉を完全に退化させる快適な「車椅子」にもなる。
この技術は、人類の間に「知的格差」という、とんでもない溝を生み出そうとしています。
まるで、あなただけの「マトリックス」へようこそ、とでも言うように、AIはあなた以上にあなたのことを理解し、あなたが一番心地よいと感じる「神話」=あなただけの現実を生成してくれます。
あなたは、自分の正しさが毎日証明され続ける快適な仮想現実(マトリックス)の中で、気持ちよく生きていける。
でもその代償として、違う現実を生きる他人と対話する能力を失います。じゃあ、そのマトリックスを設計するのは誰か?
それは、AIを使いこなし、大衆が信じ込む「神話」をデザインできる、新しい時代の支配者層です。
こうして分断された社会では、かつての「右翼」「左翼」なんていう古い分け方を超えた、新しい「部族(トライブ)」が生まれています。
参政党やれいわ新選組、あるいは様々な陰謀論。彼らが熱狂的な支持を集めるのは、イデオロギーがどうこうというより、「腐敗した世界を正すのは我々だ」という、シンプルで強力な物語を提供しているからです。
その物語のエンジンは、いつだって「俺たちは悪くない。悪いのは特定のあいつらだ」という他責主義です。
で、ここからが本題なんです。AIという究極のテクノロジーは、皮肉なことに、僕らを国家が生まれる前の「部族」の時代に連れ戻そうとしている。
ただし、その部族は血や土地ではなく、情報と思想でつながる、全く新しいものです。
この螺旋階段の先にあるのは、過酷な情報環境に適応した、新しい人類の「進化」の姿なんでしょうか。
それとも、共通の現実を失い、協力する能力をなくした、ただの「退化」なんでしょうか。
この記事に、その答えはありません。
最初に結論書いておくけど、クリーンな生成AIを使われて不利益が生じましたって裁判になるまではたぶん状況変わんないよ。
無断学習禁止とか書いている人とか、無断学習こそが問題(許諾を取れば良い)みたいな話してる人いるけど、もう合法になっちゃったんだよね。
第30条の4
著作物は、次に掲げる場合その他の当該著作物に表現された思想又は感情を自ら享受し又は他人に享受させることを目的としない場合には、その必要と認められる限度において、いずれの方法によるかを問わず、利用することができる。ただし、当該著作物の種類及び用途並びに当該利用の態様に照らし著作権者の利益を不当に害することとなる場合は、この限りでない。
生成AI目的だろうが検索エンジン目的だろうが、機械的に処理して人間が直接楽しまないなら使って良いよ、となってる。
ポイントは但し書きの部分で"著作権者の利益を不当に害することとなる場合"のところね。
ちょっと話題になりつつある音声合成モデルがらみのは、ココがキモね。
特定の声優さんの声を模倣する目的で機械学習させて、その結果その声優さんの利益を害してたらアウト。
一度法律になったものは基本的に相当のことが無いと廃止になりません。(解釈変更で逃げたりするのはそれで)
第30条の4を相手取るのは相当しんどいと思うので、個人的にはここ十年くらいでの可能性はゼロじゃないかな。
我こそはという法曹畑の人が居たら投げ銭はすると思う。それぐらいちょっと無理じゃないかな。
特に絵画的な表現で顕著なんですが、アイデア(作風・画風)は著作権として保護の対象になりません。
これは文化の発展に寄与しつつ、いうて権利も守ろうやという、せめぎあいの歴史でもあるので個別具体例には触れません。
通常、類似性(創作性のある表現が似てるか)、依拠性(知ってた上か)が揉めどころですが、ポイントはまさにここです。
合法無断学習生成AIを使って出力しようが、完全許諾学習クリーン生成AIを使って出力しようが、出力物が著作権侵害してれば一緒です。
特に、存命の俳優の演技(創作性のある表現)を真似て出力するのは、相当揉めるでしょう。
これは学習基が何かに寄らず当然揉めるので、無断学習だろうが許諾学習だろうが関係無いんすよ。
たぶん、無断学習(自分の創作物が勝手に使われるのが嫌だ)という部分にフォーカスが当たり続けて、理解が広がるとしたらガッツリお金の絡む話で裁判沙汰になってからだと思う。
超具体的に言うと、ときメモ裁判みたいなやつとか、パルワールドみたいなやつとか、あの辺。
完全にクリーンなデータで作られた生成AIの出力物で、超揉めてからが本番。
なので、たぶんクリーンなデータにこだわって開発を進めても、とん挫すると思うよ。やるなら地の利(国内で合法)を活かしてガツガツ言ってビジネス面でメリット出しながら公式から出した方が良いと思うよ。