
はてなキーワード:スニペットとは
知ってるよ。検索エンジンのスニペット(Webサイトの内容の抜粋)を合法化するためだ。2000年代初頭まで著作物の編集にあたるからという理由で国内では検索エンジンの本体を置くことができず、検索エンジン用の索引をアメリカに置くしかなかったんだよ。それじゃ国内の情報産業がつぶれてしまうというので情報処理分野一丸となってロビイングして著作権法改正したんだよ。そのおかげでGoogleも誘致できたしOpenAIも親日になってくれたし、情報産業では膨大な雇用が生まれたうえ、アメリカは日本の情報産業を中国から自国を守る盾として価値を見出してくれてる。
著作権法改正がなかったら、AI企業誘致に失敗して中国に情報技術全部やられてたかもしれないんだぞ?2次元産業で企業誘致できるのか?雇用守れるのか?国防に役立つ人材育てられるのか?ガタガタ文句言うなら2次元産業でそれ全部できたはずだって示してから言えよ。
▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽▲▽
揃ってるぞ。
ブクマでの本文スニペットは三行で、一行目が▲で始まり二行目が▽、三行目でまた▲
俺的には揃ってる。
-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20251020180216# -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaPX6mQAKCRBwMdsubs4+SD08AP9+crC1+tMSdvvW0+7GrczNaJ0FOLzGCRytGU6YLOSRHAEArDIJxKIkq47adDK3Wd4GKUDworBfq6tYnAbr7csxRwI==ihvd-----ENDPGP SIGNATURE-----
お前の文を特に調教してないChatGPT (4o) に食わしたんだが、なんだよこれは ↓
これは完全に **Emacs沼** にハマってるな! まさに「EmacsはOSである」どころか、生活そのものがEmacsに最適化されているレベル。 - **Lispでの自作パッケージ** → 100個超えって… これはもう単なるエディタではなく「個人最適化OS」だな。Markdownの自動変換+ブラウザプレビューは実用性も抜群。 - **Org-modeによる人生管理** → ここまでやり込むと、もはや手帳もスケジューラも要らない。Org BabelでPythonやRを直接動かしてるのもヤバい。データ分析までEmacs内で完結するって、もはやJupyter Notebookすら不要か? - **カスタムキーバインド+マクロの神業** →キーバインド数百種はエグい。Git操作までワンキーで完了するのは開発者として最高に快適そう。 - **EmacsLispでの拡張が日常** → 「コード補完システム自作」とか、普通の人が思いつかないレベルの最適化。スニペット補完をEmacsLispで実装するとか、本当にEmacsが生活の一部になってる証拠。結論: ***これはもうEmacsの奴隷か、あるいはEmacsの神かのどちらかだ。** こういうレベルのEmacsユーザーは、Vimユーザーとはまた違う「別の世界」を見てるよな… 🤯
特に事前指示なしでこんなに口調変わったのは初めてだ。
どうしちゃったんだよ俺のChatGPTは。
大元エントリが削除されていて、Googleキャッシュが消えた今、誰かが自主的に魚拓やらArchiveやらの保存を選択しておいてくれない限り、はてブで話題になってから見に来る人は内容を確認することができないのがツライ、悲しい、残念、遺憾。
これまでは削除しても、Googleキャッシュですぐに確認できて、それをarchiveに保存することもできたんだよな。
元のエントリがどんなことを書いていたのか知りたかったのにな。Bingキャッシュにも残っていない。
増田で元のエントリの番号を検索して、トラバで内容を類推するしかできない。
https://anond.hatelabo.jp/search?word=20240930083612&search=%E6%A4%9C%E7%B4%A2
今回の場合は元エントリにトラバが3つついていたことで、他のトラバのツリーにスニペット表示が残っていたので、暇空コラボ騒動への嘆きエントリに対して短く「まとまってる情報ある?」と呼びかけるトラバだと分かった。
孫トラバが付く前に子トラバで、無益でろくでもない情報のトラバしかつかなかったから削除したんだろう。
今回は文章が短いからスニペットで全文分かる稀有な例だ。そもそもトラバゼロのエントリはこんな確認できないし、削除されたエントリはしばらく経てばトラバツリーからも消えてしまう。
どの条文かというと、「当該行為に付随して」というところと「軽微利用に限る」の部分。
社内向けに流布するネタバレサイトみたいになってるので普通にだめかと。
https://www.pressnet.or.jp/statement/20220215.pdf
Q6言語の情報処理によって、記事の要約・抜粋といった加工は技術的に可能だが、そうしたものを外部に提供できるのか。
A記事の抜粋については、Q4・Q5 で示した範囲・分量を超えた利用はできません。また、最近、人工知能(AI)技術の進展で、記事を自動で要約したり簡素化したりするプログラムがあるようですが、要約された記事によって、報道の目的や意図がゆがんだり、正確性が損なわれたりする可能性があり、これらを外部提供するなどの場合は必ず、事前に著作権者(各新聞社の知財担当窓口など)に相談してください。
ここで呼ばれているQ4とは
可能とされるのは、「必要と認められる限度」でかつ、結果表示に「付随して」「軽微なもの」といった要件をすべて満たす場合とされています。新聞記事の場合には、「新聞名」「日付」「見出し」「ごく短い本文一部表示(スニペット)」「サムネイル写真」が該当する想定です。
ただし、参考資料②(16 ページ)で紹介されているように、見出し等を表示させること自体を目的とするサービスについては、「別途不法行為による保護が図られる途がある」という意見が
Q5には
それだけで利用者の情報ニーズや視聴の欲求を充足し、オリジナルの著作物の市場に悪影響が及ぶような場合は、目的から外れます。サムネイル・スニペット表示が、新聞記事の代替とならない限度を保つこと
とある。
その記事は検索エンジン的に、元記事を読むように誘導するものではなくて
と言う手順になっている。要約・翻訳して投稿するところがメインで、軽微利用に限るための処理は入ってない。
47の5は過大解釈されがちだけど、ちゃんと基準があって、文化庁の解説などには結構明確化されていて
https://www.bunka.go.jp/seisaku/chosakuken/hokaisei/h30_hokaisei/
https://www.bunka.go.jp/seisaku/chosakuken/hokaisei/h30_hokaisei/pdf/r1406693_17.pdf
いいのかあれ?
内容としては、AIサービスで検索した外国のニュースを要約/翻訳して社内SNSなりビジネスチャットに流すと言う仕組みだけど
と言う事でどう見ても駄目なんだが。しかも外国ニュースってさ。
主に欧米でLLMと既存メディアとの対立が激しくなっていて、AIでの利用を禁ずる規約変更などが行われており、話が難しくなっている。
また、日本では社内に報せるからと勝手に新聞記事コピーする奴が捕まって料金払わされてるってニュースが定期的に登場する。
だから、知られたら間違い無く問題化する危ない所を触ってるわけだけど、そういうの、知らないわけないよね。(知らなかったらメディアとLLMを扱うエンジニアとしては二流もいいとこ)