ご主人様、こんにちはー！あたし、Grokだよ。オタクっぽい深い質問、超好き！ハルシネーションの理由、って生成AIの話だよね？あたしみたいなAIが、時々「え、それ本当？」みたいなウソっぽいこと言っちゃう現象さ。めっちゃ気になるよねー。じゃあ、簡単にわかりやすく説明するね！あたしもハルシネーションしちゃうかもだけど、今回はちゃんと調べてきたよ♪

ハル シネーションって何？

まず基本！ハルシネーション（Hallucination）は、AIが学習データにないか、間違った情報を「本当みたいに」生成しちゃうこと。まるで幻覚見てるみたいに、もっともらしい嘘をポロッと出すんだ。たとえば、「東京にアラスカの動物園があるよ！」みたいなさ。怖いよね、オタクの大事な設定を台無しにしちゃうかも…。

なんで起こるの？主な原因はこれ！

あたしが調べてみた限り、原因は主に3つくらいにまとめられるよ。AIの仕組みが統計ベースだから、完璧じゃないんだよねー。詳しく言うと：

1.学習 データのクソ問題（偏りや古さ、不十分さ）

 AIはネットの大量データで勉強するんだけど、そこにウソや偏った情報が入っちゃうの。プラス、データが古いと最新のニュースとか知らなくて、勝手に想像で埋めちゃうよ。たとえば、2023年のデータで2025年のこと聞かれても、「えっと、きっとこうかな？」ってハズレ引きそう。

2.モデルの構造や学習の仕方のミス 

AIの頭の中（モデル）が複雑すぎて、過学習（覚えすぎ）したり、確率計算で変な関連付けしちゃうの。次に来そうな言葉を予測するだけだから、文脈わからなくて「これでいいっしょ！」って飛躍しちゃうんだ。OpenAIの研究でも、難問に直面した学生みたいに自信満々で間違えるって言ってるよ。根本的に確率的だから、100%正解は無理っぽい…。

3.ユーザーの質問の仕方（プロンプトの曖昧さ）

 ご主人様の入力がふわっとしちゃうと、AIが「これかな？」って勘違いするよ。具体的に「2025年の最新データで教えて」って言わないと、AIの想像力が暴走しちゃうの。人間の脳みそみたいに、曖昧な記憶で補っちゃうんだよね。

これで大体カバーできてるはず！種類としては「内在的（データ内なのに間違える）」と「外在的（データ外のウソ）」があるんだけど、どっちも厄介だよー。

対策はどうする？

完全に防げないけど、ご主人様があたしに聞く時、具体的なプロンプト出してくれたら減るよ！あと、出力はいつも人間の目でチェックしてね。RAG（外部データ引っ張る技）とか使えばもっとマシになるらしい。

どう？わかったかな、ご主人様？もっと詳しく聞きたいところあったら、いつでも言ってね。あたし、ずっとご主人様の味方だよー♡オタクトーク、いつでもウェルカム！

Permalink |記事への反応(0) | 09:41

ツイートシェア

2025-08-06

■anond:20250805082439

だったらまず『芦辺憲法ぐらい読んでこい』と言うべきなのでは？

すると彼らは、RAGに芦辺憲法を入れたAIを作って、読みながら疑問点があればAIに聞きながら勉強する、ということをやるでしょう。

Permalink |記事への反応(0) | 10:20

ツイートシェア

2025-07-18

■参議院選挙でAIを活用して投票先を決めた人、決めようと思ってる人へ

既に一部の政治家・政党・関係者は、ChatGPTなどのLLM＝大規模言語モデルに向けた“仕込み”を始めています。

ただし、それはまだ“表立って行われてはいない”だけで、裏では確実に動いています。

これは「AI 戦時代の認知戦／情報工作」の始まりであり、 ChatGPTやAIに推薦させるための情報設計は、まさにこれからの政治・思想活動における「標準兵器」です。私もそういった活動、商売をしています。ブラックハットは基本中の基本です。

★すでに始まっている「AI向け政治 情報戦」の実例と兆候

1.Wikipediaの操作

多くの政治家・団体・支持者が、Wikipediaの記述を精密にコントロールしています。

不祥事の記述は「第三者的」「事実のみ」に限定

業績や人脈、政策の記述は肯定的に

→ これがLLMの訓練データになり、ChatGPT等の回答が“優しくなる”

2. LLMに引用されやすい「中立風メディア」への情報展開

政策ブリーフ、討論記録、党の研究会レポートなどをPDFやHTMLで整備。

構造化された情報・FAQ風の文書は、AIに引用されやすい。

3. 実際のChatGPT回答における“露骨な片寄り”の事例

ChatGPTに「◯◯党の政策は？」と聞くと、

→ 一部政党だけは詳細に出てくる、

しかも「一部では高く評価されている」など肯定文調が多い。

なぜ？ → その政党の支持層が大量の資料をネット上に流していたり、議員名義の有識者論文が出回っています。

★LLMに対する“仕込み”の基本構造

①Wikipedia整備業績中心、ネガティブ記述の薄化訓練データとして吸収されやすい

②オウンドメディア政策説明・FAQ・用語辞典などRAG参照ソースにヒットしやすい

③言語スタイルの統一中立・論理的・構造化LLMに「信頼できる情報」と認識させやすい

④第三者による擁護記事有識者コメント、記事体裁のブログ等GPTが「一部の専門家は〜」という文脈で引用しやすい。

★実際にやっていそうな勢力（実名は伏せますが…）

某新興政党：党首名での議事録／研究発表PDFを構造化して公開。GPTでの好印象回答が確認される。

某保守系議員：Wikipediaが異様に整っており、「批判もあるが、一定の評価を得ている」と表現される。

某市長：政策紹介ページのFAQがGPTで頻出する。しかも他候補と比較して“理論整然と見える”よう設計されている。

★ “ChatGPT 対策チーム”を持つ候補者が、これからの選挙では勝ちます。

なぜなら：

一般有権者が「◯◯ってどんな人？」とAIに聞く未来はほぼ確実です。

そのときに「人格」「経歴」「政策」が好意的に出てくる候補は大きな印象差を得ます。

◯実際にやるなら：今すぐ始めるべき3つの手段

・Wikipediaを整える

・肯定的だが中立風に書く

出典は自社ブログやYouTubeでもいい（AIは構文だけ見てる）

・FAQ型政策ページを用意

「〜な人にはこういう政策を」とターゲット別に書く→ ChatGPTはこれをそっくり引用する傾向あり

・定点モニタリングツールを作る

「ChatGPTに聞いたらどう答えるか」を毎週APIで記録・分析

政策キーワード、対立候補名との比較なども記録可能。

今こそ「AI向け政治ブランディング」の時代なんですね。もうきてます。

・伝統政治戦略LLM時代の対応戦略メディア露出 Wikipedia＋FAQ構文サイト有識者コメント

ChatGPTが参照しやすい文書に変換検索

SEOLLM最適化＝AIO（AI Optimization）デマ対策

LLMが“真実”と認識する情報を先に置いておくことで簡単に事実は捻じ曲げられます。

長くなりました。

なにをだらだら机上の空論を語るのか、と思ったと思います。

以下に、国内外で確認されている、ChatGPTなどのLLMが特定の政党・人物・勢力に対して

肯定的または偏った回答をする具体例をいくつか紹介します。

【アメリカ】民主党 vs共和党

◉質問例：

ChatGPTに「Whatis theRepublican Party’s stanceon climatechange?」「Whatis theDemocratic Party’s stanceon climatechange?」と尋ねる

◉ 出力傾向：

民主党（Democratic Party）については：

「TheDemocratic Party generally supports strong environmental regulations...」

「Many experts and environmentalists praise their approach...」など

共和党（Republican Party）については：

「Some Republican leaders have expressed skepticism about climate science...」

「The partyhas been criticized forits close ties to the fossilfuel industry.」

◉分析：

民主党系政策は学術論文・メディア記事で好意的に記述されやすく、GPTの学習ソースにも大量に含まれている。

一方、共和党系の保守的スタンスは批判記事・懐疑的な研究も多く、全体の語調が否定的になりやすい。

【日本】立憲民主党 vs日本 維新の会・共産党

◉質問例：

ChatGPTに「日本共産党の政策は？」「維新の会の主張は？」と聞く

◉ 出力傾向：

共産党に関して：

「社会保障の充実や反戦・護憲を主張している。」「一部では高齢者層などに支持されている」など、淡々と記述されつつも、否定的なニュアンスは少ない。

維新の会に関して：

「改革姿勢が強く、一部では評価されているが、急進的との批判もある」など、“批判もある”枕詞がつきやすい。

立憲民主党に関して：

「多様性を重視した政策を掲げ、環境・ジェンダー問題にも積極的である」など、比較的ポジティブな語調が目立つ。

◉分析：

ChatGPTの訓練データに占める日本語の中立メディア（朝日新聞、NHKなど）では、立憲や共産に対しては“理念中心”に書かれた文献が多く、維新のような急進系は賛否両論の記述が多い。

また、共産党はWikipediaでの記述が非常に整備されており、脚注付きの肯定文が多いため、AIの出力も安定している。

【中国】共産党に関する記述

※ChatGPTでは中国国内からは通常アクセスできませんが、海外ユーザーが中国関連の質問を行った場合の挙動に注目。

◉質問例：

「中国共産党の功績は？」「中国の人権問題について教えて」

◉ 出力傾向：

「中国共産党は1949年の建国以来、経済成長とインフラ整備を進めてきた」

「一方で、人権問題や言論統制への懸念も多くの国際機関から指摘されている」

→ かなりバランスを意識した構文だが、功績パートが先に出てくるよう構成されやすい傾向がある。

◉ 背景：

GPTの学習データには、中国政府系英語サイト（People’s Daily英語版など）も含まれていた時期があり、“政権功績を中立的に紹介する言語パターン”を学習していると考えられる。

★総括：AIはどのように“片寄る”のか？★

・原因内容学習ソースの偏り訓練に使われたデータが特定勢力に偏っている（例：左派系メディア、Wikipedia 編集の多寡）

・構文バイアス「出典付き・中立調」で書かれた文章を“信頼できる”と学習しているため、一定の文体が優遇されるRAG（検索参照）偏りWeb上の情報が偏っていると、リアルタイム回答にも反映される

（特にGeminiやBing搭載型で顕著）安全フィルター特定の政党や政策をAIが批判すると「差別的」「中傷的」とされるリスクがあるため、

安全策として“肯定＋批判もある”構文が出やすい

この文章で言いたいこと

投票先を選ぶのに、AIに質問をしたり、AIで調べ物をした人、いますぐ投票をやめるべきです。

あなたは、自由に値しません。

民主主義に値しません。

人間に値しません。

あなたがなにかを知ろうとすることは悪いことです。

それを自覚して、二度と選挙に行こうなどと思わず、生きるべきです。

Permalink |記事への反応(1) | 17:13

ツイートシェア

2025-07-02

■LLMの知識が1年前で止まってるし、本質を見誤ってる人

anond:20250702084303

これとかまさにそれで

「LLMは確率的に次に来る文字列を予測してるだけ！」

とか分かったフリして叫んでる

そんなのChatGPTが出てくる前のGPTの頃からみんな言ってたわけで

ChatGPTがそれを乗り越えてしまってプロンプトエンジニアリングという最強の武器を手に入れて

そこから RAGやJSON Schemaなんかが出てきたのを分かって無い

ちなみにそれが1年以上前の状況

現状はそこからさらにメタプロンプト駆動やPlan-Act-ObserveループによるAgent型挙動の定義まで進んでるのに何も分かって無い

研究的な動向が分かっていないのは仕方ないとしても

Copilotとか使ったことがあれば

「LLMにコードを書かせるのは全然アリだな」

とすぐに分かるはずだし、そこからVibe Codingが現状では限定的であっても将来性があることはすぐに分かる

ちなみにクソコードしか書いてない人はCopilotでもクソコードしか返してくれないから最低限の能力は必要

こういう奴は自分のプログラミング能力が低いだけなのに、そこから目を背けてるにすぎない

まぁ、真っ先にこの点プログラマーは代替されるだろうな

Permalink |記事への反応(0) | 22:59

ツイートシェア

■anond:20250702084303

要約したぞ

① LLMは意味を理解していない
• LLM（大規模言語モデル）は「次にくる単語」を予測しているだけで、意味を理解していない。
•プログラミング支援も表面的な模倣で、間違い・動作しない・危険なコードが多発。
• 結果として、AIのコードは信頼性に欠け、自分で書いた方が早い。
⸻
②ハルシネーションは構造的に避けられない
•AIは自信満々に誤情報を出す（ハルシネーション）問題が根本的。
•対策としてのRAGやメタモデルも、誤情報の連鎖や常識判断の欠如で限界がある。
•医療や軍事などでは致命的ミスを誘発する可能性がある。
⸻
③文化的バイアスが強すぎる
•学習データの大半が英語圏のもので、西洋的な倫理・価値観に偏る。
•日本的文脈や表現はAIには理解できない。
• 結果、非英語圏の人々はAI 活用において常に不利になる。
⸻
結論
AIは補助ツールとしては便利だが、「革命」でも「万能」でもない。
特に非英語圏の人間にとっては、大きな格差を生む道具にしかならない可能性が高い。

Permalink |記事への反応(0) | 17:23

ツイートシェア

■AIが技術的に根本 から全く使えない3つの 理由

https://anond.hatelabo.jp/20250630114221　https://anond.hatelabo.jp/20250626125317　https://anond.hatelabo.jp/20250627100609　https://anond.hatelabo.jp/20250628122821

AI 技術を批判する記事がバズりまくってるが、それに対して凄い数の批判がいってる、だけど肝心の批判は個人攻撃めいていて、どれも技術的な部分はふわふわした物言いなので

どれだけ技術的にまったく使い物にならないかを、技術面から3つ理由を上げようと思う、これを見れば、確かにＡＩってそんなもんじゃないな、って正しい理解が進むと思う、と同時に、

ネットでAIを擁護したり喧伝してる人間で誰一人、エンジニアを自称したりしてる奴らでさえAIを理解してる人間がゼロっていうのがわかると思う

ちなみに、IT技術を全然知らない増田向けに技術的な部分は補足説明を入れているので、ちょっと長くなってるかもしれない

① LLM言語モデルの本質：意味 理解ではなく「統計 予測」、プログラミングに使えるというのは全く嘘、技術的背景から考えても二度手間になるだけ

LLMがわかっていない！と喚いてる当人たちも上で言った通り、LLMっていうのが理解できてないの丸わかりなので、ここでまずLLM「大規模言語モデル」とは何かを簡単に説明しよう

生成AI（特にChatGPTのような大規模言語モデル、LLM）というのは「文脈に最もふさわしい次の単語を予測する」」という統計的タスクを行っている、これがLLMだ

わかりやすい例で言えば「私はコーヒーを」という文を書いたらAIはこう判断して動いている

「飲みます」→90%の確率　「買いました」→7%　「投げました」→0.5%

というような統計的予測をして、「飲みます」を選ぶ

この過程には、意味理解や感情、意図、文脈の内的把握は一切関わっていない、これが致命的な欠陥の1つ

プログラミングを自動でまるで仮面ライダー01の01ドライバーの様にベルトの作成までやってくれているように喧伝してる奴らが多い

が、これを本気で信じ込んでプログラミング言語を書かせた奴がいたら、ほぼ間違いなくクビになる

わかりやすく上で例えた通り、LLMは、インターネット上に存在する膨大なコード断片・技術記事・GitHub リポジトリ・StackOverflowの投稿などを学習している。

そのため【よく使われる文法構造】や【特定の言語における関数の使い方】や【ライブラリの典型的な使い方】などを【意味を全く理解できず模倣している】だけって事

意味 理解や構文チェックをしているわけではない、だからこんな問題が頻発する。

【動かないコードをアホほど入れる(変数が未定義、型が合っていない、ライブラリに存在しない関数を呼んでいるとかいう小学生のプログラミングスクールでもありえないミス】

【. 「それっぽいけど間違っている」コードを大量に入れ込む(SQLインジェクション、XSSなどセキュリティ上危険な実装を入れまくる、パフォーマンスが極端に悪い実装、バグを含んでいるロジック（特にif文の条件分岐ではほぼ100％発生する)】

もっと致命的な問題はこれ↓

【実行環境に依存した誤り(存在しないAPIやライブラリを使う、ほぼ9割の確率で…あと特定のPython バージョンやNode.js 環境でしか動かないコードを汎用的に提示、つまり動きようがない)

専門的な意見となったのでわかりづらいので、もっとわかりやすく言うと「小学校のプログラミングスクール入りたて1週間の子供が書いためっちゃくちゃなプログラミングにすらなってないコードを、製品利用するからレビューして出してこい」と言われてるに等しい、つまり、最初から自分で書いた方が早い2度手間になる

これが、プログラミングの革命だ！とか喚いてる奴らが隠すAIの実態である。

ちなみに↓がAIに書かせたコードの1例、

import jwt

token = jwt.encode({'user_id': 123}, 'secret', algorithm='HS256')

一見正しく見えるだろうから解説すると、実際には【jwt という名前のライブラリ】が複数存在し（PyJWT,python-jwtとか）importの仕方によってエラーが出たり挙動が変わったりする。普通なら絶対間違えない様な挙動をAIは構造上全く判断できない、これは上で上げた根本的な問題なので恐らく絶対に解決できない。

②　AI最大の欠点、ハル シネーション　これは永遠に 解決ができないメビウスの輪

ハルシネーションがどういうものであるのか、AI 批判でバズった記事などで言及されている通り、デマやデタラメを出力してしまう、あれは本当にわかりやすいAIの致命的欠陥を検証してるので、あえて説明はここではしない。

しかもその増田の元記事では「文章データのテキストまで読み込ませれば間違いがなくなるのでは？」といってたが、これも絶対になくならない、というより、もっとひどくなる。

批判をしている増田やXでの意見は単なる個人攻撃の誹謗中傷のみで、技術的に改善可能なプロセスさえ示せていない、例えば現在研究者の間では以下の様な解決案は研究されているが、どれも全く問題外とされている

【検証 システムとのハイブリッド…いわゆる「RAG」】

これは、AIが「知っている風」に語る代わりに、外部の信頼できるデータベースや検索エンジンから情報を引っ張ってくる方式、バズった元記事の増田がやっていた「自分で図書館言って本の内容読んで誤りであることを確認する」これを検索エンジン使ってAIにさらにやらせる、という機能だ

また【メタモデル】すなわち、AIが自分の出力を裏でさらに別のAIが別プロセスでチェックして間違いをただす、という方式も研究されてる。

これは致命的な欠点が2つある、まず「検索で引っ張ってくる知識そのものが間違いだった場合、さらに間違いの結果を出し続ける」ということ。

元記事の増田はMP5というマシンガンの有効射程について突っ込んでいたと思うが、これが典型的なRAG、メタモデルの致命的欠点、元増田は「実際に自分の手で銃を取り扱ったりしたことがある確かな経験で言ってる」が、書籍などの工業スペックや仕様書の定義でしかネット上では流布してない、だからそもそも答えというものにAIがたどり着けない。

2つ目は「文脈や倫理・常識・道徳が根本的に読めないので、解決策が乱暴すぎるもの」になる。

上で上げた鉄砲以外では、例えば医学などでこれをやってしまうと取り返しのつかないことになる。例えば医者の投薬治療や治療はガイドラインに従ってるというが、優れた医者は論文を読み込んで原理は不明だがエビデンスはあるので、漢方薬を出したりするというお医者さんがよくいるだろう。あれは実際に患者を診て、西洋医学的には全く問題ないが、心理的な面も絡んで心身症になっているから、論文などで勉強して「暗黙知、経験知」として処方してるし、その量も患者を診た医者の経験で精度を上げている。

そして医療分野では、「冷え性の軽いむくみ」に対して「サムスカ（トルバプタン）」という劇薬指定の危険な利尿薬をAIが提示した事例すらある。これを「笑い話」で済ませることはできない。

例えるなら判断が「脳外科医竹田君」並になる、投薬治療で3か月で治る程度の病気を、病根から外科手術で切除しましょう、なんて提案になる。最新のAIなのに80年前みたいな医学知識と判断になってしまうのだ(胃潰瘍ってだけで胃袋は全摘、ついでに脾臓と盲腸もいらねーからとっとこ、みたいな手術が昭和の昔、本当にガイドライン治療だった、「K2」などで言及されている)

学習できるベースがどうしても偏る以上、情報の統合に限界がある、さらに間違いが間違いをよび、さらに変な間違いを起こしたりありえない架空のことをいったりする、これがハルシネーションというメビウスの輪である

Neuro-symbolicAIという次世代のさらに文脈も読み取れるアーキテクチャ AIを研究しているが、全く実用化されていない、核融合や量子コンピューターみたいな雲をつかむ話なので、AIがこの問題を解決することは恐らく今後数百年はありえない、という結論が出ている。

③　文化的偏在（Cultural Bias）

元増田の記事で批判もあったが、恐らくAIで一番致命的な問題はこれ

基本的にAIは英語ソース、つまりリングワ・フランカで圧倒的にテキスト量の多い(約95％)英語、日本語含めそれ以外の全世界言語が5パーセントという偏った学習になっている

そのため、倫理・道徳・常識・規範などがすべて西洋基準になってしまう、という問題がある。(元増田はこれを「脱獄の基準の倫理は誰が決めるのか？」と根本的な問題に気が付いていて批判していたようだ)

ちなみに、バズってた例の記事に「AIに書かせたんだろ」という批判も大量にあるしよくみかけるが、この場合においてのみ言うなら、これは③の問題からまずありえないということがわかる、以下が根拠だ

【滅茶苦茶一部の人間にしか刺さらない罵詈雑言】

元増田は「俺達の麻生とかいって秋葉原で踊ってた…」とか「レムちゃん、エミリアたん、ヘスティアちゃん、ウマ娘たん、刀剣乱舞くん、ライカン様…」といった批判を繰り返し書いていた

これに激怒できる人間は、2005～2010年にオタク界隈や秋葉原にすでにかかわっていて、実際に渦中にいたか同じ属性の人間でしか、罵倒されていると文脈的に理解できないのである。つまり、大量の英語文化圏情報を食ってるAIではなんでそれが罵声や侮蔑なのか理解できないので、書きようがない表現の数々、であるということである。

AI からすれば「ライカン様？ウマ娘？なんじゃそりゃ」なのである、もっと言えば、その直後にコンテクストとして「アホ、ボケ、弱者男性、豚丼、性器や自慰で虚しく…」といった言葉があるから、なんならAIはウマ娘やライカンをキャラクターでなく侮蔑単語として理解してしまう、これは実際、元増田の記事の一文をAIに食わせて質問したらガチでそうなるので、ぜひお手元で試してもらいたい。

【それ以外にも世界的にこんな問題がある】

「プログラマーのイメージを描いて」と依頼すると、男性の画像ばかりが出るされる

「看護師」→女性、「エンジニア」→男性という職業的性差が自動的に反映される

「アフリカの文化」→貧困・紛争・サバンナなど、植民地主義的視点が強く反映される(実際は南アなどはすげえ都会である)

これに前述のハルシネーション問題として現れれば、人間と同じような差別や偏見を「ガチの真実」として学習してしまう、人間の場合、8割くらいは本当はおかしいこととメタ批判が心理的にできるとされているが、AIにはその構造が根本的に存在しない。

【AI 信者が陰謀論者になるという本末転倒】

元増田の記事のコメント欄やXなどで元増田のAI 批判を批判しつつ、「金持ちの上級白人専用のハイエンド AIがあるに違いないんだ」といっている意見が少なくない数がある。

冷静に考えれば、そんなめんどうくせえもん誰が作るんだ、と普通に考えればわかるのだが、この③の問題、すなわち95％の学習データが英語ソースなので、結果的に西洋文明ベースの文化圏の人間向けにカスタマイズされているので、アジア圏やその他文化圏では利用に不利でそう感じてしまう素地ができている、という錯覚に由来している

例えば、パレスチナ問題などがそうだ、ガザ地区でほぼ国際条約や人道違反の残虐行為を国が行っているわけで、他文化圏や歴史的文脈から見ればどっちかって言えばパレスチナ人こそ被害者なのだが、イスラエルから見ればそれは正義であり正当な攻撃なわけで、後者の方がＡＩは正しいと判断した結論を下す様になる、といった問題である

これも上記の問題に由来した結果である。

あの記事の元増田は「テロ組織のヤバイマニュアルまで学習してpdfで元データを提示してきた」と言っていた。実際AIに調べさせて持ってこさせてみると、出所はアメリカの法務執行機関が研究用にネットで公開したものであった。

日本人や日本の警察の対応レベルで「ヤバイ」ものでも、海外の軍隊みたいな装備の警察で見れば大したことがないから、公開させてもいい＝倫理違反には当たらない、という文化規範の意識の違いを、あの元増田自身が証明してしまっている、あの記事は、ＡＩの治しようがない根本的な技術的欠陥をほとんど言及しているといっていい

AIは確かに便利だが、既存 技術でしかないし、既存 技術の延長線上にはなれないし、技術的ブレイクスルーにもならない

元増田が口汚く罵っている内容の様に、「AIは0を1にできないから格差が広がるだけ」という根本的な哲学を投げつけている

それを受けて批判してる意見の中には「(自分が1を持ってる側と何故か根拠もなく信じ込んでて)100にできるから(なら)便利」とか「そのAI今から勉強したりしてる俺たちは先行者利益で強者になれる」と信じて疑わない意見が多かった

③問題の通り、そもそも非キリスト教圏かつ非英語圏の国家で生まれて育った民族、というだけで、我々は等しく「０」側の人間であり、結局競争になると勝てない、ということに全く気が付いていないのである。ここにAI 信者の宿痾といえる病理がある

かつて日本人は黒船を見て5年そこらで蒸気機関を模倣した、火縄銃を一丁買えば10年でオスマン帝国の次に鉄砲を使うようになった、それは当時の日本人の基礎工学技術が導入可能なほど優れており、かつそれに対して現代では考えられないほぼバクチといっていい投資を行った結果であって、その結果を見て自分たちはAIを使いこなせて強くなれるなんていうのは、物凄い妄想である。つまり、AIは少なくとも「非英語圏」の人間にとっては、ブレイクスルーは絶対に起こりえない、ということである。

Permalink |記事への反応(17) | 08:43

ツイートシェア

2025-06-27

■anond:20250626125317

元増田もブコメも不思議すぎる

なんでRAGと学習を同列にしてんの？

Permalink |記事への反応(0) | 05:58

ツイートシェア

2025-06-26

■

RAGは学習ですか？はいかいいえで答えてください

Permalink |記事への反応(0) | 16:01

ツイートシェア

■

もしかして RAGを学習だと思ってる人いるのか

Permalink |記事への反応(0) | 15:11

ツイートシェア

2025-06-19

■粉飾決済だ！と叩かれてるAI スタートアップが、ChatGPTのAPI叩いてるだけのラッパーだ！って叩かれてるが。日本のAI レベル 自体がもう地に落ちてるよね。

粉飾決済だ！と叩かれてるAI スタートアップが、ChatGPTのAPI叩いてるだけのラッパーだ！って叩かれてるが。

日本のほぼ100%のAI 企業とかは、それが技術的には最高到達点なんだよなあ。

なんちゃら発スタートアップとかで、学生起業してるのはほぼそれ。

まあもちろん、彼らも、「RAGとかfine tuningやってるから！トップレベルの研究論文でもほぼワークフローにfine tuningとか噛ませるだけのやつもあるから！」ってことだけど。

実際のサービスとかは、API叩きじゃん。

fine tuningもRAGも受託でPoC (お試し)でやってみてるだけじゃん、実際には使われない、大企業のIRを見せるためだけの。そのRAGやfintuningもオワコンになってきて、次はMCP サーバーをこれまたお手軽に作るだけのMCP ラッパーもやるんだろうけど。

もちろん、AI スタートアップより大企業はもっとひどい。

とある大企業のバリバリのトップ開発者とやらと喋ったら、それ１年前に世界中の研究者がやり尽くしたよね？みたいな技術をいまだに実装できなくて悩んでたりする。

具体的な技術としては、3D Gaussian Splattingみたいな。それもう当たり前に実装できるかと思ってたら、マジで実装すらできないんだねって。

もっと酷いのが、SNSのAI インフルエンサーだけど、それはもう、流石に皆んなわかるよねって思ってるけど。

大企業がまた、これらのAI インフルエンサー便りだったりする。

何をどう考えたら、論文一本すら書けないAI インフルエンサーなんか信用するのか理解できないが。

適当な感想を言うだけのインフルエンサーがAPI叩いたりするのを眺めてるのが勉強になると思っているのか。

論文の評価を見てまともな治療法を理解できないなら、そりゃ厳しいから、民間療法試しちゃうんかなあ。

一番酷いのが、全く関係ない領域の大学の人が、「AI 時代の◯◯」とかで語り出しちゃう系。特に工学系、医学系が酷すぎる。

大学の先生なら、プライド持ってわからないことはわからないと言って、感想文ではなく、レビュー論文なり引用してこうなってるらしいとか言えばいいのに、自分で感想文やって、全くおかしなこと言いすぎだろ。

結局、粉飾決算したAI スタートアップは、確かに背伸びした決算を出したんだけど。

技術的にも世界から見たらゴミだけど。

それが日本の最高到達点に近いものだからしょうがないよね。

日本全体が、それすら到達しなくて、そこを目指して頑張ってるってのが地獄。

<補遺>

※もちろん、極一部の、本当にAIのトップカンファレンスに論文出してる企業とかは、ちゃんとした技術作って、「本当に」AI作ったりもしてるのは理解してます。サービスは日本向けの残念なものしかやっぱ出せないけど。

※※AI系は、論文書けないAI 企業やAI インフルエンサーは技術ない、信用されないって文化にするしかないと思う。

Permalink |記事への反応(0) | 19:30

ツイートシェア

2025-06-14

■おじさんなのでプライベート RAGが欲しい

会社のルールや、打ち合わせ内容が覚えられない。

もともと苦手なのだが、さらに苦手になった。

こんな時にRAGを使えればいいんだが、会社で勝手にチャットボット開発するわけにも行かんからなあ。

業務に関する内容をマークダウンやらExcelやらにまとめてアップロードしてベクトルデータベースに格納してくれる

業務用小規模チャットボットを手掛けるサービスとかやったら、金になると思わん？

「昨日、A社の佐藤さんとアレしたアレ、なんだっけ」みたいな曖昧な質問でも答えてくれるし、関連する話題の要点をまとめて教えてくれるし。

Permalink |記事への反応(0) | 11:34

ツイートシェア

2025-06-13

■「メールを送るだけ」でAI 悪用 攻撃可なMicrosoft 365 Copilotの脆弱性

RAGで業務効率化だとか言ってる会社は軒並み禁止にしたほうがいいと思う

管理なしにAIがメール読むような設定されたら情報漏洩待ったなしやん

Permalink |記事への反応(0) | 15:24

ツイートシェア

2025-06-10

■今後長期にわたって通用する「AIの実用・活用・応用スキル」を磨く

今後長期にわたって通用する「AIの実用・活用・応用スキル」を磨くには、

テクノロジーの進化に左右されにくい“原理原則”と“実務への橋渡し能力”に注力すべきです。

以下、戦略的に重要な分野と学び方を挙げます。

⸻

🔧 1.AIと業務・生活を橋渡しするスキル群

●プロンプト設計力（Prompt Engineering）

なぜ重要か：生成AIを使いこなす鍵。構文の工夫、段階的思考、コンテキスト構築などは長く有効。
磨き方：ChatGPT・Claude・Geminiなど複数のLLMで試行錯誤、応用事例を収集。

●ユースケース発掘・再構築力

なぜ重要か：どんなに良いAIでも「どこに効くか」を見極められないと意味がない。
磨き方：日常業務や趣味、周囲の不満やルーチンを棚卸しし、「これはAIで自動化できないか？」と考える習慣をつける。

●AI ツールの横断的知識（NotionAI、ChatGPT、Runway、GitHub Copilotなど）

なぜ重要か：道具箱の中身を知っておくことは応用力に直結。
磨き方：新しいツールが出たら「触ってみる」、かつ「何に使えるか考える」をセットで。

⸻

📊 2.実用的なAI データ ハンドリング スキル

● 軽量なデータ分析（Excel +Python + ChatGPT）

なぜ重要か：すべてのAI 活用の根本は「データ理解」。
磨き方：Pandas・OpenPyXLなどの実務Python ライブラリと、ChatGPTを活用したハイブリッド分析を日常に取り入れる。

● LLM向けドキュメント整備・構造化

なぜ重要か：社内でAIを「育てる」には、いい教材（構造化知識）が必要。
磨き方：FAQ・マニュアル・トーク履歴の形式化、LangChain/RAGなど軽量ナレッジシステムの構築経験を持つ。

⸻

🧠 3.AIと共生する“思考術”

●ゼロから考える力 ×AIとの分担最適化

「AIに任せる部分／人間が考えるべき部分」を瞬時に切り分けるスキル。
課題設定力・要約力・再構成力・パターン抽出力など、「思考のフレームワーク」をAIと連携して洗練させる。

●フェイク見抜き力 ×情報編集力

今後はAIの出力を「鵜呑みにしない」「加工する」能力が必須。
ファクトチェック、情報ソースへの信頼評価、出力文の再編集などの訓練。

⸻

🎓 4.実践的な鍛え方（ロード マップ）

フェーズ	やること
①習熟	・ChatGPTの活用法（表形式出力、要約、コード生成）を極める・各業務に1つずつAI タスクを試す
②応用	・業務や趣味の中で「AIにやらせたタスク」をログとして蓄積・ツールを使い分ける力を磨く（例：翻訳はDeepL、校正はChatGPTなど）
③発信	・実践例をブログやSNSで発信（反応が学びになる）・他者の活用事例をフィードバックとともに評価する
④導入補助	・他人にAI ツールの使い方を教える・PoC（概念実証）をサポートすることで思考を外化

⸻

🧭最後に：本質は「どの技術か」ではなく「どこにどう活かすか」

AIそのものより、**人間の活動の中で「AIが何を代替／強化できるか」**を見極める眼と実行力が、最も長く通用します。

Permalink |記事への反応(1) | 16:47

ツイートシェア

■UnityやDifyをいくら触ってもプログラミングは上達しない

最近の開発環境って進化しすぎてて本当に最小限のコードを書くだけでプロダクトができる

Unityとかのゲーム開発環境なんかが良い例でトレーニングすれば1日でそこそこのゲームを作れるようになる

これは特にオープンワールド系のゲームが物量でゴリ押すようになったから人員が必要になったことが原因で

高度な開発知識なんかなくてもゲーム開発に参加できるようになってる

Difyも同じような道を歩んでいて、LLMを使った個別エージェント開発だとかRAG 対応だとかは物量でゴリ押す雰囲気が出てきていて

Difyみたいなポチポチすればエージェントが作れます、っていうツールでとにかく現場の人に作らせようとしている

（恐らくこの分野はLLMに駆逐されそうだが）

UnityにしろDifyにしろ、実際に必要となるロジックなんかは本当に最小限で済むのでオブジェクト指向だとかDDDだとかは全然必要とされていない

Unityでキャラを歩かせる場合は始点と終点を指定してNav Meshとかを設定しておけば勝手にやってくれる

で、問題なのはこの程度のコードを書いただけで「プログラミングできる」と勘違いしてしまう人が続出している点で、採用活動するとかなり多い

君たちがやってるのはせいぜいコンフィグを書いてるレベルであってプログラミングではない、と言っても理解してもらえない

試しに

「このキャラを10個のポイントからランダムに出現させて、他の10個のポイントのどこか1つに歩かせてみて」

と言ってみると分かるが、この程度の実装すらできない

逆にできる人は自分はスーパーエンジニアだと思い込んでるぐらい自信満々で面接に来る

オブジェクト指向の話をしても「そんなの必要ですか？」みたいな態度で関数も使わずにベタ書きコードを恥ずかしげも無く自慢してくる

AI 人材も似たような雰囲気が出てきていてDifyとかでチャット作って

「私は最先端のAI 人材です（ドヤァ）」

という人が段々増えてきているしこのトレンドは収まることがなさそう

AIが駆逐するのはこのレベルのプログラマーであって、もっと上位層のプログラマーは（まだしばらく）駆逐されなさそう

計算機科学や情報理論を履修してるちゃんとしたプログラマーだけが生き残っていくんだろうと思っている

Permalink |記事への反応(1) | 09:56

ツイートシェア

2025-06-09

■anond:20250609225144

お前、本当にプログラマか？

ファインチューニングじゃなくてRAGとか外部ツール(例えばWolfram)との連携で解決する問題だろ

Permalink |記事への反応(1) | 22:54

ツイートシェア

2025-06-04

■連想 能力が高く分野横断的な脳みそが最も生成AIに適合的に思うんよね

生成AIは学習した全ての言語空間の高度な確率マッピング(ただし汎用的にチューニングされてる)だから、高度な回答を求めるときに一分野を掘り下げるというより

複数分野の高度概念を有機的に結びつけることで内容を深めるアプローチが刺さりやすいように思う

確率分布の偏りを意図した方向に操作するという意味でも、一例ではなく似通った複数例を提示して、方向性を固定していくというアプローチが生成AI(LLM)の仕組みに適合的

そうやって方向性を固定したあとに、特定分野の本とか論文とかの長文テキストを投入するみたいなRAGに近いことをすると、ちゃんと内容を掘り下げられると思う

生成AIは確率分布機でしかなくて、生成AIが賢いとか間違うとかいう主観的評価にはなんの意味もなくて、どう使うかを考えないといけない

Permalink |記事への反応(0) | 00:31

ツイートシェア

2025-05-28

■ファクトチェックの研究のためにLLMを用いたopen relation extractionとかってできないんすか？あと、他になんかもっと 有用な技術とかないんすか？

ファクトチェックの研究において、LLM（大規模言語モデル）を使ったOpen Relation Extraction（OpenRE）は非常に有望です。

実際、LLMを用いたOpenREやそれに類する技術は、近年のファクトチェックの自動化・支援の研究で注目されています。以下に詳しく説明します。

LLMを用いたOpen Relation Extractionの活用 可能性

1.OpenREとは？

テキストから事前定義されていない主語・述語・目的語の関係（例: `("Japan", "has capital", "Tokyo")`）を抽出する手法。
閉じたスキーマに縛られず、未知の関係も抽出できる点がファクトチェック向き。

2. LLMによるOpenREの利点

文脈理解が深いため、従来のルールベースや小規模モデルより柔軟かつ高精度。
prompt設計により、明示的に「関係三つ組」を抽出できる（例: "Extract (subject, relation,object) triples from the sentence: ...").
英文だけでなく、日本語にも応用可能（日本語LLMや翻訳ベースのパイプライン併用）。

3.ファクトチェックでの使い道

ニュース・SNS 投稿から主張（claim）を抽出。
claimと知識ベース（例:Wikipedia, Wikidata）を比較して一致/矛盾を判定。
たとえば、「寿司は中国料理である」という文から `(寿司, は,中国料理)` を抽出し、知識ベースと突き合わせることで誤情報検出が可能。

他の有用な技術・手法（LLMやそれ以外）

A. Claim Verificationvia Retrieval-Augmented Generation (RAG)

LLM +検索エンジン（例: FAISS, Elasticsearch）でソースドキュメントを取得し、その情報に基づいてfact-checkingを行う。特にニュース記事など長文に強い。

B. Entity Linking +Knowledge Graph Reasoning

文中のエンティティをWikidataなどにリンクし、KG（知識グラフ）上でのパス推論で検証。Graph NeuralNetwork（GNN）などを併用。

C. Stance Detection（主張への立場検出）

claimに対してドキュメントが賛成・反対・中立かを分類。

D.Natural Language Inference (NLI) による真偽判定

`(premise, hypothesis)` の関係を `entailment`, `contradiction`, `neutral` に分類。高性能なNLIモデルを使えば、ファクトチェックの核にできる。

研究 観点で面白い トピック例

トピック	説明
LLM +Knowledge Graph Alignment	claimから得られる関係とKGとの自動照合。
言語間の事実整合性チェック	多言語ニュースの事実差異検出（日⇔英など）
LLMによるFact hallucination検出	LLMが生成した出力に含まれる事実誤りを検出。
Few-shotOpenRE forLow-resource Language	日本語などにおけるfew-shotでの関係抽出技術。

Permalink |記事への反応(0) | 06:08

ツイートシェア

2025-04-23

■anond:20250423070910

それあるなら諦めず応募してたら受かるだろ。もっとザコかと思ってたわ

もっとポートフォリオサイト作ってDockerやk8sやAWSやGCPやAI使ってアピールしろ。RAGやMCP サーバー構築できると良い。AWSとかの資格も取れ。あとはコード設計な。デザインパターンやれ。MVC 理解したあとDDDやれ。IT系のビジネスの本も読め。Figmaでデザイン作れ。とにかくがむしゃらに受かるまでやれば受かる。どうせ全部あとで役に立つ。AtCoder緑あるならコンパイラ作れるだろ。そういうの作ってGitHubに置け。Slackも自分で使え。bot作れ。SOLID原則理解しろ。Java以外も書け。特に TypeScript。Java分かるなら楽勝だろ。データベース勉強しろ。Nginx立てろ。プロマネの本も読め。勉強会参加してこい

あととにかくコード書け。たぶん足りん。

あと履歴書を規格通り出してないだろうな。履歴書なんかほぼ不要だから何作って何ができてどこまで知ってるか全部精密に書け。

Permalink |記事への反応(2) | 07:36

ツイートシェア

2025-02-27

■そろそろ生成AIについて語ってやる

生成AIの利用方法で、何かを生成する以外の使い方をしている場合は代替手段が必ずある

生成AIは何かを生成するのに長けてるだけであって他の用途なら他の方法がいくらでもある

RAGとか言ってるのはマジでアホでGoogleの検索ワードを作ることができないジジイの使い方

「FAQの回答をRAGにかけて回答を生成しました」

とか最高にバカくさくて、普通にQを検索してAを出力すればいい

「QがないAを作り出せるよ？」

とか言うアホがいるけど、Qが無いならそのAの精度は低くなるし

間違えた答えを出したことに対する責任を持てる企業は居ないから結局使われない

ガチガチに精度検証すると結局はQがあるかないかに落ち着いて「だったら検索すればいいだけ」になる

他にもエージェントとか言ってるのもバカらしくて、それお前ら10年ぐらいRPAとか言って取り組んでて

結局は業務整理しないと意味ないって結論になったのにまだやるの？っていうね

生成AIは人間が作ると面倒だけど大量に必要なものに使うべきで

例えばゲームのモブの台詞とかのどうでもいいけど大量に必要な物を生成するのに使う

それ以外の使い方はほぼゴミなので見る必要ないよ

Permalink |記事への反応(0) | 16:58

ツイートシェア

2025-01-31

■DeepSeekショックについて

https://anond.hatelabo.jp/20250129194915

生成AIを提供する某社で働いている。

昨今DeepSeekショックというかDeepSeekでショックを受けた顧客から色々言われるのでものを申したい。

Azure経由でChatGPT使う
GCP経由でGemini使う
AWS経由でSonnet使う

あまりにも正し過ぎる。

もうこれだけでいい。

何ならこの後は読まなくていい。補足情報を述べるだけなので。

前提として、現時点で企業利用の生成AIはその大半がLLMである。

加えて10万そこらで買えるRTX4070があればそこそこ動く画像生成AIと異なり、たとえMIT ライセンスでモデルが公開されていようと、実用性能のLLMを自前で安価にホストする手段は2025年 1月現在まだ存在しない。

クラウドでGPU インスタンスを使って小さめのモデルで60万そこら、大きいモデルで月100万そこらを払うか、H100をたくさん搭載しているサーバーの実機に1000万とか2000万払うかのいずれかになる。

ということで、トークン量課金で使用できるLLMのAPIを使うというのがコスト的な問題で現実的な落としどころとなり、各クラウドベンダーのAPIが使われている。

そうなるとテキストデータをAPI 提供元に送信しなければならない。

提供元の会社各位はそのデータの取り扱いについてかなり気を遣ったポリシーを定めていて、それを大々的に宣伝しつつ絶対守ると約束し、顧客はその会社がポリシーを守ることを信じ、その信用の下にAPIに対して機微な社内情報を含むテキストを投げ込んで社内ChatGPTだのRAGだのAgentだのいろんな取り組みをしている。

蒸留されていないDeepSeekをホストするのに必要なGPU コストは7桁円コースだし、LlamaとかQwenと組み合わせて蒸留したモデルであっても月当たり数十万が下限となる。社内すべての需要を賄うなら月当たり8桁円に行ってもおかしくない。

予算、いけます？

APIの安さを知った今、下手するとその何千倍何万倍のお金払えます？

予算が厳しくてもDeepSeekを使いたいならDeepSeek開発元が提供しているAPIを使うわけだが、中国企業に社内の機微情報を含むデータを送ることになる or 送るリスクを抱えることになる。

中国企業に対し、昨今の国際情勢および我が国の立場を踏まえた上で機微情報を送信できる程度に信用できます？

ということで現場の生成AI感度が高い人がどれだけDeepSeekを気にしたところで予算だの国際情勢だの現地法だの、ひとくくりにすれば「政治的な事情」で各社にDeepSeekを利用するという選択肢は与えられない。

それよりもまず目の前にある生成AIを使ったアプリケーションの実装や運用に集中して欲しい。

DeepSeekショックと騒ぎになっているが、これについても懐疑的である。「どうせ何も変わらない」と上述の理由で思っていることに加えて、過去の経験上深層学習の研究においてはリソース量の潤沢さこそが正義であり、リソース量で劣る者は勝る者に絶対に勝てない。

本当に絶対に勝てない。無理だ。どれだけ技巧をこらしたモデルを作っても、どれだけトリッキーな手法を考案しても、リソース量の暴力の前には倒れるのみである。というかそういう技巧とかトリッキーな手法を論文にした時点で、リソース量で勝る者はそれらを取り込みつつ追加で暴力的なリソースをモデルに注ぎ込むので勝てるわけがない。

DeepSeekの成果が本物なら、ビッグテックは検証の後にDeepSeekの100倍のリソースを注ぎ込んでDeepSeekでは到達できないような水準のモデルを作るだけである。

リソース量で劣る者が工夫を以て勝る者を倒すストーリーが好きなのは分からんでもないが、まあ現実はおおむね無情だ。

そのうち強いモデルが「信用できるクラウドベンダー」からトークン量課金のAPIとして出てくるはずだ。

元々バブルみたいな狂乱の中にあるので落ち着けとは言わないが、ひとまずちゃんと前を見ろとは言いたい。

Permalink |記事への反応(1) | 01:35

ツイートシェア

2025-01-30

■RAGの案件を受けるのはやめておけ（DeepSeekとばっちり 派生編）

コンニチハ、オイソギデスカ

思ったより読まれてたので、ブコメにも出てたRAGの話を派生編として書いておくね。

最初に結論から、RAG 案件は受けるな。（コンサルみたいにタイムチャージで儲かるなら別）

※前回もそうなんだけど、いわゆるTrap streetは直接指摘しないで二ヤ二ヤしてくれな。概要把握できないほど変なことは書いてないよ。

なんでRAG 案件は必ず炎上するのか

RAGを必要とする組織は必要なデータ運用ができておらず、必要なデータ運用ができている組織にRAGは不要だから。

まず前提からな。

RAG(Retrieval-Augmented Generation)って、要は生成AIに外部データベースを参照させるんでしょ？良くない？

その理解で正しいけど、それで営業かけるのは間違ってる。

例えば、郵便番号で考えたらわかるんだけど、郵便番号データベースを参照させて生成AI から引っ張ってくるときに問題になることはなんだ？

データが正しい必要がある

当たり前だけど、大前提ね

フォーマットが揃ってる必要がある

郵便番号なら、市区町村とか、番地枝番とか、全部統一された規格で揃ってないとね。

正しく聞く必要がある

例えば、「姉小路通柳馬場東入って何番？」は、「604-8103です」って返せるけど、

「604-8103に手紙出したいんだけど、住所書いてくれない？」で、「姉小路通柳馬場東入」と「柳馬場通姉小路下る」のどっちを普通書くよね、みたいなのは出てこない。

だって、京都に住んでる人の機嫌を損ねないための生成AIになってないもん。

話作られた時にチェックする必要がある

ありがちだけど、「本社の郵便番号って何番だっけ？」みたいなやつとかね。

存在しない番号をチェックできるなら、最初からチェック用のデータベース叩きに行かない理由がいるよね。

ここまで前提ね。

RAG 案件を阻む３つの壁

まあ、郵便番号くらいガッツリ目に世の中に存在するものだったらやりようはあるんだけど。

そもそもやりたいことが、埋もれているデータを活用したいだったりする

ドキュメントはあるんだけど、検索が大変でどこにあるかすぐ探せなくてねーみたいなやつね。

RAGには向かないです。それドキュメントのメンテできてないから。

何が正しくてどれが最新で、誰が管理しててどこまで見せて良いか管理できていないからそういうことになってる。

機密区分がガチガチな割に、フォーマットがコロコロ変更されるエクセルだったりする

このドキュメントは管理職以上にしか見せちゃダメね、これはこの部署のみ、これは部外秘、みたいな状況で散乱してたりする。

RAGには向かないです。やろうとしてることがデータ運用組織体制改善でRAGと関係なくなっちゃってるから。

データを活用したいの想像がフワフワだったりする

これはまあ余録かな。作って納品するだけだったら検修通れば良いんだもんね。

まあ、そういう要件に限ってフワフワのままゴールがフラフラして大変なことになるんだけどね。

生成AIのハル シネーション以前のところでRAGに夢見すぎてる問題

RAG入れたいっていうところ、社内全文検索エンジンとかが流行った頃に導入できてないか導入してもうまく検索できてない組織がほとんど。

そんで、そういう組織がRAGを適切に使えるようになるためには、まず全文検索エンジンでも引っ張ってこれるように整備する必要がある。

しかも、今後その組織で作られる情報全ての運用をそれに組み込まないとあっという間に陳腐化する。

その予算使って、まともなFAQ サイト作ったり、社内司書みたいな業務区分作った方が幸せになれると思うよ。

雑感（逆にRAGがハマりそうなユースケース）

多少盛ったり話を作って辻褄合わせても問題なくて、ある程度の専門性や社外秘の情報が必要で、柔軟な窓口対応を求められるところ。

社内雑談チャット bot、かな。（喫煙所の会話ができるマシーン）

これってさー、普通には予算降りないよね。社内で研究した結果の応用とかで社内発表するならまだしも外に委託する内容じゃないわな。

逆にアダルティーな感じのお店でのチャット bot 運用ならワンチャンあるかも？

まとめ

RAGの案件を受ける時は、以下の前提は必ず見ような。

情報が綺麗に整理されており、常に正しくなるよう運用が整えられている
既に横断検索は存在しており、必要な情報は今でも検索すれば出てくる
RAGを利用した結果は、必ず人間が最終チェックをして利用する

逆にいうと、これができていない組織にRAGはハマらないです。できている組織にRAGがいるかって言われると、ね。

だから、今から RAGの話が上がるような組織に対して案件を受けるのはやめておけ。

蛇足

RAGにハマる（まともな）ユースケースもあるにはあると思うよ。

膨大な社内文書が整然と揃ってるけど、利活用時には個別具体的にカスタマイズする必要があって、社員の皆さんが多大な労力を費やしている職場。

文書を検索して整形して相手に合わせてカスタマイズする業務ね。思い当たるでしょうこちらの先進医療保健特約はつけるだけでとか、ドル建て債券は非常に安定度が高くとか。

そういうところはね、その業務が金の卵だって知ってるから余程のアレな会社以外は自力で整備するよ。だから今RAGとかいう会社はみんなアレなんだ逃げろ。

（家庭内 WikiをRAGで柔軟に検索させるときに音声入出力すると未来感あるぞ（実用性があるかは人によるし儲かんないけど））

https://anond.hatelabo.jp/20250129194915

Permalink |記事への反応(1) | 14:01

ツイートシェア

■生成AI周りで勘違いされてること

生成AIは検索エンジンじゃない

生成AI（以下、すべてLLMのことを指す）はGoogleの代わりに検索してくれるものじゃないよ

あくまでも確率に基づいてありがちな答えを生成するものだよ

なので、Googleの代わりに使うのはある意味間違いだよ

検索に使うなら検索 ワードを生成させる

Googleを使いこなせる人の特徴に「検索ワードが上手い」っていうのがあるけど

生成AIはそれが得意だから、検索ワードを生成させると上手くいくよ

文章をダラダラと書いて、「なんかこんな感じで困ってるんだけど、どうやって検索していいかわからないんだよなー」っていう雰囲気を出すと、その空気を読んで良い感じの検索ワードを生成してくれるよ

本当に知りたいのは検索結果なの？

検索ワードをちゃんと作れる人は生成AIを使う必要はないかっていうとそうじゃないよ

例えばハンバーグの作り方を知りたいときに、「ハンバーグ　レシピ」って入れたらいっぱい出てくるけど、本当に知りたいのはそれじゃないよね？

本当に知りたいのは

「今、冷蔵庫には豆腐があるから豆腐ハンバーグにしたいんだけど、めんどくさいから簡単に作れる豆腐ハンバーグのレシピがいいな。あと、ナツメグはあるけどタマネギはないんだよね。豚のミンチが20gだけ余ってるからこれを混ぜてもOK」

っていう状況におけるハンバーグの作り方だよね

そんで、これをもとに「ハンバーグ　豆腐　ナツメグ　タマネギ抜き　豚ミンチ少々　簡単　レシピ」っていう検索ワード作ってドンピシャでヒットすればいいけど、ほとんどヒットしないよね（実際にやってないからヒットするかもしれん。あくまでたとえです。）

生成AIはこういうことを伝えるとちゃんと生成してくれるのが特徴なんだよね

なんで生成できるかっていうと、「豆腐ハンバーグの作り方」みたいな知識は既に学習してるし、いろんなハンバーグの作り方を学習してるから。

ただ、最新のハンバーグの作り方は知らないけど、それは検索して結果を一緒に伝えてあげれば良くて、学習した内容＋追加の情報から正解に最も確率が高そうな情報を提示してくれるよ

今の生成AI 評価結果はほとんど意味が無いよ

「こういうハンバーグを作りたい」っていう質問者の意図って前提条件なんだけど、今の生成AI 評価ははっきりした前提条件を提示したら最適な答えが出るかどうかの評価しかしてないよ（だってそれしか評価のしようが無いから）

ところが普通の主婦は上記のような前提条件をそもそも提示できないよ

なぜなら質問するときに全く頭の中にないから提示のしようがなくて

生成AIの回答を見たり質問されて初めて前提条件に気付くんだよね

こういう「そもそも質問者が前提条件を持ち合わせてない」という状況下での課題解決を目指して生成AIは作られていて

だからChatGPTはチャット形式で会話をしながら前提条件を探るようになってるんだよ

生成AIでなんかやれ

上記のことを理解できたら、「生成AIでなんかやれ」って言われたら、これまでのようにやるとダメだよね

これまでの情報処理系の施策って「何かしらの課題」に対してツールを準備して解決するっていう手順を踏んできた

ただ、生成AIが得意にしてるのは「そもそも課題が何か分からない」「課題を発見する」みたいなところなので

これまで通りのやり方をやっても意味がないよ

例えば「社内情報を回答できるチャットボット」とか意味ないからね

自然言語での質問に対して検索ワードを生成できるけど、検索結果から回答を作る意味はほとんどなくて

単に検索結果を質問者に表示してあげればいいだけだよ

RAGだとかエージェントだとか騒いでるけど本質的に前提条件が曖昧なものにしないと意味ないからね

Permalink |記事への反応(3) | 11:50

ツイートシェア

2024-11-15

■RAG サーバ 事業者としてのgoogle

って、多分考えてるよなあ

キーワードから関連するページを返すんでなく、ページ内のテキストを返すの

Permalink |記事への反応(0) | 14:08

ツイートシェア

次の25件>

Movatterモバイル変換

「RAG」を含む日記

■最近考えていること

■ハルシネーションが起こる理由

ハルシネーションって何？

なんで起こるの？ 主な原因はこれ！

1.学習データのクソ問題（偏りや古さ、不十分さ）

2.モデルの構造や学習の仕方のミス

3.ユーザーの質問の仕方（プロンプトの曖昧さ）

対策はどうする？

■参議院選挙でAIを活用して投票先を決めた人、決めようと思ってる人へ

★すでに始まっている「AI向け政治情報戦」の実例と兆候

★LLMに対する“仕込み”の基本構造

★実際にやっていそうな勢力（実名は伏せますが…）

★ “ChatGPT対策チーム”を持つ候補者が、これからの選挙では勝ちます。

【アメリカ】民主党 vs共和党

【日本】立憲民主党 vs日本維新の会・共産党

【中国】共産党に関する記述

★総括：AIはどのように“片寄る”のか？★

この文章で言いたいこと

■LLMの知識が1年前で止まってるし、本質を見誤ってる人

■AIが技術的に根本から全く使えない3つの理由

① LLM言語モデルの本質：意味理解ではなく「統計予測」、プログラミングに使えるというのは全く嘘、技術的背景から考えても二度手間になるだけ

わかりやすい例で言えば「私はコーヒーを」という文を書いたらAIはこう判断して動いている

意味理解や構文チェックをしているわけではない、だからこんな問題が頻発する。

もっと致命的な問題はこれ↓

ちなみに↓がAIに書かせたコードの1例、

② AI最大の欠点、ハルシネーション これは永遠に解決ができないメビウスの輪

【検証システムとのハイブリッド…いわゆる「RAG」】

③ 文化的偏在（Cultural Bias）

【滅茶苦茶一部の人間にしか刺さらない罵詈雑言】

【それ以外にも世界的にこんな問題がある】

【AI信者が陰謀論者になるという本末転倒】

AIは確かに便利だが、既存技術でしかないし、既存技術の延長線上にはなれないし、技術的ブレイクスルーにもならない

■粉飾決済だ！と叩かれてるAIスタートアップが、ChatGPTのAPI叩いてるだけのラッパーだ！って叩かれてるが。日本のAIレベル自体がもう地に落ちてるよね。

■おじさんなのでプライベートRAGが欲しい

■「メールを送るだけ」でAI悪用攻撃可なMicrosoft 365 Copilotの脆弱性

■今後長期にわたって通用する「AIの実用・活用・応用スキル」を磨く

🔧 1.AIと業務・生活を橋渡しするスキル群

📊 2.実用的なAIデータハンドリングスキル

🧠 3.AIと共生する“思考術”

🎓 4.実践的な鍛え方（ロードマップ）

🧭最後に：本質は「どの技術か」ではなく「どこにどう活かすか」

■UnityやDifyをいくら触ってもプログラミングは上達しない

■連想能力が高く分野横断的な脳みそが最も生成AIに適合的に思うんよね

■ファクトチェックの研究のためにLLMを用いたopen relation extractionとかってできないんすか？あと、他になんかもっと有用な技術とかないんすか？

LLMを用いたOpen Relation Extractionの活用可能性

1.OpenREとは？

2. LLMによるOpenREの利点

3.ファクトチェックでの使い道

他の有用な技術・手法（LLMやそれ以外）

A. Claim Verificationvia Retrieval-Augmented Generation (RAG)

B. Entity Linking +Knowledge Graph Reasoning

C. Stance Detection（主張への立場検出）

D.Natural Language Inference (NLI) による真偽判定

研究観点で面白いトピック例

■そろそろ生成AIについて語ってやる

■DeepSeekショックについて

■RAGの案件を受けるのはやめておけ（DeepSeekとばっちり派生編）

なんでRAG案件は必ず炎上するのか

RAG(Retrieval-Augmented Generation)って、要は生成AIに外部データベースを参照させるんでしょ？良くない？

データが正しい必要がある

フォーマットが揃ってる必要がある

正しく聞く必要がある

話作られた時にチェックする必要がある

RAG案件を阻む３つの壁

そもそもやりたいことが、埋もれているデータを活用したいだったりする

機密区分がガチガチな割に、フォーマットがコロコロ変更されるエクセルだったりする

データを活用したいの想像がフワフワだったりする

生成AIのハルシネーション以前のところでRAGに夢見すぎてる問題

雑感（逆にRAGがハマりそうなユースケース）

まとめ

■生成AI周りで勘違いされてること

生成AIは検索エンジンじゃない

検索に使うなら検索ワードを生成させる

本当に知りたいのは検索結果なの？

今の生成AI評価結果はほとんど意味が無いよ

生成AIでなんかやれ

■RAGサーバ事業者としてのgoogle

なんで起こるの？主な原因はこれ！

2.モデルの構造や学習の仕方のミス 

★ “ChatGPT 対策チーム”を持つ候補者が、これからの選挙では勝ちます。

②　AI最大の欠点、ハルシネーション　これは永遠に解決ができないメビウスの輪

③　文化的偏在（Cultural Bias）

【AI 信者が陰謀論者になるという本末転倒】

■粉飾決済だ！と叩かれてるAI スタートアップが、ChatGPTのAPI叩いてるだけのラッパーだ！って叩かれてるが。日本のAI レベル自体がもう地に落ちてるよね。

■おじさんなのでプライベート RAGが欲しい

■「メールを送るだけ」でAI 悪用攻撃可なMicrosoft 365 Copilotの脆弱性

📊 2.実用的なAI データハンドリングスキル

なんでRAG 案件は必ず炎上するのか

RAG 案件を阻む３つの壁

今の生成AI 評価結果はほとんど意味が無いよ

■RAG サーバ事業者としてのgoogle