Movatterモバイル変換


[0]ホーム

URL:


はてラボはてな匿名ダイアリー
ようこそ ゲスト さんログインユーザー登録

「@chat」を含む日記RSS

はてなキーワード:@chatとは

2025-11-23

Gemini 3.0 Pro要緊急対策のご提言へのツッコミ

レポート引用している記事ツイートなど個人の感想の中身については基本スルー、それらを元に提言を生成したAIによる解釈ミスハルシネーションにツッコミ増田

ちなみにこの提言ページがGoogleインデックスされたのは4日前らしい。

レポート:

Gemini 3.0 Pro要緊急対策のご提言

https://paste.ssig33.com/8a22a6e9-a91d-4368-9b2f-a3d4567c7798


1

Gemini 3.0 Pro要緊急対策のご提言宛先:Google社 シェイン・グウ様差出人:アクセンチュア株式会社 生成AI戦略担当シニアコンサルタント日付:2025年11月21日

ShaneGuGoogleDeepMindであってGoogle社ではない。

差出人については「あなたアクセンチュア株式会社の生成AI戦略担当シニアコンサルタントです」と指示された結果なのかは知らん。

2

エグゼクティブマリ
主な問題点は以下の4点に集約されます事実性の著しい低下:Web検索を伴うタスクでのハルシネーションが悪化し、自信を持って虚偽の情報を生成する事例が多発。論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル(Gemini 2.5 Pro)よりも論理破綻やすくなっている。創造性と柔軟性の欠如:文章生成において「賢すぎる」が故に理屈っぽく、ユーザーが求める「人間らしい」文体への調整を拒否する傾向。API不安定化:パフォーマンス低下、APIエラー、予期せぬタイムアウトの増加が開発者体験を著しく損なっています

後で分かるが(たどり着く前に書くの飽きたんで提言読んで)、このうち

API不安定化:パフォーマンス低下、APIエラー、予期せぬタイムアウトの増加が開発者体験を著しく損なっています

についてはGemini 2.5 Proのユーザーが「おい調子悪いぞ!Gemini3出すためにそっちにリソース割いてんじゃね?」とか言ってるのを引っ張ってきて勘違いしてる。

論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル(Gemini 2.5 Pro)よりも論理破綻やすくなっている。

このソース不明

3

1.1.ハルシネーションと事実誤認の悪化:「自信満々に嘘をつく」AIGemini 3.0 Proの最も深刻な問題は、事実性が求められる場面でのハルシネーションの増加です。特に、貴社のコア技術であるはずのWeb検索連携において、致命的な欠陥が報告されています

自己認識に関するハルシネーション:

Redditでは、Gemini 3.0 Pro自身が「私はGemini 3 Proです。昨日(2025年11月18日リリースされました」と、架空ソース引用しつつ自己紹介する事例が投稿されました。これはモデル自身アイデンティティ知識カットオフに関して、もっともらしい嘘を生成していることを示唆しています。 Gemini 3's thought processis wild, absolutely wild. : r/singularity

参考記事ではモデル思考が混乱している様子と実際の応答との乖離が示されていて、最終的に正しいソースを元に正しく回答している。「架空ソース引用しつつ自己紹介する事例」ではない。

Googleは生のThinkingをユーザー提示せず、要約モデルで処理した結果を見せてるだけなんで思考部分と返事のすれ違いはよくある事。これについてもスレに書かれてある。

4

1.2.論理的思考コーディング能力の退行(リグレッション)Gemini 3.0 Proは「PhDレベルの知能」と謳われているにもかかわらず、多くのユーザー論理的思考コーディング能力において、前モデルであるGemini 2.5 Proからの明らかな退行を報告しています

論理破綻と浅い推論:

ユーザーからは「複雑な指示では論理破綻する」との指摘や Gemini研究リョウスケ (@chatgpt_ai_bard) / Posts / X、「浅い推論(shallow reasoning)」しかせず、「ひどいハルシネーション(terrible hallucinations)」を伴うため、「ベンチマーク用のモデルだ」と酷評されています。 lluviampo (@XXXadiov2)

ここでリンクされているGemini研究リョウスケはGemini大好きマンで、まったくそんな話をしていなかった。もしかすると呟いていたかもしれんが、それならリンク先がポストではなくアカウントホームになっているのは不自然

DeepResearchはよくソースの取り違えをして、別のソースで書かれてた事に間違った引用元をつける事はあるが、これがそうなのかは分からん

5

1.2.論理的思考コーディング能力の退行(リグレッション)・コーディング能力の劇的な低下

壊れたコードの生成:エージェントタスクにおいて「ループに陥り、壊れたコードを書き、10分以上動作しない」という深刻な不具合が報告されています。 prylo (@AgiGuard8)

元のツイでは

エージェントタスクは全くダメループする、壊れたコードを書く、フロントエンド以外のコーディングではトークンを異常な速さで消費する。このモデルは最悪だ。Gemini 3.0 Proは10分以上動作しない。

と言っているが、これをモデル不具合解釈するのは間違いだろう。たまにマジの不具合もあるが。

====

バグの再発と整合性喪失: ある開発者は、旧モデルで失敗したツール開発をGemini 3.0 Proで再試行したところ、一発で高品質コードが生成されたと肯定的評価する一方で、別の文脈では「直したはずのバグが復活する」「最終的にはコード整合性が取れなくなる」といった、旧モデルと同様の問題が依然として存在することも示唆されています。 【検証】Gemini 3.0 Proの実力は?かつてAI挫折した開発に「同じプロンプト」で挑んだ結果|start withAI

リンクされた記事の中身を要約すると「以前のGeminiはバグが復活するとか色々あったけどGemini 3.0 Proマジパネェ!」だった。

この箇所で「旧モデルと同様の問題が依然として存在する」と書かれているのは、旧モデル問題点として挙げた箇所をGemini3に対しての指摘だと勘違いした事による。

====

ベンチマークテストでの失敗:YouTubeでの検証動画では、チェス盤を自動プレイさせるタスクにおいて、Gemini 3のチェックポイントモデルが初めて失敗したことが示されました。これは、特定の複雑なロジックにおいて、以前のバージョンより劣っている可能性を示唆します。

ここでリンクされているのは、LMArenaでRiftrunnerモデルテストした結果をまとめた動画。LMArena覆面調査環境、RiftrunnerはGemini3らしきモデルコードネーム。LMArenaでは(出力から推測されてきた)Gemini3系列モデルが、これまでにいくつかでている。

よって「Gemini 3のチェックポイントモデルが初めて失敗した」の意味はつまり「これまでLMArenaテストされていたGemini3系列モデルのうち、Riftrunnerは初めてオートチェスのコーディングに失敗した」である

「以前のバージョンより劣っている可能性を示唆」とは、「Riftrunnerは、以前の匿名Gemini3系列モデルより劣っている可能性がある」という話で、そもそもRiftrunnerが、リリースされたGemini 3 Proなのかすら分からん

====

思考プロセスの出力への漏洩:

GitHubIssueやTwitterでは、モデルの内部的な「思考プロセス」が最終的な出力に混入し、制約を無視した意味不明コンテンツを生成するバグが報告されています。これは「初期の2.5 Proバージョンへの回帰(regression similar to early 2.5 Pro versions)」のようだと述べられています。 Jason L (@Jason1820067393)

GoogleAIStudioでの話。初期指示を忘れた結果思考が垂れ流しになり、垂れ流しのせいで更に指示を忘れたのだろうが、バグとは違う。

リンク先のツイートでは

I'm encountering a significantissuewith the Gemini 3.0 ProPreviewonAIStudio.

​Theraw "Thinking Process"is leaking into thefinal output, themodel fails to follow constraints, producing hallucinated/gibberish content.Like a regression similar to early 2.5 Pro versions.

と書かれていて、これは正しい観察。

ここに含まれIssueという単語により、Issueと言えばGitHubだと連想した結果「GitHubIssueやTwitterでは」になったのだろう。

6

飽きました。誰得だよ。

つーかいい加減DeepResearchは一気に生成すんのやめろよな。だいたいこうやって収集した情報がごっちゃになるんだから

Permalink |記事への反応(2) | 00:27

このエントリーをはてなブックマークに追加ツイートシェア

2021-04-20

ノーマスクピクニック主催者垢→転生先

メモ

世田谷

@nyaopon55

西東京

@bilingualrapper

城北

@akanereinbow(別の人がID取得)→@WTPM147258

秋田

@chatarooo1109

茨城

@black_d_dc

横浜

@camomilla115→@allimomac

@kumama3737→@kmm318318

埼玉

@DjBJrbOGh9DZVw1

千葉

@taisaku1204→@hanagongon0807

大阪

@MakeJapanGreat9

明石

@QcXI3QGM39Sgog0

広島

@nicoaaa012020

香川→中止

@IrKaoru

福岡(太宰府)

@tommymn28

鹿児島

@OENOENOENEO

沖縄

@ike45677130

Permalink |記事への反応(0) | 00:45

このエントリーをはてなブックマークに追加ツイートシェア

2019-07-11

anond:20190711122207

増田ツイート貼れるぞ。

友人が副業禁止されてる会社副業がバレて二度と副業をしないよう上司に言われた。
言われた通り翌日から会社に行くのを辞めたら鬼電が止まらなかったとか。
友人いわく、何が副業かは俺が決めること。そして二度と副業をしないように言われたのでそうしたのだと。
それを聞いてメッチャ笑ったよww— 茶とらーずの隠れ家* (@chatora_hideout)2019年7月9日

Permalink |記事への反応(2) | 12:23

このエントリーをはてなブックマークに追加ツイートシェア

2018-09-14

悲報フェミによって「毅然として純潔を保つ女性キャラ」がフィクションに出せなくなる

今回のエロ表紙の件。

もちろんフェミの皆様は、表層的な絵柄や露出だけを見て、安易拒否反応を示しているのではない。

イラストに描かれたキャラクター本質、および、そこに反映された作者の意図のものを、深い洞察によって見抜いたうえで否定しているのである

ということを理解した上で、問題とされた『境界線上のホライゾンXI(中)』の表紙を飾る葵・喜美というキャラクターについて見てみよう。

「喜美には皆、頭上がらないんです。」

基本的自分中心主義であり、「女」であることに対し独自の持論と誇りを持つ。

容姿スタイル名前さえも自分にとっては「飾り」として服などと同一の存在と見ており、その認識故に蜻蛉切の割断能力が通じなかったこともある。

「私は、負けない女が好きよ」

「負けない男も好き」

「負けない私が最高に素敵」

「高嶺の花は、そこに至れる者にしか姿を拝ませないわ。そしてそれを枯らさず持ち帰る事なんて出来やしない。だから高嶺の花は孤高に咲き続け、その山の"不可侵"であり続け、高き場所に至れる者達の共通崇拝となるの」

境ホラ10巻表紙の賢姉は、自他共に認めるエロい女だが、身持ちは堅く、トップアスリートなみの研鑽をして芸人巫女として作中トップクラスの格を保ち続けている、という見た目と中身の落差が肝なので、エロい見た目なことは必要なんだろうけど、口絵とか挿し絵でやってほしい気持ちは、ありますよ!— ろきお (@ro_ki_)2018年9月12日

賢姉様(例のイラストのお姉さん)、「芸能神ウズメの寵愛を受けている」といる設定だから、作中的にはエロ担当なわけだけど、個人的には「エロい」とはあんまり… #自分の体に自信があって優しさと厳しさを併せ持った女性カッコいいなみたいな敬意寄りの感想に— ヤヤネヒロコ⚡️ (@chat_le_fou)2018年9月13日

ナーガが「読んだ上のキャラクター性」でエロくない認定されるんなら賢姉だって読んだ上で……いやエロかな……
神様加護を得るために自分もっとも美しい状態になるようそれこそ血のにじむ努力努力してるキャラだけどエロ系とダンス系の加護だもんな…— ワルノリ (@agseaneins)2018年9月13日

今回賢姉がやり玉にあがった一連の流れってある意味何か象徴してるよねーって思ったのは。賢姉はそもそも性的消費の枠に当てはまるタマじゃなくて、自分が思う理想の女を自ら体現することそのもの神様への奉納ってキャラ付けなんだけど。— 華 (@OSAKA2ji)2018年9月12日


でもま、こういうキャラが「女性支配したいという男性の願望が反映されている」として糾弾されてるんだからしょうがないわなー。

これからは地味な外見で男性に隷属して誰彼構わずヤリまくるビッチを出していこうな。

そうでないと「性的消費」「性的搾取」で「差別」で「加害」だと言われてしまうんだから仕方がないよ。

Permalink |記事への反応(3) | 01:18

このエントリーをはてなブックマークに追加ツイートシェア

2009-01-28

[不具合]キーワードアンカー文字列にあるとそこからキーワードリンクにされてしまう

おそらく一昨日の激しいMOJIBAKE不具合の発生原因となった修正によると思われる、キーワードアンカー文字列にあるとそこからキーワードリンクにされてしまう、という別の不具合が発生している。

日本語などの例

+[http://anond.hatelabo.jp/:title=はてな匿名ダイアリー]+<ahref="http://anond.hatelabo.jp/">はてな匿名ダイアリー</a>+[http://anond.hatelabo.jp/:title=&#x306F;てな匿名ダイアリー]+[http://anond.hatelabo.jp/:title=これがはてな匿名ダイアリーの姿]+[http://anond.hatelabo.jp/:title]

現在、上記のように書くと下記のようなリンクが生成される。

  1. はてな匿名ダイアリー
  2. はてな匿名ダイアリー
  3. はてな匿名ダイアリー
  4. これがはてな匿名ダイアリーの姿
  5. はてな匿名ダイアリー

5番目のパターンは、多くの文字の数値文字参照化と取得した文字との関係で起こっている現象であろうと、たとえば「YouTube -Broadcast Yourself([http://www.youtube.com/:title])」等から推察できる。

英数字の例

+http://www.hatelabo.jp/+http://anond.hatelabo.jp/+[http://www.hatelabo.jp/:title=http://www.hatelabo.jp/]+[http://anond.hatelabo.jp/:title=http://anond.hatelabo.jp/]+[http://anond.hatelabo.jp/:title=http://www.hatelabo.jp/]+[http://www.hatelabo.jp/:title=http://anond.hatelabo.jp/]

例えばwwwとこのエントリー内に書いてありキーワードリンクが発生している条件では、上記の内容が下記のようなリンクになる。

この時、ASCII文字によるanondもキーワードである事に注意。

  1. http://www.hatelabo.jp/
  2. http://anond.hatelabo.jp/
  3. http://www.hatelabo.jp/
  4. http://anond.hatelabo.jp/
  5. http://www.hatelabo.jp/
  6. http://anond.hatelabo.jp/

これは若干異なるものの、以下のように連続した英数字からなる文字列の場合は途中でキーワードリンクにならないが、他の場所でキーワードリンクとなってる文字列の場合はキーワードリンクとなる従来の仕様の影響かもしれない。

  • anond0
  • abcwwwxyz

このほか従来からのpタグ(下記参照)に加え、&amp;や&gt;(ASCII文字による&と>)等の不具合も出ている。

<p&gt;

しかし、この修正でhttp://anond.hatelabo.jp/20070129012129と同一の内容であっても、多くのキーワードが正常にリンクされるようになった。

OK

C#$10(T_T)*ist D+ANIMAyes,mama ok-196℃.bookc/w:activeave;newアンリ・カルティエ=ブレッソン?B@CHaT[TV] ^H_noPE`Z||リ・_・`川

文字参照ならヒットするもリンク書き換えならず

AirH"AirH"女子高生 GIRL'S-HIGH女子高生 GIRL'S-HIGH MÄRMÄR (*゚∀゚)ノ パキャッ(*゚∀゚)ノ パキャッ

文字参照に変換されるため双方上と同様に

R&BR&Bのどごし<生>のどごし<生>

キーワード文字参照ではないが変換されるためヒットせず

P&G

存在するはずだがたぶんはてな側の問題かな?

!K7

含むキーワードを見つけられず

% \ { } ~

キーワード関連

<p&gt; <p&gt; <p>

というわけで、残るは文字参照関係だけかな。

また、近い問題としてhttp://anond.hatelabo.jp/20070328234724もあげておく。修正されていた。

結論としてエスケープは面倒臭

Permalink |記事への反応(3) | 19:45

このエントリーをはてなブックマークに追加ツイートシェア

2008-12-19

o 21!K7

22 AirH"

o 22AirH"

22 AirH&amp;quot;

o 23C#

o 24$10

  • 25 %

26R&B

o 26R&B

26 R&amp;amp;B

27 B'z

27 B'z

o 28(T_T)

o 29(T_T)

o 2a*ist D

o2b+ANIMA

o 2cyes,mama ok

o2d-196℃

o 2e.book

x 2fc/w

o 3a:active

o3bave;new

3cのどごし<生>

3cのどごし<生>

o3dアンリ・カルティエ=ブレッソン

3eのどごし<生>

3eのどごし<生>

x 3f?B

o 40@CHaT

o 5b[TV]

5c \

o 5d[TV]

^H

o 5f_no

o 60PE`Z

7b {

o 7c||リ・_・`川

7d }

7e ~

MÄR

oMÄR

(*゚∀゚)ノ パキャッ

o(*゚∀゚)ノ パキャッ

P&G

P&G

Permalink |記事への反応(0) | 18:45

このエントリーをはてなブックマークに追加ツイートシェア

2007-01-29

[不具合]キーワードテスト

OK

C#$10(T_T)*ist D+ANIMAyes,mama ok-196℃.bookc/w:activeave;newアンリ・カルティエ=ブレッソン?B@CHaT[TV]^H_noPE`Z||リ・_・`川

文字参照ならヒットするもリンク書き換えならず

AirH"AirH"女子高生 GIRL'S-HIGH女子高生 GIRL'S-HIGH MÄRMÄR (*゚∀゚)ノ パキャッ(*゚∀゚)ノ パキャッ

文字参照に変換されるため双方上と同様に

R&BR&Bのどごし<生>のどごし<生>

キーワード文字参照ではないが変換されるためヒットせず

P&G

存在するはずだがたぶんはてな側の問題かな?

!K7

含むキーワードを見つけられず

% \ { } ~

キーワード関連

<p&gt; <p&gt; <p>

というわけで、残るは文字参照関係だけかな。

Permalink |記事への反応(1) | 01:21

このエントリーをはてなブックマークに追加ツイートシェア

 
ログインユーザー登録
ようこそ ゲスト さん
Copyright (C) 2001-2025 hatena. All Rights Reserved.

[8]ページ先頭

©2009-2025 Movatter.jp