
はてなキーワード:トチとは
https://anond.hatelabo.jp/20170220200253
我が家は仕事の都合で夫婦ともに専用のパソコンを所有しており、今までは私か夫のパソコンを借りるという形で利用させていた
子供にパソコンを買い与える事自体はうちの教育方針として別に問題ないのだが、さすがに家電量販店で十数万円で売ってるような高額なものは家計に響く
そこで、ネット閲覧程度を想定した、最低限の性能で安価な物を来月の誕生日プレゼントに検討しようと思っていのだが、何をトチ狂ったのか夫が翌日いきなりパソコンを買ってきた
それは数千円で中古屋で買ってきたという、何年も前のモデルのThinkpadだった
そして無償配布されてるLinuxか何かをインストールし、息子にドヤ顔で「さあ、お望みのパソコンだぞ!」と渡した
当たり前だが、息子は全く喜んでいなかった
夫の熱心な指導もあって、一応ネットを閲覧する程度の事は出来るようになっていたが、息子は相変わらず私のパソコンを使いたがった(夫は『もうパソコンは持ってるだろう?』と取り合わなかった)
そんなこんなで、翌月の誕生日を迎えた頃には息子はパソコンにあまり触れなくなり、私のパソコンを借りる事も少なくなっていった(Thinkpadは埃を被っていた)
これはまずいと思い「そのうちちゃんとした新品のノートパソコンを買ってあげるから」と言い、当初の予算よりも少しオーバーしたものを買い与えた
相手が傷つくからとかもそうだが、一番は自分の認知が歪んでしまうことだ
今はSNSのいいねで簡単に自分の意見が可視化できるようになっている
そのため、SNSで愚痴と称して誹謗中傷を繰り返すうちに自分へのいいね(報酬刺激)が他者への怒り、イライラになってしまい、無意識にイライラするコンテンツを探してしまう
そうしていくうちに怒りのハードルが下がっていき、何でもないことで烈火の如く怒る化け物ができあがる
・睡眠不足
・栄養失調
だと考えている
要するに脳みそがエネルギー不足だとイライラしやすい、ちゃんと飯食って寝よう
実を言うと私もその1人だった、当時は就活や試験勉強プラス生活リズムがめちゃくちゃだったので、ありえない事でキレてた(ちなみに一番意味の分からないキレ方をしたのはある絵師さんが描いたオタクに優しいギャルの絵でトチ狂ってた、なんで?)
誹謗中傷なんてみんなやってるだろって思ってて、暇つぶしであにまん掲示板を荒らしたこともある。スレ主に対して攻撃的なレスを仕掛けたこともあり、スレ爆破までさせてしまって今も後悔している、申し訳ない
誹謗中傷をしている人は暇人か、充実してない人と言えば間違ってはいないとは思う
レポートが引用している記事やツイートなど個人の感想の中身については基本スルー、それらを元に提言を生成したAIによる解釈ミスやハルシネーションにツッコミ増田。
ちなみにこの提言ページがGoogleにインデックスされたのは4日前らしい。
レポート:
https://paste.ssig33.com/8a22a6e9-a91d-4368-9b2f-a3d4567c7798
Gemini 3.0 Pro要緊急対策のご提言宛先:Google社 シェイン・グウ様差出人:アクセンチュア株式会社 生成AI戦略担当シニアコンサルタント日付:2025年11月21日
ShaneGuはGoogleDeepMindであってGoogle社ではない。
差出人については「あなたはアクセンチュア株式会社の生成AI戦略担当シニアコンサルタントです」と指示された結果なのかは知らん。
エグゼクティブサマリー
主な問題点は以下の4点に集約されます。事実性の著しい低下:Web検索を伴うタスクでのハルシネーションが悪化し、自信を持って虚偽の情報を生成する事例が多発。論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル(Gemini 2.5 Pro)よりも論理が破綻しやすくなっている。創造性と柔軟性の欠如:文章生成において「賢すぎる」が故に理屈っぽく、ユーザーが求める「人間らしい」文体への調整を拒否する傾向。APIの不安定化:パフォーマンス低下、APIエラー、予期せぬタイムアウトの増加が開発者体験を著しく損なっています。
後で分かるが(たどり着く前に書くの飽きたんで提言読んで)、このうち
についてはGemini 2.5 Proのユーザーが「おい調子悪いぞ!Gemini3出すためにそっちにリソース割いてんじゃね?」とか言ってるのを引っ張ってきて勘違いしてる。
論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル(Gemini 2.5 Pro)よりも論理が破綻しやすくなっている。
1.1.ハルシネーションと事実誤認の悪化:「自信満々に嘘をつく」AIGemini 3.0 Proの最も深刻な問題は、事実性が求められる場面でのハルシネーションの増加です。特に、貴社のコア技術であるはずのWeb検索連携において、致命的な欠陥が報告されています。
Redditでは、Gemini 3.0 Pro自身が「私はGemini 3 Proです。昨日(2025年11月18日)リリースされました」と、架空のソースを引用しつつ自己紹介する事例が投稿されました。これはモデルが自身のアイデンティティと知識のカットオフに関して、もっともらしい嘘を生成していることを示唆しています。 Gemini 3's thought processis wild, absolutely wild. : r/singularity
参考記事ではモデルの思考が混乱している様子と実際の応答との乖離が示されていて、最終的に正しいソースを元に正しく回答している。「架空のソースを引用しつつ自己紹介する事例」ではない。
Googleは生のThinkingをユーザーに提示せず、要約モデルで処理した結果を見せてるだけなんで思考部分と返事のすれ違いはよくある事。これについてもスレに書かれてある。
1.2.論理的思考とコーディング能力の退行(リグレッション)Gemini 3.0 Proは「PhDレベルの知能」と謳われているにもかかわらず、多くのユーザーが論理的思考やコーディング能力において、前モデルであるGemini 2.5 Proからの明らかな退行を報告しています。
ユーザーからは「複雑な指示では論理が破綻する」との指摘や Gemini研究@リョウスケ (@chatgpt_ai_bard) / Posts / X、「浅い推論(shallow reasoning)」しかせず、「ひどいハルシネーション(terrible hallucinations)」を伴うため、「ベンチマーク用のモデルだ」と酷評されています。 lluviampo (@XXXadiov2)
ここでリンクされているGemini研究@リョウスケはGemini大好きマンで、まったくそんな話をしていなかった。もしかすると呟いていたかもしれんが、それならリンク先がポストではなくアカウントのホームになっているのは不自然。
DeepResearchはよくソースの取り違えをして、別のソースで書かれてた事に間違った引用元をつける事はあるが、これがそうなのかは分からん。
1.2.論理的思考とコーディング能力の退行(リグレッション)・コーディング能力の劇的な低下
壊れたコードの生成:エージェントタスクにおいて「ループに陥り、壊れたコードを書き、10分以上動作しない」という深刻な不具合が報告されています。 prylo (@AgiGuard8)
元のツイでは
エージェントタスクは全くダメ、ループする、壊れたコードを書く、フロントエンド以外のコーディングではトークンを異常な速さで消費する。このモデルは最悪だ。Gemini 3.0 Proは10分以上動作しない。
と言っているが、これをモデルの不具合と解釈するのは間違いだろう。たまにマジの不具合もあるが。
====
バグの再発と整合性の喪失: ある開発者は、旧モデルで失敗したツール開発をGemini 3.0 Proで再試行したところ、一発で高品質なコードが生成されたと肯定的に評価する一方で、別の文脈では「直したはずのバグが復活する」「最終的にはコードの整合性が取れなくなる」といった、旧モデルと同様の問題が依然として存在することも示唆されています。 【検証】Gemini 3.0 Proの実力は?かつてAIが挫折した開発に「同じプロンプト」で挑んだ結果|start withAI
リンクされた記事の中身を要約すると「以前のGeminiはバグが復活するとか色々あったけどGemini 3.0 Proマジパネェ!」だった。
この箇所で「旧モデルと同様の問題が依然として存在する」と書かれているのは、旧モデルの問題点として挙げた箇所をGemini3に対しての指摘だと勘違いした事による。
====
ベンチマークテストでの失敗:YouTubeでの検証動画では、チェス盤を自動プレイさせるタスクにおいて、Gemini 3のチェックポイントモデルが初めて失敗したことが示されました。これは、特定の複雑なロジックにおいて、以前のバージョンより劣っている可能性を示唆します。
ここでリンクされているのは、LMArenaでRiftrunnerモデルをテストした結果をまとめた動画。LMArenaは覆面調査環境、RiftrunnerはGemini3らしきモデルのコードネーム。LMArenaでは(出力から推測されてきた)Gemini3系列モデルが、これまでにいくつかでている。
よって「Gemini 3のチェックポイントモデルが初めて失敗した」の意味はつまり「これまでLMArenaでテストされていたGemini3系列モデルのうち、Riftrunnerは初めてオートチェスのコーディングに失敗した」である。
「以前のバージョンより劣っている可能性を示唆」とは、「Riftrunnerは、以前の匿名Gemini3系列モデルより劣っている可能性がある」という話で、そもそもRiftrunnerが、リリースされたGemini 3 Proなのかすら分からん。
====
GitHubのIssueやTwitterでは、モデルの内部的な「思考プロセス」が最終的な出力に混入し、制約を無視した意味不明なコンテンツを生成するバグが報告されています。これは「初期の2.5 Proバージョンへの回帰(regression similar to early 2.5 Pro versions)」のようだと述べられています。 Jason L (@Jason1820067393)
GoogleAIStudioでの話。初期指示を忘れた結果思考が垂れ流しになり、垂れ流しのせいで更に指示を忘れたのだろうが、バグとは違う。
I'm encountering a significantissuewith the Gemini 3.0 ProPreviewonAIStudio.
Theraw "Thinking Process"is leaking into thefinal output, themodel fails to follow constraints, producing hallucinated/gibberish content.Like a regression similar to early 2.5 Pro versions.
と書かれていて、これは正しい観察。
ここに含まれるIssueという単語により、Issueと言えばGitHubだと連想した結果「GitHubのIssueやTwitterでは」になったのだろう。
飽きました。誰得だよ。
つーかいい加減DeepResearchは一気に生成すんのやめろよな。だいたいこうやって収集した情報がごっちゃになるんだから。
付き合ってるとかじゃないんだ
言っとくけど
だから
僕が電話しても
勘違いしないでほしいんだ 両想いになったなんて
付き合ってるとかじゃないんだ ほんとに
そりゃあ君には逢いたいけど
もう一度言っとく
君が思ってるほどのことじゃないんだよ
いちいち騒がないでくれるかな
友達に僕たちのこと しゃべったりしないでくれよ
付き合ってるとかじゃないんだ ほんとに
待ちぼうけでいいの?
君の写真?
部屋に貼ってるけど
あれ、壁の汚れたところ隠すのに ちょうどいいんだ
だから
返してって言われてもね
付き合ってるとかじゃないんだ ほんとに
付き合ってるとかじゃないんだ ほんとに
付き合ってるとかじゃないんだって
アントンってのは映画「ハミングバードプロジェクト」に出てくるプログラマーで、特定のアルゴリズムだけは超一流。
だが、それ以外の領域に足を踏み入れると致命的に無能で、物理学の話を振られたら「ニュートリノ通信で株取引が加速する!」とか真顔でトチ狂ったことを言い出す。
で、俺もそっち側に片足突っ込んでる。
どういうことかと言うと、世間の連中が熱心に語ってる政治経済の話が、ことごとく俺にはバカ騒ぎにしか見えないんだよ。
「円安は輸出企業の追い風!」「スパイ防止法で国防強化!」「積極財政で刷りまくれ!」そういうの聞くと、マジで理解不能。
だってさ、マネーサプライを増やせば通貨価値が落ちるのは自明だろ。
そもそもマクロ経済学なんてパレート改善だの補償原理だの机上の空論ばっかで、現実は「誰が得して誰が損するか」のパイ取り合戦だろ?
だったら全員で血眼になって勉強する意味あるのか?ただのポジショントークの知識マウントにしか見えねぇんだわ。
効用の最大化とか利潤の最適化、そういうミクロ経済なら俺もわかる。
数理的に完結してるし、100年後も正しい。
だがマクロは違う。そいつの政治的立場と利権でいくらでも「正しさ」がねじ曲がる。
そんなもんに労力つぎ込んで「学んでます」ヅラするやつら、俺から見りゃただの茶番芸人。
さらに言えば、CIAがどう政権を裏で操ってたか?男女論だのフェミだのポリコレだの?
誰が勝とうが俺の生活コストに一円も直結しねぇ話に、なんで俺が時間削って関心持たなきゃならんのよ。
俺は俺の仕事と生活を成立させるために必要な領域だけ研ぎ澄ませばいい。
結果、俺はアントンに似てきた。
たまたまネットサーフィンしてて知ったんだけど、あの昇降デスクで有名なFlexiSpotがオフィスチェアも作ってるらしい
https://oshanavi.com/flexispot-c7morpher/29270/
よくね?
最上位モデルでも新品8万でオフィスチェアとしては格安だけど、公式サイトをみたら、6万の中位モデルと4万のマカロン系カラーのやつもある
https://www.flexispot.jp/category/office-chair
家でパソコン作業する人が使うチェアとしてはもうこれでよくね?
個人的には中古のリープチェアを中古オフィス家具屋から入手することをずっと推奨してるんだけど、費用対効果はこれが最善だとしても、中古って当たり外れあるからね
それに自宅用だとヘッドレストをつけたくなるんだけど、中古リープでヘッドレストつきはほぼない
リープなら安価な社外品を改造してつけることもできてネットにノウハウが転がってるけど、それなりにハードルはあるからね
自宅用でヘッドレスト付きのちょうどいいものを新品で買うならイトーキのアクトチェアあたりが無難かなってのが数年前に出した結論だったんだけど
それでも10万くらいはするし、それを考えると4万からヘッドレストにオットマンまで内蔵されたしっかり背中支えてくれる本格的なオフィスチェアを売り出してるFlexiSpotはだいぶ神企業だと思われる
PC作業用のデスクとして重要なのは、背もたれの機能性もだけど、一番疲労に関わってくるのは上下左右前後の自由自在に動く肘置き(アームレスト)だと思ってる
よっぽど机に肉薄して座って机上に腕を置く人でない限り、机と同じくらいのちょうどいい高さに肘置きがあることの意義ってかなり大きいんだよキーボード作業では特に
いまゼンゼロでやってるオートチェスの「ンナナ棋聞録」っていうイベントミニゲームがけっこう手触りいい
最初はCPUの接待プレイで余裕で勝てすぎるが(ゲーム内ミニゲームなので、さっさと報酬もらって去りたい人用)
対戦ランクが最上位になるころには奥深さが分かってきてハマってる人もちらほら見かける
ホヨバは自社ゲーム内でオートチェス系ミニゲームを10本近く開発してきただけあって
対戦テーブルゲームにおけるカジュアルさと奥深さのバランスを取るのが着実にうまくなってきてる
このイベントは9月頭には終わってしまうが、すべては新作アプリ崩壊:ネクサスアニマへの布石だと思われるので
リリースを楽しみに待とう