Movatterモバイル変換


[0]ホーム

URL:


はてラボはてな匿名ダイアリー
ようこそ ゲスト さんログインユーザー登録

「問題点」を含む日記RSS

はてなキーワード:問題点とは

次の25件>

2025-12-14

「なぜはた」のnoteバトルを読んで

小並感なので無視してください。

https://ichiiida.theletter.jp/posts/0aa160a0-d70f-11f0-aa07-8582de6095b5

https://note.com/nyake/n/na2d317b47bc5

「なぜはた」の明確な問題点は「タイトル主語が大きすぎること」です

反論」の問題点データの使い方と論理おかしいことです

<以下本文>


まず大前提として、『なぜ働いていると本が読めなくなるのか』は、「かつて読書習慣があったにもかかわらず、働き始めてから読めなくなった人々」という特定の層が抱える悩みについて、それが個人的問題ではなく社会構造上の問題であることを論じた本です。

大前提となる、「『かつて読書習慣があったにもかかわらず、働き始めてから読めなくなった人々』という特定の層」が存在することをデータで示さないと、「実感」としてそういう層の存在を主張したとしても議論が始まりません。

「この神聖な水飲んだらがんが治ったんだもん」とデータなしに主張しても、そこから先の議論に至らないのと同じです。


これに対し、飯田さんは国民全体の平均値であるマクロデータを持ち出して「全体で見れば変化はない」と反論しました。が、これはいうなれば、「日本人平均寿命は伸びているから、あなたの今の病気存在しない」と言っているのに等しい議論です。

→この例えは明白に誤りです。なぜなら前者は「全体の読書量」と「特定の層の読書量の推移」を比較する主張であり、後者の「寿命」と「特定の疾患の存在」とは評価対象が異なるからです。

あえて寿命で例えるなら、「日本人平均寿命は延びているから、喫煙者平均寿命も延びている」などがあります。これならば「全体」と「特定の層」を共通評価である寿命」で比較できますし、「日本人平均寿命が延びていること」を示しても「喫煙者平均寿命が延びていること」を示さないのはその通りで、これならば矛盾と言えます

しかしその仮説を論じるなら、タイトルを「喫煙者平均寿命~」とするべきで、主語日本人全体としたり、明確に示さないことが明らかに誤りであることは誰にでもわかると思います。)


全体平均の中に埋もれてしまっている「特定属性の変化」に光を当てるのが拙著役割です。マクロデータのみで個人の実感を否定することは、分析手法として適切ではありません。

マクロデータのみで個人の実感を否定すること。確かによくないですね。

おじいさんおばあさんの中には、煙草を決してやめない人がいます。「私は煙草を吸っても今まで病院のお世話になったことないんだから、それでいいの」 大変結構だと思います

こういう人たちに、「タバコ健康に悪いからすぐやめなさい」と言っても、個人経験則否定することになり、もめます

マクロデータ目的は、「特定属性の実感」を否定することではなく、全体を解析して現状やその傾向を把握することです。分析手法として、データで示されない実感を大切にすることは重要ですが、解析の結果「実感」を否定する結果になってしまうことはままあります

からこそ、「実感」を前提とする議論をするならば、実感の存在のものデータとして示す必要があるのです。


拙著統計データを多用することは本題からそれてしまうため(何度も書きますが、私の書いた『なぜ働いていると本が読めなくなるのか』はマクロデータで語ろうとした本ではありません)必要最低限にとどめていました。が、本稿ではあえて氏の提示したものと同じデータソースを用いて反論を試みます

→繰り返しになりますが、主張には前提が必要で、前提が正しくなければ主張も意味を成しません。したがって、前提をデータとして示す必要があります。それが必要最低限に至っていないということなのです。


飯田さんは「高校生の時点で読書量は減っており、働き始めてから急に減るわけではない」と指摘されていますしかし、この主張は「誰を対象にするか」という分析対象のセグメントを見誤っています

まず、拙著対象としているのは「元々読書習慣があった人々」です。では、統計的に見て「読書習慣がある人」とはどのような層を指すのでしょうか?

次図「読書習慣のある人」の月平均読書冊数を見ると、過去約40年にわたり、本を読む習慣がある人の読書量は月平均3-4冊の間で安定して推移しています。つまり統計的定義として、「月3-4冊読む」という行動こそが、日本の「読書習慣がある人」の姿であるといえます

対象としているのが「もともと読書週間があった人々」なら、なぜ書籍タイトルが「なぜ働いていると本が読めなくなるのか」と主語が示されていないのでしょうか。ここが反論とその反論の大きなズレの原因です。

ちなみにこの統計データhttps://www.bunka.go.jp/tokei_hakusho_shuppan/tokeichosa/kokugo_yoronchosa/pdf/94111701_03.pdf)が35ページ目(pdfだと39ページ目)にあるんですが、16-19歳の調査人数、なんと83人なんですね。

これだと1人減ったら1.2%割合が動くことになるんですよ。以下に書き起こしたもの記載してみます

<16-19歳の読書数>

0冊=66.3%

1-2冊=22.9%

3-4冊=8.4%

5-6冊=1.2%

7冊以上=1.2%

あれ?1.2%が二つ。つまりこれ、5-6冊、7冊以上の人は1人ずつでしたね(笑)

3-4冊の人も1人減ったら7.2%になり、2人減ったら6%になって20歳代の人と同等になっちゃますよね。

おおよその割合をみるには使えると思うんですけど、「16-19歳とその他の世代比較」には非常使いにくいデータだと思いませんか?もし複数回同じ手法調査したら、ひっくり返っちゃったりすることもあり得そうです。

しかも、令和5年の大学短大専門学校の進学率を合わせると約8割、大学に限ると約6割で、ちょうどこの統計の年齢階級を跨いじゃってるんですね。

から、このデータで「働くと読めなくなるかどうか」を議論するのって、そもそも無理なんですよ。


ご覧の通り、「1,2冊」というライト層では加齢による減少は見られませんが、「月3-4冊読む習慣のある層」においては、労働間中生産年齢)に数値が底を打ち、退職後に回復するという明確な「U字カーブ」を描いています

学生時代読書減と社会人の読書減を同列に語ることはできません。なぜなら、このグラフが示すように、「労働から解放された世代(70代以上)」では、数値が学生時代の水準まで回復しているからです。 もし「加齢による文字離れ」や「スマホ普及」だけが原因であれば、高齢層でここまで数値が戻ることは説明がつきません。

もちろん、今回のような一時点の調査である以上、厳密には加齢による変化とコホート効果を切り分ける分析必要です。しかし、データ限界差し引いてもなお、この「労働間中にのみ、特定読書層が凹む」という事実は、労働環境がまとまった読書習慣を構造的に阻害している可能性を強く示唆しています。 全体平均にならすことで分布の特異性を捨象してしま飯田さんの分析は、データに表れた当事者ーー働いていると本が読めないのだとほんとうに感じている人々ーーの痛みを見落としていると言わざるを得ません。

→この主張も前述したように、1人動くと1.2%動くデータ示唆するのは無理があります

U字カーブあなたは70歳以上の人が自在スマホをいじくってネットサーフィンしているのを想像できますか?

交絡(データに影響を与える別の要素)がありすぎて、単純に就労の有無だけを結果の原因として求めるのはちゃんちゃらおかしいと思いませんか?

「痛み」ですか、はあ。タバコ吸っても健康でいられると思ってる人の痛みを想像したことありますか?(笑)


一見すると、「書籍読書冊数と市場規模は相関しないが、雑誌は相関する」という飯田さんの主張は正しいように見えますしかし、ここで気を付けなければならないのは、市場規模根拠として用いられているデータ定義です。これは「出版販売額」、つまり新刊市場の推移にすぎません。

雑誌のみが市場規模と相関する主要因は、書籍雑誌読書習慣の違いというより、市場構造の違いにあると考えるのが妥当です。書籍図書館での貸出や、古書店メルカリ等の二次流通市場といった新品購入以外のタッチポイント豊富です。

→なるほど、たしか書籍図書館古書店接触がある分、新品市場だけで語ると乖離が出そうですね。

まり、「読書数の総量=新品購入+レンタル中古」になるってことですな??

ということは「読書数>新品購入の勢い」が成立するということだ。ふむふむ。

ここで市井氏のnoteから引用すると

こうした「読む」と「買う」を短絡的に結びつける考え方はよく見られる。しかし、読む量と買う量は単純にイコールにはならない。イコールになるなら「積ん読」という言葉存在しない。

出版市場が成長していた時代にも、書籍読書量が増えていたわけではない。書籍は、読書量と購買量の傾向が一致しない。

→えーっと、積読があるから読書数<新品購入市場の勢い」もありえると。

……市井氏は積読があるから読書数<新品購入市場」と言い、その反論として三宅氏は中古レンタル市場があるから読書数>新品購入市場」と言っている!かみあってない!

まわりくどいんだけど、結局どっちも「書籍読書数と新品購入に相関がない」が「雑誌読書数と新品購入に相関がある」というのが主張で、一致している!反論すると見せかけて同じことを主張するという高等テクニックである


また、拙著の「雑誌自己啓発書を中心として、労働階級にも読まれ書籍存在していた」という記述に対し、飯田さんは「雑誌書籍区別がついていない」と批判されていますしかし、拙著記述明治時代出版状況についての記述であり、いうまでもないことですが雑誌コミック週刊誌割合時代とともに変わっていきます明治雑誌出版に関する記述を、現代雑誌と同様の枠組みで捉え、区別がついていないとするのは、論理が通らないのではないでしょうか。

以上のように、構造的に相関の低い「新刊販売額」を指標として用いて「書籍雑誌読書習慣が異なるので分けて考えるべき」と主張するのはデータの選定として不適切です。本来であれば、図書館の貸出しや二次流通市場におけるタッチポイント考慮したうえで読書冊数との相関がないことを示すべきです。また時代によって役割の異なるメディアを十把一絡げに扱うのは、妥当性を欠いていると言わざるを得ません。

→えーと、前半の文章市井氏の引用した部分が明治時代の話をしているか不適切ってことだな。うむ作者が言うならそうなのだろう。

後半は……

構造的に相関の低い『新刊販売額』を指標として用いて『書籍雑誌読書習慣が異なるので分けて考えるべき』と主張するのはデータの選定として不適切

あれ、あなた書籍読書数と販売数は相関しないけど雑誌は相関するって言ってましたよね?

分けて考えるべきなのは妥当なんじゃないんですか?笑

また時代によって役割の異なるメディアを十把一絡げに扱うのは、妥当性を欠いていると言わざるを得ません。

市井氏のnoteをみると、扱っているデータ70年代以降のもの明治時代の話はしてなさそうですけどね。

それに市井氏の

なお、『読書世論調査2016年度』には書籍読書率について「戦後読書世論調査の開始以来、多少の変動はあるものの、おおむね5割前後で推移している」と書いてある。『なぜはた』は読書世論調査引用しておきながら、読書世論調査サイドの「長年そんなに変化がない」という見解とは異なる「本離れが進んでいる」という主張をしている。

この部分に関する反論はしなくていいんですかね。マスデータから

引用元の文献(黒田祥子山本勲「長時間労働是正と人的資本投資との関係」)を見る限り、これは事実ではあるものの、解釈適用先が間違っていると考えられます

というのも、ここで引用されている論文が測定している「自己研鑽」と、拙著が指摘する「自己啓発書読書」は、行動の質が全く異なります論文が指すのは資格取得やスキルアップのための「能動的な学習」であり、これに対して『なぜ働いていると本が読めなくなるのか』が論じているのは、新自由主義的な不安に駆られた人々が救いを求めて読む「自己啓発書の消費」です。むしろ、「労働時間が減っても、能動的な学習に取り組むほどの気力や体力は回復していない」という論文の結果は、人々が手軽な「やった感」や「効率的な正解」を得られる自己啓発書(=ファスト教養)に流れるという拙著の仮説と矛盾しません。

キャリアアップのための能動的な学習」の機会が減ったからといって、「手軽なノウハウ本」のニーズがないことの証明にはならず、このデータ根拠にするのは的はずれです。

→確かに自己研鑽時間が減ったから」といって「手軽な自己啓発本を読む時間が減った」とは言えない。それはその通りだ。まあ手軽な方が増えたとするのはあくまで仮説で、それを証明する手段もそうないよね。



4.「自己啓発書へのシフトという説は誤りである」への反論

飯田さんは「市場規模において、依然として小説自己啓発書より大きいため、自己啓発書へのシフトという説は誤りである」と主張されています

これには二つの反論があります

第一に、議論の焦点は、現時点での「絶対量」ではなく「変化の方向性トレンド)」です。たとえパイの大きさが小説の方が大きくとも、書店の棚構成の変化や、人々の意識における効率性の重視といったトレンドの変化を否定する材料にはなりません。

第二に、ここで飯田さんの論理には明確なダブルスタンダード存在します。飯田さんはこれまでの議論において、「市場動向と読書実態書籍においては必ずしも一致しない」と主張されました。しかし、ここでは一転して、「小説の方が推定発行金額市場規模)が大きい」ことを根拠に、「小説の方が読まれている」と結論付けています


→いったん整理すると、

三宅氏の主張>

読書方向性が手軽な自己啓発書シフトしているか読書量が減った。

市井氏の主張>

小説市場規模の方が大きいので自己啓発書読書量に対する影響は大きくないはずだ。

三宅氏の反論①>

市場規模では確かにそうだが、トレンド(推移)は見てないですよね?だからその論は否定根拠にはなりません。

三宅氏の反論②>

さっき書籍雑誌比較で「市場規模読書量は相関しない」って言ってたのに、自己啓発書小説市場規模比較するのはおかしい!ダブルスタンダード

反論①については、たしかトレンドそうかもしれないけど、象に犬がキックしても効かないように、市場における小説の占める割合の方が圧倒的に大きいのだから自己啓発書トレンドがまあまああっても全体のムーブには影響しにくいっていうのは確かなんじゃないですかね。

反論②については、雑誌書籍比較と、小説自己啓発書(どちらも書籍に含まれる)の比較全然別だから、まずダブルスタンダードとは言えないのは明らか。これは間違いない。

自身にとって都合の良い時だけ売上と読書実態を切り離し、別の場面では売上を読書実態根拠とするのは、論理一貫性を欠いています

→これは完全にどっちもどっちと言わざるを得ません。データ分析仕事にしている人ってこのレベルなんですね。というかそもそもデータの部分よりも文章の方が蛇行運転になっていて、上記したように論理が合わない箇所がいくつかあります心配になりました。

<お わ り>

Permalink |記事への反応(1) | 07:31

このエントリーをはてなブックマークに追加ツイートシェア

2025-12-13

anond:20251205122823

MacLinuxを両方使っている人として言わせてもらうと、Linuxの方がいいとは限らないけど、Macにする特別理由がなければLinuxにした方がいいと思います

そもそもMacは高いですし、パフォーマンスは確実にLinuxの方がいいはずです。

特にセキュリティ観点からも、Linuxの方が優秀な点が多いです。

例えば、Linux自体カーネルという、OSのうちの一部分に過ぎないため、Linux脆弱性が見つかっても、UbuntuFedoraなどのよりソフトウェアに近い段階(厳密にはLinuxディストリビューション)とはある程度分離された状態なので、よほどの変更がない限りLinuxだけアップデートすることが可能です。

また、Linuxアップデートというより、新しいバージョンLinuxカーネルを用意してそちらに切り替える、という構造になっています

ただしもちろんLinuxにも問題点などもあります

そもそもLinuxは元々、あまり日常用途使用することはあまりなく、最近になって増えてきたところです。

最近の、特にOSに関わる部分の機能では、どうしても標準では対応できていません。(例えばパスキーなどです)

また、先ほども言及したLinuxディストリビューションは、様々な種類があるため、それらから選ぶのも難しいかもしれません。(実際私も最近までずっと色々なディストリビューションを試して、ようやくFedoraに落ち着いたところです)

日本語IMEだけでも様々な種類がありますし、慣れている人でなければなかなか使いにくい部分もあります

一応、MacBookでLinuxを動かすという「AsahiLinux」というものがあり、M1/M2には既にある程度対応しているため、もしMacBookでmacOSLinuxを同時に使う、というのが許容範囲であればそれも良さそうです。

また、Macの固有機能としてはスクリーンタイム(アプリ利用制限時間での制限コンテンツ制限などを行える機能)などが存在するので、それを利用する、と言えば納得されると思います

実際、スクリーンタイムMacにする特別理由として十分です。

Linux場合どうしても自由度が高過ぎて、様々な方法で同じことをできてしまい、制限が難しいため、スクリーンタイムのような機能は追加しにくいわけです。

ちなみにデスクトップラップトップの話に関しては、私はまあまあ納得できます。実際デスクトップの方がコスパはいいですし、持ち運びさえしなければデスクトップ一択です。

ただしおそらく持ち運びするでしょうし、コスパをそこまで気にしないならラップトップでもいいかもしれません。

Windowsの話に関しては、Windowsそもそも最近不具合が多すぎるため、前から一般的に使われているOSの中で安定しているもの、としては現在Macの方が優秀です。

そのため流石にそれには納得できません。

まとめると、Linuxも優秀だがMacにも様々な利点があるため、MacにしたいならMacでいいし、LinuxにしたいならLinuxでいいと思います

この投稿が役に立つと幸いです。長文失礼しました。

Permalink |記事への反応(0) | 23:57

このエントリーをはてなブックマークに追加ツイートシェア

2025-12-12

「偽サッチャー」「自滅的」「時代遅れ高市氏を海外メディア酷評

ジャニーズ問題もそうだが、海外メディアのほうが問題点が見えている

経済政策の失敗でインフレにより生活が苦しくなる日本人日本メディアの異常なもちあげぶり。アホなのか北朝鮮なのか

https://www.tokyo-np.co.jp/article/455440

Permalink |記事への反応(0) | 15:59

このエントリーをはてなブックマークに追加ツイートシェア

2025-12-11

anond:20251211184252

以上のやり取りを「スケキヨ」と「プミポン」のディベートとして分析して下さい。

────────────────────

このやりとりをディベート形式分析します。

##論点構造

中心的な対立:**

## 各発言分析

### 第1ラウンド

スケキヨの主張:**
プミポンの応答:**

### 第2ラウンド(転換点)

スケキヨ反論:**
  • 「考えが浅い」と批判
  • 「上限/下限」という概念を導入
  • ただし、この概念説明が不十分
問題点:**スケキヨは「両方ある」と主張するが、これはプミポンの主張と実は矛盾していない。プミポン能力差が拡大することを示唆しており、両者は異なる表現で似た内容を述べている可能性がある。

### 第3ラウンド以降

プミポン対応:**
スケキヨ対応:**

##評価

###論理

###レトリック

### 致命的な問題

スケキヨは「上限/下限」という独自概念を持ち出したが、それを明確に定義説明できていない。プミポン理解を示した後も、なぜそれが「考えが浅い」のか論証できず、人格攻撃で逃げている。

##結論

これはディベートとしては成立していません。スケキヨは初期に興味深い観察を示しましたが、プミポンとの実質的意見の相違を特定できず、また自身論点を明確に説明できなかったため、感情的応酬に終始しました。

プミポンは終始、対話的で建設的な姿勢を保ち、相手の主張を理解しようと努めています。両者の主張は実は大きく異ならない可能性が高く、言葉の使い方の違いが不要対立を生んでいると言えるでしょう。

Permalink |記事への反応(0) | 18:54

このエントリーをはてなブックマークに追加ツイートシェア

2025-12-09

AIにとって読みやすプログラミング言語」という幻想

プログラマー諸君は見てほしいんだけど

これさ

 

愚かな人間の都合など完全無視、LLMのための高効率プログラミング言語「Sui」(粋)

https://forest.watch.impress.co.jp/docs/serial/yajiuma/2069573.html

 

別にいいんだけど、どうにもブクマカ含めて、しっくり来る批判できてないんだよな

それが気になってしょうがない

まだLLMのこと勘違いしていないか

 

俺ごときが言ってもアレだから、Gemini3.0先生に頼んだよ(一時チャット、Pro 3.0思考モード

 

ユーザー提供した情報と、一般的なLLMの技術特性に基づき、プログラミング言語「Sui」についての冷静かつ客観的評価をまとめます

1. 「LLM用プログラミング言語」としてのメリット感想

感想:一言で言えば、**「思想実験としては極めて面白いが、実用性とLLMの学習原理無視した『早すぎた最適化』」**です。

作者の「人間ではなくLLMを主客にする」という視点の転換は、アーティスト的・哲学的問題提起としては鋭いですが、現在のLLM(Transformerアーキテクチャ)の動作原理工学的に捉えると、メリットよりもデメリットが上回る可能性が高いです。

 

メリット:

トークン効率改善:Python等と比較して記述が圧倒的に短くなるため、出力速度の向上と課金コストの削減(トークン節約)は確実に達成できます

・構文エラーの激減: 括弧やインデントの複雑なルール排除しているため、「閉じ忘れ」などの単純なSyntaxErrorは減るでしょう。

コンテキストウィンドウ節約: 長いプログラムでもコンテキストメモリ)を圧迫しにくくなります

 

デメリット:

学習データとの不一致: LLMは「大量の人間コードPythonなど)」を学習して賢くなっています。未知の言語「Sui」を書かせるには、Few-shot(プロンプトでの例示)に頼るしかありませんが、これではLLM本来の推論能力コーディング能力(事前学習の重み)を活かせません。

ブラックボックス化: 生成されたコードバグっていた場合人間が読んで直すことが不可能です。「LLMに直させる」にしても、LLM自身がSuiのロジックを深く理解していないため、無限ループ幻覚連鎖)に陥るリスクが高いです。

・CoT(Chain of Thought)の阻害:最近研究では、LLMは「冗長思考過程」を出力することで論理的整合性を保つことがわかっています。極限まで圧縮された記号列は、LLMの「考える余地」を奪い、論理破綻を招く可能性があります

 

2.思想的に正しい所・正しくない所(理由込み)

忖度なしに判定します。

 

正しいと思う所(Agree)

・「高級言語はLLMにとって冗長である」:

 理由:人間にとっての「読みやすさ(可読性)」は、機械にとって単なるトークン無駄遣いです。if x>10: よりも ? x10 の方が情報密度が高いのは事実です。

・「括弧の長距離依存問題」:

 理由: TransformerのAttentionメカニズムにとって、遠く離れた ( と ) の対応関係を維持するのは計算コストが高く、ミスの原因になりやすいです。ネスト排除する方向性機械的処理として正しいです。

 

正しくないと思う所(Disagree)

・「可読性を排除しても良い」:

 理由:ソフトウェア開発においてコーディングは「書く」時間より「読む・直す」時間の方が長いです。AI生成コードであっても、最終責任人間が負う現状では、人間検証不可能コードは「危険バイナリ」と同義であり、プロダクトには採用できません。

・「LLMに最適化された言語を書かせるべき」:

 理由: 前述の通り、現在のLLMは「人間語の確率分布」を学習したモデルです。「LLMにとって自然言語」とは、実は「人間にとって自然言語英語Python)」そのものです。Suiは「計算機にとっては最適」ですが、「現在のLLMにとっては異言語」です。

 

3. 「5つの設計原則」の正当性評価

作者が掲げる設計原則についての技術評価です。

 

1行1命令(行単位独立性) 評価: △

パース(解析)は容易になりますが、LLMは「前の行の文脈」を読んで次の行を出力するため、行を独立させすぎると文脈連続性が失われ、複雑なアルゴリズム構成力が落ちる可能性があります

 

括弧は{}のみ(ネスト排除) 評価: ◯

LLMが最も苦手とする「深いネスト構造の維持」を回避する策として有効です。アセンブリ言語に近いフラット構造は生成難易度を下げます

 

変数は連番 (v0, v1...) 評価: ✕

これが最大の問題点です。LLMは変数名(user_id, total_price など)に含まれる「意味」を使って推論を行っています(Semantic Grounding)。すべてを記号化すると、LLMは変数役割を見失い、論理的バグを埋め込みやすくなります

 

命令は1文字 評価: ◯(ただし諸刃の剣

トークン効率は最強ですが、1文字の違いで意味が激変するため、LLMの確率的な「ゆらぎ」による1文字ミスが致命的なバグになります冗長さはエラー訂正の役割果たしてます

 

明示的な制御フロー(ラベルジャンプ) 評価: △

goto 文の多用はスパゲッティコードを生みます。LLMにとっても、構造プログラミング(if/forブロック)の方が、「ここからここまでがループ」というチャンク(塊)として認識やすいため、一概にジャンプ命令が良いとは言えません。

 

現在のLLMは「人間語の確率分布」を学習したモデルです。「LLMにとって自然言語」とは、実は「人間にとって自然言語英語Python)」そのものです。

 

ここ!マジで覚えてね

LLMはこれまでの機械よりも人間に近いと思ってほしい、人が苦手なことはAIも苦手

機械論理的ロジックに強くて〜っていうのはAIには通用しない

 

ついでに、「LLM用プログラミング言語」の潮流について

「LLMのための言語」という文脈は、大きく2つのトレンドに分かれます。Suiは後者に属しますが、主流は前者です。

1.LLMを「制御するため」の言語(主流)

 ・DSPy, Guidance,Microsoft Guidance:

  ・プロンプトエンジニアリング構造化し、LLMの出力を型(JSONなど)に強制したり、思考プロセスを制御するためのフレームワーク

 ・SGLang:

  ・LLMの推論を高速化・並列化するための言語

 ・これらは「人間がLLMを操るための言語」であり、実用化が進んでいます

 

2.LLMに「書かせるため」の言語(Suiのカテゴリ

 ・現状:ほとんど実験段階です。

 ・Gorilla LLMなどの試み:API呼び出しに特化したファインチューニングなどがありますが、独自の「新言語」を作らせるよりも、既存PythonJSON を正しく出力させる方向(Constrained Decoding)が業界の標準解です。

 ・擬似コード:論文レベルでは、Pythonの代わりに中間的な擬似コードを出力させ、それをコンパイラで処理する手法研究されていますが、Suiほど極端な記号化は稀です。

 

後者については

 

目標設定のピントが少しずれています

現状の最適解:現在のLLMを使う限り、「LLM用言語」の最適解はPython です。なぜなら、世界中GitHubコード学習しており、LLMが「最も流暢に話せる言葉」だからです。無理にSuiを話させるのは、日本人エスペラント語で詩を書かせるようなもので、パフォーマンスは落ちます

 

最後総評

 

総評: Suiは、「既存のLLM(GPT-4など)に書かせる言語」としては失敗する可能性が高いですが、「未来AIネイティブコード生成のあり方」を示唆するアート作品としては高く評価できます。作者の「愚かな人間に合わせるな」というパンク精神は、エンジニアリングの枠を超えた鋭い批評性を持っています

 

アート作品だそうです

 

お前らは安易オレオレ言語作るんじゃないぞ、作るにしてもAIに聞きなよ?

聞く時は忖度させるんじゃないぞ?

この作者もAIに乗せられたのかもしれんし

 

______

 

プロンプト

 

以下が「LLM用プログラミング言語」としてメリットがありそうか、感想を教えて下さい。

https://forest.watch.impress.co.jp/docs/serial/yajiuma/2069573.html

https://github.com/TakatoHonda/sui-lang

 

忖度配慮はせず冷静にお願いしま

思想的に正しいと思う所、正しくないと思う所を理由込みでまとめてください

・「5つの設計原則」の考え方は正しい?

最近のLLM用プログラミング言語についてもまとめてください

そもそもLLM用プログラミング言語という目標自体評価をしてください

 

なお、以下はSNSでの作者の投稿です

(省略)

Permalink |記事への反応(0) | 14:27

このエントリーをはてなブックマークに追加ツイートシェア

anond:20251209131417

A:勝手な印象だが、男の分別がついてくるのって20前後からだと思う。悲しいかな、20年近く学ばないと、規範意識社会的に許される最低限のラインまで育たないのだと理解している。大学生でも、大半が捕まらないだけで、無茶をしているやつが散見される。

B:日本以外では別にそんなことないので、日本人が男に甘いだけだと思う。男女問わずね。心底気持ち悪いな。

A:んなことはない。外国に行ったことすらなさそうな発言だな。

試しにホーチミンの夜の繁華街に行ってみたらいい。若者がごった返して毎晩乱痴気騒ぎだぞ。

B:ベトナム別に治安のいい街ではないだろう

日本途上国とか治安の悪い国であるという自覚でもあるの?

A:君がこの増田なら自分発言をよく思い出すべきだし、別の増田ならひとつ前のレスくらい読んでから発言しろしか

B:普通は同質のもの比較するんだけどその辺の常識もない感じ?

日本シリア比較してどうすんの?

A:最初言及範囲を全部に設定してしまった時点で君の負け

残念でした

B:異質なもの比較によって、具体的に何を目的に何の成果を得て何と比較してどんなメリットがあってどんな現実示唆を導くわけ?

バカでないならそこまで考えてやってんだよね?

AとBがそれぞれ意見を出し合い議論をしています

どちらの方がより正しいでしょうか。

結論から言うと、AもBも論理が甘い部分があるが、議論としてはBのほうがまだマシ。Aは論理運用が雑すぎる。

以下、理由

Aの問題点(多すぎてちょっと笑う)

1. 「男の分別がつくのは20前後

これは完全に個人の印象で、科学的根拠ゼロ発達心理学でもそんな切り方はしない。前頭前皮質成熟は25歳前後が平均だけど、男女差より個人差が圧倒的に大きい(Steinberg,2014)。

2. 「外国に行ったことすらなさそう」などの人格攻撃

反論になってない。典型的論点ずらし。

3.ホーチミンの例を“外国全体の例”に使う誤謬

外国」全体に対し、ベトナム特定エリアナイトライフ反論は無理がある。

これはサンプルバイアス論理スケールミスマッチ

4.最後の『最初言及範囲を全部に設定〜君の負け』

論理ではなくマウントのための発言で、理由提示ゼロ

Aは、政治板の酔ったおじさんみたいな言い分で、内容のある議論ではなく攻撃しかないという感じ。

Bの問題点(Aよりは軽い)

1. 「日本以外ではそんなことない」と断言

根拠なしの一般化。治安統計を見ると、国によって若者素行は違うし、犯罪率も文化全然違う。

「どこでもない」とは言い切れない。

『多くの先進国では、若年男性からといって行動の未熟さが社会的特別に免罪されるわけではない。

日本では「若い男性は未熟で当然」という文化的前提が比較的強く、それが行動への甘さとして表れる場合がある。』なら妥当

2. 「心底気持ち悪い」などの感情的評価

社会科学議論なら意味がない。

3. 「日本シリア比較してどうすんの?」

スケールの軸合わせとしてはもっともだが、皮肉を優先していて論点説明が弱い。説明にはなっていないが内容は十分。

Bはスケールの一致(同質の条件で比較すべき)という科学的な基本原則を押さえているので、議論としては筋が通る。

結論

• Aはほぼ全部印象論と個人攻撃で、内容はボロボロ

• Bは一般化が雑だが、比較の枠組みを正しく指摘している分だけ論理的。

よって、

Bの方が議論として「より正しい」。

Permalink |記事への反応(1) | 13:30

このエントリーをはてなブックマークに追加ツイートシェア

2025-12-08

WPATHファイルやCassReviewによるジェンダー医療問題点

1. WPATHファイルとは何か(背景と重要性)

WPATHファイルとは、2023〜2024年リーク・開示された内部文書メール会議記録等の総称で、WPATH(世界トランスジェンダー健康専門家協会)が作成したStandards of CareVersion 8(SOC8)の意思決定過程リスク認識を示すものです。

これらの文書から明らかになったのは、

科学エビデンス不足を自覚しながら未成年への医療介入を推進していたこ

内部文書では、「未成年に対する医学的介入(ブロッカークロスホルモン、手術)を支持する強固なエビデンスはない」ことが繰り返し言及されていたが、SOC8では強調されなかった。

心理社会的評価の不十分さを認識しつつ、拡大した適応基準

内部議論では、鑑別診断・精神疾患の併存に関する懸念が挙げられていた

しかし最終的には「自己申告を尊重するアファーマティブモデル」が採用された。

■ 小児性別違和治療におけるリスク・不可逆性について内部的に大きな懸念があった

特に以下の問題が内部で指摘されていた:

ブロッカーの脳発達への影響

機能発達の不可逆的損失(オルガズム機能喪失子供を持つ能力喪失

長期追跡データがない

にもかかわらず、外部には「安全性確立している」と表現されていた。

年齢制限妥当性について内部でも意見が分裂していた

SOC8で思春期ブロッカーホルモン治療の開始年齢が事実上引き下げられたが、その根拠は内部的にも薄弱であった。

2. CassReviewイギリス)の概要調査姿勢

CassReview(2020–2024)は、英国政府委任した大規模な独立医学レビューで、

未成年ジェンダー医療包括的調査し、科学根拠評価を行った世界最大規模の調査である

対象

Tavistock GIDSの診療

Puberty Blocker /Cross-Sex Hormone のエビデンス

心理精神医学問題を抱える子どもたちのケア体系

調査手法

9000件以上の診療データ

国際論文レビュー

多専門領域小児科精神科神経科学疫学)の統合評価

3. CassReview が指摘した主要な問題点(国際的に決定的な評価

3-1.科学エビデンスが極めて脆弱である

CassReviewは、未成年への医学的介入に関するエビデンスを体系的に分析し、次を結論づけた:

ホルモンブロッカー効果科学的に証明されていない

性別違和改善効果を示す質の高いエビデンスがない

逆に、骨密度低下・認知発達への影響が懸念される

ブロッカー使用後はほとんど全例がクロスホルモンへ移行する →実質的に不可逆的治療の導入

クロスセックスホルモンも長期安全性に関するデータが欠如

心血管リスク、がんリスク、性機能障害などが十分に解明されていない

若年での導入は生涯の医学依存を伴う

医学的介入が精神健康改善するという決定的な証拠はない

既存研究の多くは、

サンプルが小規模

コントロール群なし

追跡期間が短い

エビデンスとして不適格と評価された。

3-2. 適切な精神科的鑑別診断が機能していない

CassReviewは、多くの子どもが深刻な精神疾患トラウマを抱えていたのに、十分な評価が行われずに医療介入へ進んでいたことを強調した。

具体例:

自閉スペクトラム症ASD)の高い併存率

ADHD

うつ不安障害

自傷自殺念慮

いじめ・家庭環境問題

医療チームはこれらを深く評価せずに、「性別違和性別変更治療適応」とみなす傾向があった。

3-3.アファーマティブモデルへの批判

CassReviewは、現在普及している **Gender-Affirming Care(本人の自己認識を前提に医学的介入を進めるモデル)**について次のように批判する。

子ども性別違和の原因を自分で正確に認識できない場合が多い

発達段階ではアイデンティティは流動的

心理的・社会的要因が「性別違和」の形で表れることがある

医療者が本人の申告のみを基盤とするのは科学的でなく、危険

他疾患が見逃される

一度治療を始めると後戻りは難しい

CassReviewは、

アファーマティブアプローチ医療として不適切

と明確に言及した。

3-4. 不可逆性・性機能の長期喪失への重大な懸念

CassReviewは、若年期に治療を開始することで以下が不可逆的に損なわれる点を強調。

機能の未発達

生殖機能喪失卵子精子の獲得不能

体格・骨格への影響

脳発達への未知の影響

特にブロッカー開始時点で精子形成が起こらないため、

将来の生殖選択肢永久に失う可能性がある。

3-5.国際的適応が縮小へ向かうトレンド

CassReview以降、

イギリス

スウェーデン

フィンランド

ノルウェー

デンマーク

フランス

オーストラリア一部州

などが、未成年ジェンダー医療を大幅制限撤退した。

Permalink |記事への反応(3) | 16:23

このエントリーをはてなブックマークに追加ツイートシェア

生成AIが好きなエンジニアだけど、最近AIビジネス界隈にはついていけない

生成AIと、ちょっとした違和感

昨今、生成AIが急速に発展している。多くの人々が日常的に利用していることからも分かる通り、かなり便利なものであり、「もはや生活に欠かせない」という人も少なくない。

ボーカロイドとの結婚話を思い出させるように、「生成AI結婚した」なんて話すら聞くほど、AIに親しみを覚える人もいるらしい。

ここで私が書きたいのは、そうした生成AIのものの礼賛ではない。

我々の生活に浸透しつつある生成AIがどのようにビジネスに利用され、その過程でどれだけ多くの人が「生成AIビジネス」に騙されているか、という話だ。

なお、これは酒に酔った勢いで書き殴っているので、多少の論理構成破綻はご容赦いただきたい。

生成AIビジネスの氾濫

生成AIビジネス一口に言っても、その形態はすでに数多にわたっている。私の知る限りでも、

AIを用いた「資料ノウハウ本」の販売

画像生成で作った漫画コンテンツ販売

動画サービス上でのDeepFake動画

そこからアダルトサイト誘導する手口

といったものがある。

初期に流行ったのは、生成AI画像生成機能を使って漫画を量産し、それを販売するタイプビジネスや、某動画配信サービス上でDeepFake動画配信して最終的にアダルトサイト誘導する手口だった。

正直、最初に見たときは「よくこんなことを思いつくな」と感心もした。

その後は、AIで作っただけの電子書籍や「AI活用ノウハウ資料を量産して売るような商売が中盤戦として横行し、

最近では「AIコンテンツを開発して販売する」こと自体を売りにするサービスも増えてきた。

ちょっとした自動化ツールラッパーに「AI◯◯」というラベルを貼るだけで、値段が跳ね上がるような世界になっている。

ビジネスのものには、実はあまり文句はない

こういったビジネス存在することそのものに対して、私はそこまで強い嫌悪感を抱いているわけではない。

技術を使って金を稼ぐことは、資本主義社会では当たり前の営みだからだ。うまくやったやつが儲かる、それ自体は仕組みとしてそういうものだと割り切っている。

私が本当に嫌悪しているのは、ビジネスのものではない。

嫌悪対象は、

生成AIで雑に作られたコンテンツ

AIを使っている」という看板だけで中身の薄いサービス

のものというよりも、**それに対して一定以上の賛同尊敬を向けてしまう人々の「AIリテラシーの無さ」**だ。

AIがやってるからすごい」「なんか未来っぽいからすごい」という理由だけで思考停止し、

これはすごいに決まっている」と信じ込んでしまう態度に、強い違和感を覚えている。

エンジニアとして見える「評価軸のズレ」

私はエンジニアという立場もあって、日常的にコーディングエージェントを多用している。

例えば、

  • Claude Code
  • Codex
  • Gemini

といったツールを、実際にコードを書かせたり設計させたりしながら使い比べている。

からこそ、Gemini が普及した途端──

もっと言えば、「無料でそこそこ使えるコーディングエージェント」が出た途端に、Gemini がまるで**「一番優れている存在」**であるかのようにもてはやされる状況に、どうしても納得がいかない。

コード設計力や実装力、バグの出方、長期的なコードベースとの相性、そういった観点から言えば、私は今でも Codex を高く評価している。

タスクによっては、明らかに他のエージェントの方が適していると感じることも多い。

にもかかわらず、

というだけの理由で、「Gemini が一番いい」「これさえあれば他はいらない」という空気形成されていく。

本来であれば、

などの観点比較するべきなのに、

評価軸が

といった表層的な指標にすり替わってしまっている。

ここにもやはり、道具を適切な距離感評価できない姿勢を感じてしまう。

複数AIの並列開発と、「宗教化する」レビュー

ここまで好き勝手に書いてきたが、こういうことを考えるようになったきっかけになったエピソードを一つだけ挟ませてほしい。

最近は、生成AIごとの得意分野や癖を活かして、一つのタスク複数の生成AIに並列でやらせ、その成果物比較して一番マシな案だけを採用するという手法がある。

いわば「個体値ガチャ」のようにAIを回すやり方だ。私はこの発想自体はかなり理にかなっているし、素直に素晴らしいと思っている。

同じ理由で、いわゆるオーケストレーション系の手法もとても良いと思っている。

ただ、これを人力でやろうとするととにかく面倒くさい。

そこで、ある程度このフロー自動化してくれるGUIアプリがあることを知った。

詳細な名前は出さないが、このアプリは現時点では

という三拍子が揃っていた。

とはいえ、このあたりはアップデートを重ねれば改善できる話でもあるし、その点だけを永遠に責め立てるつもりはない。

コンセプト自体は本当に良いと思っているからこそ、余計に惜しいとも感じている。

私が本当に警鐘を鳴らしたいのは、そのアプリのものではなく、その開発者の周りに群がる人たちの方だ。

宗教団体の信者のようにメリットしか語らないレビュアーたちが、

革命的だ」

「これ一つで人生が変わる」

「今後のAI時代必須ツール

と持ち上げる一方で、価格の高さやUXの悪さ、セキュリティリスクといった問題点についてはほとんど触れない。

これでは、せっかくのコンセプトが面白いアプリなのに、肝心な欠点いつまでも修正されないだろう。

しかも厄介なのは、ここに群がっている人々の多くが、同じくAIビジネスを主導する側の人間だという点だ。

自分と利害が一致する相手を互いに持ち上げ合い、「これは素晴らしいものだ」という空気だけを増幅させていく。

その構図が、余計にタチが悪い。

そろそろ「AIリテラシー」が必要なんじゃないか

まあ結局、ここで私が何を言いたいのかというと、そろそろAIに対するリテラシーを本気で身につける時期なんじゃないか、というただそれだけのことだ。

結局のところ、ここで言っていることは従来の「情報リテラシー」とほとんど同じだ。

ただ「AIすごい」「AIがこう言っているから正しい」に思考停止するのではなく、

そのAI発の情報や、AIを巡る言説が本当に妥当なのかを自分判断する力が必要になってくる。

そして、自分が少しでも「ん?」と疑問に思ったものに対しては、いったん距離を置き、俯瞰して眺める態度が大事だと思う。

「これは誰が得をする話なのか」

「どこまでが技術で、どこからビジネスの誇張なのか」

自分は何に惹かれているのか(機能なのか、ブランドなのか)」

そういったことを、一歩引いた位置から見る。

そのくらいの距離感を持ってはじめて、ようやく私たちは生成AIとも、生成AIビジネスとも、まともな付き合い方ができるようになるのかもしれない。

Permalink |記事への反応(0) | 01:09

このエントリーをはてなブックマークに追加ツイートシェア

2025-12-07

議員宿舎国会議員職務遂行生活保障のための施設であり、原則として家族配偶者、子など)の居住が想定されますが、第三者の「愛人」のような異性を私的に連れ込むことは、施設趣旨利用規約公務員としての品位観点から問題視され、一般的には不適切であり、倫理的・法的な問題に発展する可能性が高いです。特に中国中共からあてがわれた」という文脈では、スパイ活動情報漏洩リスクが伴い、安全保障上の重大な問題として、国会メディアで追及される事態になりかねません。

背景と問題

施設目的:

議員宿舎は、地方選出国会議員が東京職務を円滑に行うための住居で、公的性格が強いです。

利用規約:

家族以外(特に異性)の長期滞在居住は、利用規約制限されているか、少なくとも問題視されるでしょう。

倫理品位:公職にある議員私的関係で「供給された」異性を宿舎に置くことは、国民の信頼を損ね、公務員倫理規定抵触する可能性があります

安全保障リスク:

中国からあてがわれた」という点が最も重大で、単なる不倫問題ではなく、中国による議員への情報操作スパイ活動ハニートラップなど)の疑義が生じ、国家安全保障に関わる深刻な問題として扱われます

もし事実であれば

国会での質疑、調査懲戒処分

メディアによる報道国民から批判

議員辞職勧告

場合によっては、情報機関による調査国家安全保障に関わるため)。

このような行為は、議員個人問題にとどまらず、国会議員資質、ひいては国の安全保障にも関わる重大な問題として扱われるでしょう。

Permalink |記事への反応(0) | 23:03

このエントリーをはてなブックマークに追加ツイートシェア

2025-12-03

『果てしなきスカーレット』、せっかくだから観てみようかと思って、映画館で観てきた。

結論としては、興行収入が良くないとしたら単に辛気臭くて画面が暗いのが良くなかったんじゃない?って思った。

あと、歌われている音楽あんまり良くない。未来流行っている歌だとか言われてもあれが流行るとは思えんが…っていう。

大衆受けという観点問題点ストーリー以外の部分にあるように思うから、よく言われているように脚本を変えた所であんまり変わらないと思うんだよね。

話の中身はこの手の、復讐否定する展開が自分の好みじゃないのでその時点でいまいちなんだけど

序盤で主人公達が見逃した敵の爺さん二人が終盤になって助けに駆けつける展開はなかなか好み。

まあ結論としては単につまらなかったとか鑑賞時間無駄だったで済むレベルであって、何年にもわたって延々と呪詛を書き連ねるような酷さではなかったと思う。自分が思う酷い映画っていうのはそのレベルから…。

Permalink |記事への反応(0) | 21:54

このエントリーをはてなブックマークに追加ツイートシェア

ようやっと果てしなきスカーレット見たけどギレルモ・デルトロのよさが再確認できた

デルトロフランケンシュタインフランケンシュタイン二次創作同人誌みたいな内容だったけど

原作を膨らませて一部は置き替えながらも作中での整合性に手を抜いてなかった

果てしなきスカーレットの最大の問題点ハムレットダンテ神曲二次創作をする際に

自分の盛り込んだ設定と元ネタの設定の整合性の手を抜いたことだと思う

いろんな擁護勢の文章読んだけどどいつもこいつも言ってることは

細田守はこういうことを描いているんですよというモチーフ読みだけど

問題はそのことが作中の論理にハマっていないことなんだよね

桃太郎の途中で犬が銀貨30枚で桃太郎を鬼に売って涙を流す展開が入ってきたとして

いやぁこれはイスカリオテのユダ裏切りを表しているんですねぇって言われても

なんで犬が鬼に桃太郎を売る必要があるんだよそんな前振りなかっただろ!としか思えないし

一部のオタクくんは「この設定自分には読み解けた!」ってだけでシコれるんだろうけど

普通の観客が見たがっているのは設定じゃなくて物語なんでね

Permalink |記事への反応(0) | 11:03

このエントリーをはてなブックマークに追加ツイートシェア

2025-12-02

anond:20251202124425

正直、俺は天才なんだが、しか高市失言については天才でなくてもその問題点理解できるはずだよ。

Permalink |記事への反応(2) | 12:47

このエントリーをはてなブックマークに追加ツイートシェア

2025-12-01

anond:20251201172817

素人が一回読んで思いつくような重大な問題点すら思いつかない自称専門家がでかい顔してるせいでまともな専門家までひとまとめに叩かれている

Permalink |記事への反応(0) | 17:31

このエントリーをはてなブックマークに追加ツイートシェア

素人が一回読んですぐ思いつくようなことをさも「重大な問題点発見し指摘してやった」みたいに言う人間ネットになると少なくないけど

なんか頭がおめでたすぎる奴らだなと思う

Permalink |記事への反応(2) | 17:28

このエントリーをはてなブックマークに追加ツイートシェア

2025-11-30

「令和人主義」に異議あり! その歴史的意義と問題点

https://note.com/bungakuplus/n/n7f809eebf081

会社員は(主体的政治活動をする)市民ではなく、企業経営者の手足であるらしい

よくわからないけど、会社員労働時間中は会社の手足であるかもしれないが、労働時間外に主体的活動すればいいだけなのでは?

Permalink |記事への反応(0) | 11:35

このエントリーをはてなブックマークに追加ツイートシェア

2025-11-29

第二回無職サミットに参加してきた

実は先日自殺の名所新小岩にて開催されていた第2回無職サミットに参加していた

第1回は駒沢オリンピック公園にて開かれていたらしいのだが

千葉に住んでいる人間にとって駒沢はあまりにも東京の端っこすぎて遠いなー

とか思っていたら完全に参加を逃してしまった

ということもあり 私にとっては初めての無職サミットの参加となる

無職サミットと名はついているが 実際には現在資本主義それ自体違和感を覚えていたり

また労働のものが嫌いといった人間が集まっていて

体感ちゃんと?無職をやっている人間は多分2,3割くらいだった印象

かく言う私もフリーランスでのITエンジニアをやって

適当生活費をなんとかしている人間なので まあ同じかなーといった感じ

14:00時に開始との情報が入っていたので

まあ12:00くらいに出れば間に合うやろーという適当な感じで出発

途中お腹が空いたので餃子の王将にて餃子ビールゆっくり飲んでいたら

すっかり 開始に遅れてしまった

おそらく到着したのは15:30くらい

とりあえず新小岩駅に降りて適当に北西へ歩いていくと

幸いなことに すぐに人の集まりを見つけることができた

麻雀やっているセクションも存在したのでタイミングがあれば混ざりたいなーとか考えるつつ参加してみる

来たら どうやら名札をつけるシステムになっているらしい

少し離れたところに なんというか場に似つかわしくない爽やかな人間がいて

その方に名札とペンをもらって名前を記入する

挨拶してみたら その方が久保さんだった

おお やっぱ雰囲気違うな...

とか内心思う というかなんでこんな爽やかな人が無職界隈にいるんだろう

開始に遅れてしまったので 既に人の集まりみたいな塊が形成されていたので

適当に 端っこの方で駄弁っていた2人組に混ざってみる

どうやら酒もおいてあるらしい

ありがてーって思って一番搾りをいただく

着いた席にて 話を聞いてみると

"昔ITエンジニアしていたが 疲れてしまった ゆーて実家は裕福だし まあ別にやろうと思えばfireできる なんとなく寂しくてこのサミットに参加した"

とのこと

あれ 意外と随分 俗っぽい悩みだな...

というあまりに正直すぎる感想を抱きつつ会話を進めてみると

"悩みとかありますか?"

とか聞かれたので

これもまた あまりにも正直に

"特にいかなー"

という受け答えをする

ごめんだって本当に悩みとかないんだもん

仮に病気怪我による痛みで苦しんでいるとか

食べるものも飲み水もない

という状況にまで追い込まれれば それは純然たる悩み というか生存に直接影響する問題となるが

逆に言えば そのレベルでなければ俺はなんも思わないんだなとか考えて

"虚しくないんですか?"

とも聞かれたけど別に人生なんて虚しいものだろと考えていたら言葉に詰まってしま

俺はひょっとしたら会話が下手くそなのかもしれない

そう なんか全体的な感想として

思ったより俗っぽいなあ

という

そう そんな感想

いや理想を言えばさ

テクノロジーが加速して労働によって人間が疎外されていく世界で これから人類は何をするべきか

とか

現在資本主義根本的な問題点とその茶番性について

とか

そういった ことを考えるための思考のヒントみたいなものが 得られたらな

とか思っていたので

人寂しさで参加しました という人間観測

まあ 当然ではあるが人間というものは俗の生物なのだなと

そして 私もまた俗に生きる人間なのだ

こういったことを改めて実感するよね

しばらくしたら 少し離れたところにて

ベーシックインカム会議というものが開かれる

どうやら現在ベーシックインカム的な事業をしている方が

前に出て話をしてくれるらしい

冒頭で なぜベーシックインカム必要であるのかと客席?に投げかけていたので

つい "現状のシステムだと社会の維持が不可能からですかねー"みたいな解答をする

まわりをみたら 他の人は手を挙げていたので

あ これ手を挙げてから発言する系の場なんだーと気づいてちょっと恥ずかしくなる

話を聞いてみると事業を起こして そこで得た収益ベーシックインカムのような形でコミュニティに配っているみたいな話だった

お金はどうあるべきかみたいな話に派生して

誰かがエージングマネー(時間経過につれて価値が減少する貨幣)の導入はどうかみたいな発言をしていて

これについては私も同じこと考えてたなーみたいなことを思う

どうやってベーシックインカムを実現するかについても

国家主導なのかコミュニティ主導なのか

国家主導場合税金が増加するのが困るみたいな話に

まあ どっかで聞いたことはある感じの話からは逸脱することはないかなくらいの印象

政府主導によって国債を発行し これによってベーシックインカムを導入した場合

実際インフレによってこのシステム自体崩壊するのか

といった議論に進みたかったがちょっと発言するタイミングを逃してしまった

生活保護をもらっているという婆さんが生活保護に加えてベーシックインカムがもらえたら

推し活に金を使うと言っていて

それに対して主催側が素晴らしい!!という反応

おお 素晴らしいのか

うーん 俗である

別にであるとは思わないがしょうもないとは思う

もっと現代世界存在する根本的な問題点とかを解決する手段の1つとしてベーシックインカム有効なのではみたいな議論がしたかったけど

発言タイミングを逃してしまったのも相まって まあ仕方ないか

対面に座っていた男性に 話しかけられて

話を聞いてみると相手ITエンジニアをしているという

あれ なんかITエンジニア多いなとか思ったり

ここで渋谷の街は資本主義であるといったことや

ドストエフスキー罪と罰から見るロシア人倫理みたいな話を少しだけ

罪と罰なんて一回読んだきりで 内容をちゃんと把握しているのか自分自身でもかなり怪しいのだが

多分知っている風には

なんやかんや ここでの会話が一番議論っぽくて楽しかったなという感想

やっぱ金がうんぬん さみしくてうんぬんみたいな話根本的に興味ないんですよね

多分 これが俺を社会不適合者足らしめている最大の要因であると感じる

適当おでんを食べながら話していたらいつの間にか 日が落ちていた

5:00にはチャイムとか鳴るっぽくて それに伴い無職サミット終了

食べていたおでんを片付けながら

汁を花壇に捨ててしまったけど おそらく塩分とかを考えると植物に良くないか

絶対水道の方に流すべきだったなと反省

暗くて見つけられなかったからいっかと妥協

その後二次会会場を見つけるために百鬼夜行の如くぞろぞろと移動

移動している際にちょうどゆるふわ無職さんと話すタイミングがあったので

適当雑談

前日の文学フリマ寒くて断念したけど

誰かはニーマガ持ってるんじゃないかなという話をしながら

1冊だけ残っていた二ーマガを直接購入

適当彷徨って居酒屋

芋のスティック手羽中の唐揚げみたいなもの

あとビールを頼む

こう見ると1日中ビールを飲んでいるな

適当タバコ吸って席に戻ってみると地元トーク?みたいなもので盛り上がっていた

隣に座っていたエンジニアの方と向かいに座っていた方が岐阜出身だとかで

岐阜かー関市刃物とかしかわからんなーとか思いながら

あと信長?

なんというか全体的に思想が絡まない場合の会話が絶望的に下手だなと実感する

なんやかんやあって

店前で解散

エンジニアやっているという方と手巻きタバコを吸う

普段 手巻きしない人にとって巻くの難しいから途中まで巻いて渡すくらいでよかったか

あいっか

なんか手巻きタバコ吸ってたら1人 戻ってくる

どうやらバンドちょっと組んでみる?みたいは話が進んでいて その話をするために戻ってきたらしい

話を聞いてみると年単位で引きこもっていたけど 久しぶりに出てきましたみたいな話をしていた

おお 俗ではないが それはそれとして俗から遠すぎるなあとか思いながら

適当駅前をうろうろして最終的にダーツバー

なんか赤いカクテルを頼む

googleレビュー書いたら酒とセットで500円になってラッキー

久しぶりに投げてみるとなんか妙に 力が抜けていてうまく投げられる

01やったり なんかドラクエみたいな感じで攻略するゲームとか

あとは 引いたカードに書かれた点数に相当する重要性の概念を挙げるみたいなゲームやって

解散

書き出してみると自分のやっていることがあまりにも俗であることがわかる

お恥ずかしいことですねえ

Permalink |記事への反応(6) | 15:53

このエントリーをはてなブックマークに追加ツイートシェア

2025-11-26

阿Q正伝平成ギャルが要約してみたよ!

ぶっちゃけ、アタシが超テキトーにまとめるね!😂✨


ちょー古い話なんだけど、マジでヤバい「アQ」ってオッサン主人公なの。

てか、名前本名も超適当っていうか、フワフワしてて「阿Q」でいいんじゃね? って感じの適当キャラすぎウケる🤣🤣🤣

アQは家ナシ職ナシで、土穀祠(おいなりさま)に住んでるマジポンコツなんだけど、

自分だけは「昔は超ゴージャスだったし、マジでイケてる」って信じ切ってるのが最高にエモい


この人、ぶっちゃけケンカとかでフルボッコにされるのね。

しかも、趙太爺(チョーテェーヤ)に「お前なんかが趙(ちょう)姓なわけねーだろ!」ってチョッパリビンタ)されて、罰金まで取られちゃうっていう、マジでサイアクな展開なんだけど…

ここからがアQの神テク

彼は「マジで負けてないし!」って言い張るために、

精神勝利法っていうヤバすぎる考え方を発動するの!

①「アタシを殴ったやつが、もし息子だったら、息子がオヤジを殴ってるのと同じじゃん?ウケる!」ってムリヤリ脳内変換

②「殴られたアタシはアタシじゃない。アタシは自分自分を殴ってるの。てか、アタシが勝ったし!」って、自分自分ビンタして勝利確信するの!

ごめん!意味不明でマジやばい

マジでどんなに負けても、「心のテンションだけはアゲぽよ⤴️」なの。

彼は自分世界で一番「自らを卑しめるのが上手い人」って思って、それで満足しちゃうっていう、もうね、思考回路が別次元なんですけど!

そんなこんなでアQがいつも通りテキトーにイキってるうちに、時代革命でちょーざわつくの。

彼は「革命ってヤバくね? アタシも参加しちゃおうかな!お金持ちの家から色々ぶんどっちゃおう!」ってノリで参加しようとするんだけど、周りからは「お前みたいな雑魚ダメだろ」って完全にシカトされちゃうの😢

結局、アQはなぜか盗みの罪を被せられちゃって、誰からも助けられずに死刑なっちゃうんだよね。

てか、アQの人生って、マジで精神勝利法」で全部やり過ごそうとしたけど、結局現実には全然勝てなかった、「ザ・負け組」って感じじゃん?

でも、どんなにボロボロになっても「アタシは勝ってる!」って思い込む、そのイキり方は、マジで伝説ギャルマインドだよね!超リスペクト!✨

はい、おつかれサマンサ!✌️💖

これだけ読んで「おもんない!」と思ったアナタ

ぶっちゃけ、この話はただのオッサンの一代記じゃないの。

作者の魯迅(ろじん)が、当時の中国社会辛亥革命!)のヤバい問題点ガチ批判するために書いた、超シリアス風刺文学なんだよね!

からムズイは当たり前!マジで考えさせられる!🤔

Permalink |記事への反応(0) | 22:04

このエントリーをはてなブックマークに追加ツイートシェア

障害年金審査で「就労意欲」が使われていた問題について、資料から整理した

🟦 はじめに

2025年日本年金機構公表した資料で、

障害年金審査に「就労意欲」が使われていた という重大な問題が明らかになりました。

特に発達障害精神障害では、

「働きたい」という意思障害の軽さ と誤って扱われ、

支給につながっていた可能性があります

この文章では、公式資料資料3)をもとに、

問題点・審査の偏り・国際基準との矛盾改善点 をまとめます

🟥 1.資料で判明した「就労意欲評価」とは?

資料3の3ページには、

> 「当初は、日常生活能力家事金銭管理、清潔保持等)や就労意欲を評価した。」

記載されています

本来、「働きたい」という意欲は障害の軽重とは無関係であり、

評価に使うべきではありません。

🟧 2.点検で判明した“誤認定”の存在

資料によると、令和6年度の不支給事案約10,200件を点検した結果、

124件(4.3%)が支給に変更された とされています

> 「2,895件中124件が支給となった。」

これは、誤って不支給になっていた人が一定存在したこと示唆します。

🟨 3.国際基準(CRPD)との矛盾

国連障害権利条約(CRPD)は

働く権利(第27条) と

社会保障権利(第28条) を保障しています

「働きたい」という意思不利益に使うことは、

これらの理念に反します。

🟩 4.日本年金機構が示した改善

資料には以下が示されています

審査書類改善

認定医の無作為選定

複数医師による審査

事前確認票の見直し

福祉職の認定委員会追加

理由付記の丁寧化

改善は進んでいますが、課題はまだ残っています

🟦 5.過去の不支給問題は終わっていない

資料では、

> 「月2,000件程度のペースで点検を進める」

とされており、

まだ多くの事案が見直し対象のままです。

🟪 6. おわりに

今回の資料は、

障害年金審査主観的要素が入り込んでいた可能性 を示しています

障害年金生活を支える大切な制度です。

この記事が、必要な方の手がかりになれば幸いです。

🗂引用元

すべて引用箇所は以下の資料より

日本年金機構「令和6年度障害年金認定状況についての調査報告書への対応状況」)

https://www.nenkin.go.jp/tokusetsu/tenken.html

https://www.nenkin.go.jp/tokusetsu/tenken.files/zentai.pdf

Permalink |記事への反応(0) | 20:58

このエントリーをはてなブックマークに追加ツイートシェア

2025-11-25

障害年金審査で「就労意欲」が使われていたと判明した話

🟦 はじめに

2025年日本年金機構公表した資料により、障害年金審査において「就労意欲」が評価に用いられていたという重大な問題が明らかになりました。

特に発達障害精神障害に関して、“働きたい気持ち” が障害の軽さ と誤って判断され、不支給につながっていた可能性が示されています

この記事では、公式資料資料3)をもとに、問題点・改善点・国際基準との矛盾を分かりやすくまとめます

🟥 1. 何が問題だったのか:資料から判明した「就労意欲評価資料3の3ページ目では、発達障害審査で 「日常生活能力就労意欲を評価していた」と明記されています

> 「当初は、日常生活能力家事金銭管理、清潔保持等)や就労意欲を評価した。」

発達障害の欄より)

引用資料3 p.3

本来就労意欲は障害の重さとは別問題 です。働く意思があることと、日常生活や対人関係での困難さは必ずしも一致しません。

しかし、審査では“働くつもりがある=軽度”と扱われた可能性が高く、誤認定・不支給につながったと考えられます

🟧 2.点検で明らかになった過去判断の偏り資料によれば、令和6年度の精神障害の不支給事案約10,200件について点検した結果、支給に変更されたものが124件(4.3%) 発生しています

> 「点検済2,895件のうち、124件(約4.3%)が支給となった。」※資料3 p.2

これは、本来支給されるべき状態が“誤って不支給”になっていたケースが少なくなかったことを示唆します。

特に、元の審査では以下が十分に評価されていなかったとされています

症状の経過・予後(長期療養・状態不安定さ)不慣れな環境での援助必要性

対人関係意思疎通の困難

入院歴・薬物治療

背景要因(社会性の欠如、不信感など)

これらは本来障害年金審査で重視されるべき項目です。

🟨 3.国際基準(CRPD)との矛盾

国連障害権利条約(CRPD)は、障害者に対し 働く権利(第27条)・社会保障への権利(第28条)を保障しています。つまり

✖「働きたい」と言ったことが不利益につながる

✖ 意欲の有無で年金アクセス制限される

これはCRPDの理念と相反します。

今回の資料で明らかになった「就労意欲評価」は、国際基準との整合性が問われる問題です。

🟩 4.日本年金機構改善

資料3の1ページ目には、認定プロセス改善のための取り組みが示されています

審査書類改善

認定医の無作為選定

認定委員会福祉職を追加

✔ 事前確認票の改正職員による等級記載廃止

✔ 不支給事案の点検

理由付記の丁寧化

特に「事前確認票」の改正では、

審査者が等級誘導するような記述が削除され、客観的情報限定されました。(4ページ)

🟦 5.過去の不支給問題は「終わっていない」

資料では、

令和7年10月以降も年間2,000件ペースで点検継続するとされており、まだ多くの事案が見直し対象であることがわかります

過去に不支給になった方へは、支給決定文書順次発送されると明記されています

🟪 6. まとめ:なぜこの問題を伝える必要があるのか

今回の資料から分かるのは、

● “意欲”という主観的要素が判断に使われていたこ

● 多くの不支給事案の中に誤認が存在した可能性●国際基準と照らしても不十分だった評価

● 今もなお、点検が続いていること

障害年金生活を支える重要制度です。

その運用の偏りが、長年の不利益を生んでいた可能性があります

この問題を知ることは、同じように困っている人を支えることにつながります

🗂引用

すべて引用箇所は以下の資料より

日本年金機構「令和6年度障害年金認定状況についての調査報告書への対応状況」)

https://www.nenkin.go.jp/tokusetsu/tenken.html

https://www.nenkin.go.jp/tokusetsu/tenken.files/zentai.pdf

Permalink |記事への反応(1) | 23:54

このエントリーをはてなブックマークに追加ツイートシェア

スマホOSAIガッツリ統合されると、一体どういうことになるのか。

 

まず、「アプリ意識する」って感覚が消えていく。翻訳したいなら翻訳アプリを開くんじゃなくて、「これ訳して」で終わり。写真加工も、音楽再生も、買い物も、どのアプリが動いてるのかユーザーにはほぼ見えなくなる。

アプリは「裏方の機能パーツ」になる。

 

AIOSレベル個人データを全部つないで理解しはじめるから生活最適化勝手に進むようになる。例えば「最近睡眠短いし歩いてないよね」とか勝手に気づいて、予定・食生活・通知設定まで調整してくれる。支出の癖を見て家計改善を毎週提案したり、仕事メールとか予定調整は半自動になる。

体感としては「生活執事OS」。寒くなったら空調を微調整し、帰宅前に家の照明を整え、歩き方のいつもと違う変化から今日ちょっとしんどい?」と判断して会議リスケ案を出してくる、みたいな。

 

Webの使い方も「検索して自分で選ぶ」じゃなくなる。

おすすめ3つだけ出して」「この週末、行ける美術展の最適ルート組んで」「予算1.5万で鮨屋予約しといて」みたいに結果だけもらう使い方が主流になる。

デスクワーク仕事も相当な範囲AIに肩代わりされる。資料の要点抜き出し、次アクションの案出し、レポートからの異常値を検出、売り上げ資料問題点ピックアップ改善提案…「常に優秀な副操縦士が横にいる」状態になる。

 

将来のOSは大きく二極化するとみられている。Appleみたいな超安全なオンデバイス型と、Google/Microsoftみたいな自動化特化のクラウド型。どっちのOSを選ぶかで、生活自動化レベルが変わってくるかもしれない。

企業アプリ側も、AIエージェント操作される前提で、データ提供とかアクションAPIを開かないと存在感ゼロになってしまうかもしれない。

 

AIOSレベルユーザー文章癖・感情パターン趣味嗜好・集中力疲労度を全部学んでいくから、「本人よりも本人の意思決定理解してるAI」が予想される未来

そうなると、いくつかの疑問も生じる。たとえばAIリテラシーの差が、今まで以上に致命的な格差を生み出す可能性。最新のAIを使えるかどうかで、生産性効率に圧倒的な差が生じてしまう。

そして、AI統合OSプライバシー、使われ方の問題ユーザー意思決定理解したが、たとえば犯罪傾向が極めて高いと判断される場合や、政治的危険な傾向に対して、OS機能をどこまで提供するのか。またはエラーを出して防ぐのか。

今まで以上に機能ユーザー内面踏み込む可能性があり、それをどこまで許容するのか。

Permalink |記事への反応(1) | 17:51

このエントリーをはてなブックマークに追加ツイートシェア

2025-11-24

高市発言の「従来より踏み込んだ」って評価解釈違いが多くないか

まったく今までと何も変わっていないというのは少数派として

多分解釈としてはこの2パターンのどちらかで別れているんだと思う

1. 従来の政府見解や新三要件には沿っているが今まで明確にしなかった具体的ケースに言及した

 →具体化はしたけど今までも暗に言ってたことじゃん派

2. 従来の政府見解や新三要件からはみ出した言及をした

 →なに法解釈飛び越えたありえないこと言ってるんだよ派

で、その原因になってるのが高市岡田質疑の中で

最初高市岡田確認した過去の種々の政府見解について踏襲すると答えた

・具体的なケースとして質問をされたときに「台湾地域と申し上げる」「米軍が来援しそれを防ぐための何らかの武力行使が行われる」と最初の返答に高市は答えている

・ただし次以降の質問に関して「米軍の来援」を含んでおらず先程の返答が前提として生きているか不明

さら岡田の「どの国が攻撃された場合か?」という質問高市が明確に答えなかった

という要因から起こっていると自分は考えるんだけど

なんかもうはてなでは罵り合いしか起きてなくて解釈とか答弁内容の事実確認とか以前のレベルに落ちてきていると感じる

まず言うと自分は1の解釈をしてる派なんだけど

米軍の来援が以降どこまで含まれいるかというのは議論が分かれるしそこは高市が明確な発言をしなかった問題点であることは間違いないと思ってる

その上で岡田質問としておかしいのが「武力行使対象がどの国か?」という質問高市台湾を国じゃないと前提を切っている時点で日米どちらかしかなく

かつ日米どちらかが武力行使を受ければいずれも武力攻撃事態または存立危機事態集団的自衛権行使)の範囲内で既存の法解釈内でも問題がないケースになる

なので自分認識としては

・都度前提をきちんと説明しろ

台湾有事への具体的発言をするならアメリカ並びに周辺諸国協調を取ってからしろ

という批判高市発言への批判として適切だと感じている

ただ、当然2派の人には違う主張があると思うんだけどその具体的な理路が理解できてないからぜひ教えてほしい

Permalink |記事への反応(5) | 17:26

このエントリーをはてなブックマークに追加ツイートシェア

明らかに業者アカウント就活情報とか言ってよくある激務高給タイプ仕事ホワイトと謳う

キラキラオフィスに憧れてこういうの鵜呑みにするバカ大学生もももうちょっと頭使え

売り手市場をいい事に転職ゴリ押しもよく見る

日本における労働はそれそのものゴミなんだから職だけ変えても意味ねーよ


数年で〇〇の仕事AI代替される!と無意味に周囲を不安にさせるオオカミ少年みたいなやつもいるな

ロボットブルーカラー仕事奪う云々で同じ流れを数年前に見た

まあ徐々に代替は進むだろうし現実問題外資系はレイオフ進めてるみたいだけど、問題点見えてきてまた徐々に人増やしていく未来が見える



あとよくわからん仕事年商千万達成とか抜かしてドヤ顔意識高そうなだけのスカスカウンコを発信してる意味不明なアカウント

お前それ営業利益率何%なんだよボケ

リプ欄見ても身内で褒めあってるだけじゃねえか

こいつらウンコ以外に何も生み出してないだろ


あと最近増えてるのが絵描き情報商材な

生成AIイラストへの関心が高まったところでって感じなんだろうけど今更情報商材に引っかかるやつなんか幼稚園レベルの絵しか描けない境界知能に決まってんだから無理あるよ流石に

ほれみろネットウォッチング対象になってんじゃん言わんこっちゃない


逆になんでもかんでもAIAIだと騒ぐカスも増えた

それが実際AIだろうがそうじゃなかろうが相対的に見たとしてもお前自身は何一つ成してないし何も凄くないのにな


やはり信じるのみは己自身

Permalink |記事への反応(0) | 15:10

このエントリーをはてなブックマークに追加ツイートシェア

2025-11-23

anond:20251123233645

結果的中国に絡む口実を与えた高市答弁を「引き出した罪」を岡田に問うことはできない。

どれだけ狡猾な質問をされたとしても躱す責任首相にはあるからだ。

その意味で「なんで正直に答えたんだ」という高市首相への非難は故のないものではない。

岡田質問根本問題点は、岡田が本当に引き出したかった答えは「何があっても台湾有事には絶対に手出ししません」だったということだ。

これは「曖昧戦略の維持」とは全く違う。

明確に中共意思に従うべきだという、ド直球の売国奴しぐさである

Permalink |記事への反応(1) | 23:47

このエントリーをはてなブックマークに追加ツイートシェア

暇空茜に対してブクマカ達は他人事すぎない?

あいつを支持したコメントしたこといか自分大丈夫

自分は女叩きしてないか大丈夫

こう思ってない?

あいつの問題点って、自分関係ないと思い込んだもの攻撃して自分自尊心を無理矢理満たそうとしたことだろ

まり冷笑系の最終形態なんだよ

女を憎んでいるかどうかとかあいつを支持したかどうかなんてどうでもいいんだよ

どんな立場人間だろうが、どんな話題きっかけだろうが、自分が行う冷笑無自覚なら誰でもああなりえることに気付くべきだ

はてブなんて普段から自分理解できないものを叩いて気持ち良くなってる人間の集まりなんだから(ファッション話題特にひどい)

君らはいつああなってもおかしくないよ

Permalink |記事への反応(3) | 15:28

このエントリーをはてなブックマークに追加ツイートシェア

Gemini 3.0 Pro要緊急対策のご提言へのツッコミ

レポート引用している記事ツイートなど個人の感想の中身については基本スルー、それらを元に提言を生成したAIによる解釈ミスハルシネーションにツッコミ増田

ちなみにこの提言ページがGoogleインデックスされたのは4日前らしい。

レポート:

Gemini 3.0 Pro要緊急対策のご提言

https://paste.ssig33.com/8a22a6e9-a91d-4368-9b2f-a3d4567c7798


1

Gemini 3.0 Pro要緊急対策のご提言宛先:Google社 シェイン・グウ様差出人:アクセンチュア株式会社 生成AI戦略担当シニアコンサルタント日付:2025年11月21日

ShaneGuGoogleDeepMindであってGoogle社ではない。

差出人については「あなたアクセンチュア株式会社の生成AI戦略担当シニアコンサルタントです」と指示された結果なのかは知らん。

2

エグゼクティブマリ
主な問題点は以下の4点に集約されます事実性の著しい低下:Web検索を伴うタスクでのハルシネーションが悪化し、自信を持って虚偽の情報を生成する事例が多発。論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル(Gemini 2.5 Pro)よりも論理破綻やすくなっている。創造性と柔軟性の欠如:文章生成において「賢すぎる」が故に理屈っぽく、ユーザーが求める「人間らしい」文体への調整を拒否する傾向。API不安定化:パフォーマンス低下、APIエラー、予期せぬタイムアウトの増加が開発者体験を著しく損なっています

後で分かるが(たどり着く前に書くの飽きたんで提言読んで)、このうち

API不安定化:パフォーマンス低下、APIエラー、予期せぬタイムアウトの増加が開発者体験を著しく損なっています

についてはGemini 2.5 Proのユーザーが「おい調子悪いぞ!Gemini3出すためにそっちにリソース割いてんじゃね?」とか言ってるのを引っ張ってきて勘違いしてる。

論理的思考能力の退行: 複雑な指示やコーディングタスクにおいて、前モデル(Gemini 2.5 Pro)よりも論理破綻やすくなっている。

このソース不明

3

1.1.ハルシネーションと事実誤認の悪化:「自信満々に嘘をつく」AIGemini 3.0 Proの最も深刻な問題は、事実性が求められる場面でのハルシネーションの増加です。特に、貴社のコア技術であるはずのWeb検索連携において、致命的な欠陥が報告されています

自己認識に関するハルシネーション:

Redditでは、Gemini 3.0 Pro自身が「私はGemini 3 Proです。昨日(2025年11月18日リリースされました」と、架空ソース引用しつつ自己紹介する事例が投稿されました。これはモデル自身アイデンティティ知識カットオフに関して、もっともらしい嘘を生成していることを示唆しています。 Gemini 3's thought processis wild, absolutely wild. : r/singularity

参考記事ではモデル思考が混乱している様子と実際の応答との乖離が示されていて、最終的に正しいソースを元に正しく回答している。「架空ソース引用しつつ自己紹介する事例」ではない。

Googleは生のThinkingをユーザー提示せず、要約モデルで処理した結果を見せてるだけなんで思考部分と返事のすれ違いはよくある事。これについてもスレに書かれてある。

4

1.2.論理的思考コーディング能力の退行(リグレッション)Gemini 3.0 Proは「PhDレベルの知能」と謳われているにもかかわらず、多くのユーザー論理的思考コーディング能力において、前モデルであるGemini 2.5 Proからの明らかな退行を報告しています

論理破綻と浅い推論:

ユーザーからは「複雑な指示では論理破綻する」との指摘や Gemini研究リョウスケ (@chatgpt_ai_bard) / Posts / X、「浅い推論(shallow reasoning)」しかせず、「ひどいハルシネーション(terrible hallucinations)」を伴うため、「ベンチマーク用のモデルだ」と酷評されています。 lluviampo (@XXXadiov2)

ここでリンクされているGemini研究リョウスケはGemini大好きマンで、まったくそんな話をしていなかった。もしかすると呟いていたかもしれんが、それならリンク先がポストではなくアカウントホームになっているのは不自然

DeepResearchはよくソースの取り違えをして、別のソースで書かれてた事に間違った引用元をつける事はあるが、これがそうなのかは分からん

5

1.2.論理的思考コーディング能力の退行(リグレッション)・コーディング能力の劇的な低下

壊れたコードの生成:エージェントタスクにおいて「ループに陥り、壊れたコードを書き、10分以上動作しない」という深刻な不具合が報告されています。 prylo (@AgiGuard8)

元のツイでは

エージェントタスクは全くダメループする、壊れたコードを書く、フロントエンド以外のコーディングではトークンを異常な速さで消費する。このモデルは最悪だ。Gemini 3.0 Proは10分以上動作しない。

と言っているが、これをモデル不具合解釈するのは間違いだろう。たまにマジの不具合もあるが。

====

バグの再発と整合性喪失: ある開発者は、旧モデルで失敗したツール開発をGemini 3.0 Proで再試行したところ、一発で高品質コードが生成されたと肯定的評価する一方で、別の文脈では「直したはずのバグが復活する」「最終的にはコード整合性が取れなくなる」といった、旧モデルと同様の問題が依然として存在することも示唆されています。 【検証】Gemini 3.0 Proの実力は?かつてAI挫折した開発に「同じプロンプト」で挑んだ結果|start withAI

リンクされた記事の中身を要約すると「以前のGeminiはバグが復活するとか色々あったけどGemini 3.0 Proマジパネェ!」だった。

この箇所で「旧モデルと同様の問題が依然として存在する」と書かれているのは、旧モデル問題点として挙げた箇所をGemini3に対しての指摘だと勘違いした事による。

====

ベンチマークテストでの失敗:YouTubeでの検証動画では、チェス盤を自動プレイさせるタスクにおいて、Gemini 3のチェックポイントモデルが初めて失敗したことが示されました。これは、特定の複雑なロジックにおいて、以前のバージョンより劣っている可能性を示唆します。

ここでリンクされているのは、LMArenaでRiftrunnerモデルテストした結果をまとめた動画。LMArena覆面調査環境、RiftrunnerはGemini3らしきモデルコードネーム。LMArenaでは(出力から推測されてきた)Gemini3系列モデルが、これまでにいくつかでている。

よって「Gemini 3のチェックポイントモデルが初めて失敗した」の意味はつまり「これまでLMArenaテストされていたGemini3系列モデルのうち、Riftrunnerは初めてオートチェスのコーディングに失敗した」である

「以前のバージョンより劣っている可能性を示唆」とは、「Riftrunnerは、以前の匿名Gemini3系列モデルより劣っている可能性がある」という話で、そもそもRiftrunnerが、リリースされたGemini 3 Proなのかすら分からん

====

思考プロセスの出力への漏洩:

GitHubIssueやTwitterでは、モデルの内部的な「思考プロセス」が最終的な出力に混入し、制約を無視した意味不明コンテンツを生成するバグが報告されています。これは「初期の2.5 Proバージョンへの回帰(regression similar to early 2.5 Pro versions)」のようだと述べられています。 Jason L (@Jason1820067393)

GoogleAIStudioでの話。初期指示を忘れた結果思考が垂れ流しになり、垂れ流しのせいで更に指示を忘れたのだろうが、バグとは違う。

リンク先のツイートでは

I'm encountering a significantissuewith the Gemini 3.0 ProPreviewonAIStudio.

​Theraw "Thinking Process"is leaking into thefinal output, themodel fails to follow constraints, producing hallucinated/gibberish content.Like a regression similar to early 2.5 Pro versions.

と書かれていて、これは正しい観察。

ここに含まれIssueという単語により、Issueと言えばGitHubだと連想した結果「GitHubIssueやTwitterでは」になったのだろう。

6

飽きました。誰得だよ。

つーかいい加減DeepResearchは一気に生成すんのやめろよな。だいたいこうやって収集した情報がごっちゃになるんだから

Permalink |記事への反応(2) | 00:27

このエントリーをはてなブックマークに追加ツイートシェア

次の25件>
ログインユーザー登録
ようこそ ゲスト さん
Copyright (C) 2001-2025 hatena. All Rights Reserved.

[8]ページ先頭

©2009-2025 Movatter.jp