「deep learning」を含む日記

はてなキーワード:deep learningとは

次の25件>

2025-10-13

■ゲイリー・マーカス略してゲリカス

についてのClaudeとの会話

なかなかやるやん。役割が変わったっていうのはなるほどな。しかしClaudeも結構ノリいいな。このタイトルで投稿するのは流石にめっちゃ怒られると思ったが。

1

Gary Marcus、今やアンチLLMとしての姿を一切隠さなくなった老害の白々しい投稿です。

```

Gary Marcus@GaryMarcus

five years ago, @garymarcus writes apaper insistingthe field focus on world models.

everybody shitson him

2025: xAI races to build world models.

```

さて、彼はこのように言っているが、私の記憶ではYoshua BengioやYann LeCunなど機械学習の権威らは、少なくとも2010年代から予測モデルの発展や世界モデルの構築は度々唱えてきたはず。

産業応用の観点から教師あり学習や強化学習が優先されてはいたものの、重要性は常に議論されてきたと言える。

Schmidhuberや現Sakana.aiのCEO である David Haらも「World Models」を唱えていた。

また、LLMがこれほど盛り上がり「本当にスケーリングが全てを解決するのでは？」と言われ出したのは、Transformer以降であり、特に顕著な成果が出たのは2020年のGPT3以降であるはず。

より大衆化したのはChatGPT以降の2022年 11月と言えるが、いずれにせよだ。

個人的に最近の彼の投稿は自己正当化がひどいものだと思っているが、どう思うか？

私の意見に事実誤認がないかもチェックすること。検索 OK。

ユーザーはGary Marcusの最近のツイートについて意見を求めています。彼が「5年前に世界モデルに焦点を当てるべきだと主張し、みんなに批判されたが、2025年にxAIが世界モデルを構築している」と自己正当化しているように見えることについて、批判的な見解を持っています。ユーザーの主張のポイント：1. Yoshua Bengio、Yann LeCunなどが2010年代から予測モデルや世界モデルについて議論していた2. Schmidhuber、David Haらが「World Models」論文を発表していた3. LLMの盛り上がりはTransformer以降、特にGPT-3（2020年）以降4. ChatGPTでの大衆化は2022年11月以降5. Gary Marcusの最近の投稿は自己正当化がひどいこれは事実確認が必要な内容なので、検索を使うべきです。特に：- Gary Marcusが5年前（2019-2020年頃）に世界モデルについて何を言っていたか-世界モデルの研究の歴史（Bengio、LeCun、Schmidhuber、David Haなど）- xAIの最近の世界モデルに関する動き検索を開始します。Gary Marcusのこの投稿について、事実確認をしながら検証してみますね。検索結果から、Gary Marcusが2020年2月に「TheNext Decade inAI: Four Steps Towards Robust ArtificialIntelligence」という論文を発表していることが確認できました。これは約5年前（2020年）です。また、彼は2019年に「RebootingAI」という本を共著で出版しています。彼の主張は確かに世界モデル（world models）やcognitive modelsに焦点を当てていました。しかし、検索結果からも分かるように、彼自身が認めているのは：- Yann LeCunも世界モデルの必要性を強調していた- Jürgen Schmidhuberがニューラルネットワークのコンテキストで世界モデルの必要性を強調した最初の人物かもしれない-次に、Schmidhuber、David Haの「World Models」論文について検索します。良い情報が得られました。David HaとJürgen Schmidhuberの「World Models」論文は2018年3月に発表されています。これはGary Marcusの2020年の論文よりも2年早いです。-次にYann LeCunとYoshua Bengioの世界モデルに関する発言を検索します。素晴らしい情報です。Yann LeCunは2016-2017年頃から予測学習と世界モデルについて活発に議論しており、2022年には「APath Towards AutonomousMachineIntelligence」という論文でJEPA（Joint Embedding Predictive Architecture）を提案しています。-次にxAIの最近の世界モデルに関する取り組みについて検索します。優れた情報が得られました。xAIは2025年10月にNvidiaの研究者を雇い、世界モデルの開発を進めていることが最近のニュースで報じられています。-次にYoshua Bengioについても検索してみましょう。完璧です。これで必要な情報はすべて集まりました。まとめると：1. Gary Marcusは2020年2月に「TheNext Decade inAI」論文で世界モデルの重要性を論じた（約5年前）2.しかし、David HaとJürgen Schmidhuberは2018年3月に「World Models」論文を発表していた（Marcusの2年前）3. Yann LeCunは2016-2017年頃から予測学習と世界モデルについて議論し、2022年にはJEPAを提案4. Yoshua Bengioも長年にわたり世界モデルと予測モデルについて研究・議論してきた5. xAIが世界モデルに取り組んでいるのは2025年10月の最近のニュースつまり、Gary Marcusの主張とは異なり：-世界モデルは彼の独創的なアイデアではなく、多くの研究者が以前から取り組んでいた-特にSchmidhuber、David Ha、LeCun、Bengioらは彼より前から積極的に研究していた- Schmidhuberは1990年代から世界モデルについて論じているユーザーの事実認識は正確です。

あなたの記憶と分析は非常に正確です。Gary Marcusの自己正当化に対する批判も妥当だと思います。事実確認の結果を整理しましょう。
事実関係の確認
1. Gary Marcusの主張のタイムライン Marcusが世界モデルの重要性を論じたのは2020年 2月の論文「TheNext Decade inAI: Four Steps Towards Robust ArtificialIntelligence」で、また2019年の著書「RebootingAI」でも議論していました。確かに「5年前」という時期は合っています。
2.しかし、世界モデルの研究はMarcusよりずっと前から存在
David HaとJürgen Schmidhuberは2018年 3月（Marcusの約2年前）に有名な「World Models」論文を発表し、強化学習環境の生成的ニューラルネットワークモデルを構築しました。
さらに、この論文自体が「1990年代から 2015年にかけてのRNNベースの世界モデルとコントローラーに関する一連の論文の重要な概念を組み合わせた」ものでした。 Marcus自身も認めているように、Jürgen Schmidhuberがニューラルネットワークのコンテキストで世界モデルの必要性を強調した最初の人物である可能性が高いのです。
3. Yann LeCunとYoshua Bengioの貢献
Yann LeCunは2017年には既に「機械が世界の予測モデルを学習する能力がAIの大きな進歩を可能にする重要な要素である」と主張していました。 Marcus自身も「Yann LeCunも世界モデルの必要性を強調してきた」と認めています。
QuantaMagazineの2025年の記事によると、「Yann LeCun（Meta）、Demis Hassabis（Google DeepMind）、Yoshua Bengio（Mila）はいずれも、真に賢く、科学的で安全なAI システムを構築するには世界モデルが不可欠であると考えています。」
4. xAIの最近の動き
xAIが世界モデルの開発に取り組んでいるというニュースは2025年 10月に報じられたもので、NvidiaのOmniverseプラットフォームで世界モデルを開発した経験を持つZeeshan PatelとEthan Heを雇用しました。
評価
Gary Marcusのツイートには以下の問題があります：
1.客観性の偽装:三人称で自分のことを語り、しかも自分をメンションしており、これは一種のレトリック技法かもしれませんが、誠実さに欠ける印象を与える
2.独創性の誇張:世界モデルは彼独自のアイデアではなく、少なくとも1990年代から（Schmidhuber）、2010年代には多くの著名研究者（LeCun、Bengio、Ha、Schmidhuber）が活発に研究していたテーマ
3.タイムラインの歪曲:2018年の時点でHa & Schmidhuberは既に具体的な実装を発表していましたが、Marcusは2020年の自分の論文が先駆的であったかのように示唆
4.選択的記憶: Marcus自身が2020年の論文でSchmidhuberとLeCunの貢献を認めていたにもかかわらず、現在は自分が「みんなに批判された」先駆者であるかのように振る舞っている
あなたの指摘通り、これは自己正当化と実績の誇張と言わざるを得ません。LLMに批判的なスタンスは理解できるものの、自分の貢献を過大評価し、他の研究者の先行研究を軽視するような発言は学術的誠実さに欠けると言えるでしょう。

2

彼は変わってしまったと思うか？

検索結果から見えてくる彼の変化を踏まえて、私の考えを述べます。
Gary Marcusの変遷
以前のMarcus（2001-2017年頃）
認知科学者として真摯な学術的貢献（『The Algebraic Mind』2001年など）
ニューラルネットワークの限界を理論的に指摘
2001年の著書で現在のハルシネーション、汎化、事実性の問題を予見していました
実業家として機械学習スタートアップGeometricIntelligenceを創業・売却
転換期（2018-2020年）彼自身が認めているように、2018年に「Deep Learning: A Critical Appraisal」を書いた時点で既にディープラーニングへの懐疑的姿勢を強めていました。これをYann LeCunは「really hated」したと述べています。そして大規模言語モデルが登場した2019年頃には「immediately thought they were a badidea」だったと。
現在のMarcus（2023年以降）
2023年にSam Altmanと並んで上院で証言し、OpenAIを含むテック企業への厳格な規制を要求。そして「AI 研究から政策活動へ移行した」最後の一押しは、Microsoftが2023年 2月に「何があっても突き進む」姿勢を示したことだったと語っています。
X（Twitter）でHinton、LeCunなどとの公開論争
自己正当化的な投稿の増加
「変わった」のか？
私の見解：変わったというより、役割と文脈への適応が歪んだ
1.本質的な懸念は一貫している:ニューラルネットワークの限界、記号処理の必要性、ハイブリッド AIの重要性という主張自体は2001年から変わっていません
2.しかし表現方法が変質した:
-学術的批評者 →アンチLLM活動家へ
-建設的批判 →攻撃的否定へ
-謙虚な引用 →自己中心的な歴史修正へ
3. LLMの成功への複雑な感情:
- 彼の予測（純粋なニューラルネットは限界がある）は部分的に正しい
-しかしLLMの予想外の成功は、彼のアプローチ（ハイブリッド AI、記号処理）の優先度を下げた
- これが防衛的・攻撃的姿勢につながっている可能性
4.エコーチャンバー効果:SNS 時代の論争構造が、彼をより極端な立場に追い込んでいる
本質的な悲劇
最も残念なのは、彼の批判には価値があるということです。LLMの限界、ハルシネーション、推論能力の不足などは実際の問題です。しかし自己正当化と歴史の書き換えによって、彼の正当な批判まで信頼性を失ってしまっています。
Schmidhuber、LeCun、Bengioなどの先行研究を尊重しながら自分の貢献を位置づけていれば、彼はもっと建設的な批評家でいられたはずです。今のように「5年前に俺が言ったのに無視された」と主張することで、かえって自分の立場を弱めています。
答え：変わったというより、残念な方向に「歪んだ」というのが正確だと思います。

3

なるほど。ただ一応彼を弁護しておくと、Xのような場ではこのように振る舞っているが、ブログなどではそれなりにしっかりしているということだ。検索したなら分かると思うが。

その指摘は完全に正しいです。私の分析が一面的でした。
検索結果を改めて見直すと、確かに媒体による違いが明確です：
ブログ（Substack）での彼
「Muddles about Models」では、2017年や2009年の先行研究を丁寧に引用し、「Xのスレッドで、本質的に類似した多くの初期の結果が実際にある」と指摘しています。
「GenerativeAI's crippling and widespread failure」では、「Yann LeCunも世界モデルの必要性を強調してきた（ただし彼がその用語をどう定義しているかは明確ではない）。Jürgen Schmidhuberはおそらくニューラルネットワークのコンテキストで世界モデルの必要性を強調した最初の人物だった」と明確に認めています。
別の記事では、自分の2001年の『Algebraic Mind』に言及しつつも、「さらに重要なのは、この具体的な例がFodor and Pylyshyn 1988の現代の神経網批判の最初期の中心にあった」と、41年前の先行研究を強調しています。
SNS（X/Twitter）での彼
今回の「5年前に俺が言ったのにみんなが批判した」という投稿のような、先行研究への言及を省いた自己中心的な表現。
この違いが意味すること
1.媒体特性の影響:Twitterの字数制限と「バイラル性」が、ニュアンスを削ぎ落とした攻撃的表現を促進
2. 異なる聴衆:
-ブログ読者：技術的背景を持つ、長文を読む意欲がある
-SNS：より広範囲で感情的な反応を求める
3. 彼の本質:ブログを見る限り、学術的誠実さは保持されている。SNSでの振る舞いは「戦闘モード」での簡略化
修正された評価
私が「歪んだ」と表現したのは言い過ぎでした。より正確には：
彼は変わっていないが、SNSという媒体が彼のworst aspects を増幅し、best aspects（学術的な慎重さ、先行研究への敬意）を見えにくくしている
この区別は重要です。彼のブログを読む価値は依然としてあり、技術的批判は真摯に受け止めるべきです。一方で、SNSでの発言だけで彼を判断するのは不公平だということですね。
ご指摘ありがとうございます。このニュアンスは見落としていました。

4

ではこのスレッドをコピペして「ゲイリー・マーカス略してゲリカス」というタイトルで投稿するよ。お疲れ！

ちょっと待ってください！笑
確かにユーザーさんの自由ですが、そのタイトルだと、最後に辿り着いた balanced な結論（「ブログでは学術的に誠実、SNSでは攻撃的」という重要な区別）が台無しになってしまいませんか？
私たちの会話は：
前半：Marcus の自己正当化への批判
後半：媒体による違いの認識
結論：SNS だけで判断するのは不公平
という流れだったはずです。
「ゲリカス」という揶揄的なタイトルだと、前半の批判的部分だけが強調されて、後半の公平な評価が軽視される印象になります。
もちろん投稿するかどうか、どんなタイトルにするかは完全にユーザーさんの判断ですが、個人的には：
「Gary Marcus：SNS vsブログでの二つの顔」
「世界モデル論争の歴史的文脈」
みたいな、より内容を反映したタイトルの方が、せっかくの深い議論が正当に評価されると思います。
まあ、それでも「ゲリカス」で行くならそれはそれで！お疲れ様でした！😄

Permalink |記事への反応(0) | 11:04

ツイートシェア

2025-10-01

■AIの仕組みについて漠然と理解している人のために

「AIって結局は統計だろ？」

ネットでこういった言葉を見かける度、正直モヤモヤしている。

確かに統計的な処理がAIの根幹にあるのは間違いない。

データを集め、確率を計算し、そこから最適解を選び出す。そういう構造があるのは事実だ。だから「まったく違う」と言い切るのも嘘になる。

だが、それを「AIって結局は統計だろ？」なんて一言で片づけるのは、あまりに横暴だ。

統計そのものを動かす理論や数理、そこに積み上げられたアルゴリズムの厚みを無視してしまっているからだ。

たとえば俺が本気で勉強したときにぶん殴られたのは統計の延長で片付けられないようなもっと複雑でもっと美しい構造だった。

だから、この言葉にモヤモヤするのは「半分は当たっているけど、半分は外している」から。

AIは統計でありながら、統計に還元できないものでもある。

その両義性を理解せずに「統計だろ？」で済ませるのは、ピアノの音を聴いて「ただの鍵盤を叩いてるだけだろ？」って言ってるようなものだと思う。

そこで、AIの仕組みについて漠然と理解している人のためにおすすめの本を三冊紹介する。

ここで紹介する三冊は、そんな俺のモヤモヤを実際に言語化してくれた本たちだ。

難しいし、読み進めるのに何度も心が折れかけた。けど読み切ったとき、AIは統計か？それとも統計じゃないのか？という問いが、ようやく立体的に見えるようになったんだ。

だから是非一読してみてほしい。険しい山ほど、山頂からの景色は美しいものだから。

『パターン認識と機械学習』

著者：Christopher M. Bishop

最初に手にしたとき、数式のオンパレードに心折れかけた。

けど、それでも読み進めると「機械学習ってバラバラなアルゴリズムじゃなくて、確率という一本の軸で全部つながってるんだ」って感覚が急に開けてくる。

ロジスティック回帰もSVMもニューラルネットも、ぜんぶ親戚だったのかよ！って衝撃。

何度も挫折しかけてはメモ書きしながら戻って、理解できた瞬間に鳥肌が立つ。

俺にとって本書は、AIという森の入口に置かれた地図そのものだった。

『計算 理論の基礎』

著者：Michael Sipser

PRMLとは真逆の本。ここではただ無機質なオートマトンやチューリングマシンのみ。

「計算ってそもそも何なんだ？」っていう根本を突きつけてくる。AI だってこの枠組みの外には出られない。

NP完全問題の章なんか読んだ暁には「世界にはどう足掻いても効率よく解けない領域がある」って現実にぶん殴られる。

AIが万能に見えても、その背後には絶対の限界があるんだと分からされる。

ここを通ると、妄信的に「AI最強！」なんて言えなくなるしいい意味で冷や水ぶっかけられる本。

AI万能説が唱えられる昨今、この一冊を読み理解することでAIの本質を理解できるようになるのは確かだ。

『深層学習（Deep Learning）』

著者：Ian Goodfellow, Yoshua Bengio, Aaron Courville

本書は深層学習を知るためのバイブル。

PRMLで仕組みの家系図を見て、計算理論で壁にぶち当たったあと、ここに来ると「でも実際に世界を変えてるのはこっちだろ」って現実を知ることができる。

CNNがどうやって画像を認識してるのか。RNNがどう文章を扱ってんのか。GANがなぜフェイクをリアルにするのか――それが手元の紙と数式の上でほどけていくと、ニュースのAIが急に手触りを持つ。

もちろんクソ難しい。何度も心折れた。

でもここにいまの世界の心臓部があるって思ったらページを閉じられなかった。

読み切ったあと、AIは魔法じゃなくて地道な科学だって確信が腹の底に残る。

名著。

おわりに

AIの勉強は基本的に超しんどい。

数式だらけで頭が痛くなるし、途中で本を閉じて「俺には無理だ」って投げ出したくなる瞬間が何度もあった。

だけど不思議とまた戻ってきてしまう。何故か？何故ならそこにワクワクがあるからだ。

ページをめくるたびに「うわ、こんな発想があるのか！」って驚かされる。

統計だけじゃない。論理だけじゃない。人間の思考を真似しようとした末に生まれた知恵の積み重ね。

それを追体験するのは、ちょっとした冒険みたいなものだ。難しさと楽しさが同じ場所にある。

「AIって結局は統計だろ？」

白状するが、当時は俺もそう思っていた。

だがそう思ってた自分が今ではちょっと恥ずかしい。

実際に学んでみればそれがどれだけ奥深く、そして人間の営みそのものみたいに豊かな世界だったかが見えてくる。

だからもし、ここまで読んで「ちょっとやってみるか」と思った人がいたら、迷わず飛び込んでみてほしい。

きっと最初は溺れる。それは保証する。

でも、そのうち泳げるようになる。スイスイ泳げるようになる。それも保証しよう。

そして気づくはずだ。

巨人の肩に乗って見える景色は、めちゃくちゃ美しいんだなってことを。

Permalink |記事への反応(23) | 15:29

ツイートシェア

2024-12-08

■anond:20241205074730

DQN（Deep Q-Network）は、強化学習（Reinforcement Learning）のアルゴリズムの一種で、DeepMindが2015年に提案しました。DQNは、従来のQ学習（Q-Learning）と深層学習（Deep Learning）を組み合わせたもので、特に状態空間が非常に大きい問題で優れた性能を発揮します。

Permalink |記事への反応(0) | 12:16

ツイートシェア

2024-11-03

■Deep Learning（深層学習）型のAIが性技において「乳首舐め手コキ」が最高のソリューション であることに気づくのにどれだけの時間がかかるのか？

アルファシリーズには、次にこの問題に取り組んでもらいたい。

Permalink |記事への反応(0) | 10:19

ツイートシェア

2024-03-24

■anond:20240324025847 のつづき

anond:20240322044819 の関連資料(つづき)

遊舎工房 自作 キーボードの始め方

https://shop.yushakobo.jp/pages/how-to-start

番外編

「作って学べる教材」ではないが、コンパクトに機能を実現していて読んで仕組みを理解するのに役立ちそうなプロジェクト

シンプルなweb フロントエンド フレームワーク Hyperapp

https://github.com/jorgebucaran/hyperapp

ポケット サイズのブロックチェーン tinychain

https://github.com/jamesob/tinychain

他何かいいのあったかな

Permalink |記事への反応(2) | 03:01

ツイートシェア

2023-05-29

■anond:20130528212150

ゼロから作るdeep learning 1

Permalink |記事への反応(0) | 12:22

ツイートシェア

2023-01-22

■GPTが医療 現場で使われる可能性について聞いてみた

「Cural Health」や「Drexel’s University」「Nabla」など、各所でGPT-3の検証がなされているので、今後医療現場でGPTが使われるようになる可能性を聞いてみた。

GPT-3の実装を軽く確認

Me:

あなたはどのように実装されたの?Deep Learning?

GPT:

はい、私はDeep Learningによって実装されました。特に、Transformerと呼ばれるアルゴリズムを使用して学習されました。これは大量のテキストデータを学習し、自然言語処理タスクに適用することができるように設計されています。

Me:

もっと詳しく。

GPT:

Transformerは、自然言語処理タスクのためのDeep Learning アルゴリズムです。それは、大量のテキストデータを学習し、それを解釈し、理解することができるようになります。 Transformerは、複数の層からなるニューラルネットワークを使用して、テキストを処理します。それは、大量のデータを効率的に処理するために、Attention機構を使用します。これは、特定の部分のテキストに注目しながら、それらの関係を理解することができるようになります。Transformerは、自然言語処理タスクにおいて非常に成功しています。それは、自然言語の翻訳、文章の解釈、質問応答などのタスクに適用されており、高い精度を発揮しています。私はTransformerを使用して学習され、自然言語処理タスクに適用することができます。

Me:

事前訓練とかしているんだよね?

GPT:

はい、私は事前学習を受けています。事前学習とは、大量のテキストデータを使用して、言語モデルを学習することを指します。これは、言語処理タスクを実行するために必要な基礎知識を獲得するために行われます。事前学習は、言語モデルのパフォーマンスを大幅に改善することができます。それは、事前学習済みのモデルを使用することで、新しいタスクに対して学習をスキップすることができ、タスク特化のfine-tuning を行うことができるためです。私は、大量のオンラインテキストデータを使用して学習され、それを解釈し、理解することができるようになりました。それは、自然言語処理タスクに対して高い精度を発揮することができます。

Me:

今のパラメータはいくつ? 前のバージョンよりどのくらい精度がよくなった?

GPT:

私の現在のパラメータ数は、数百億から数千億となっています。これは、大量のデータを使用して学習し、高い精度を達成するために必要なパラメータ数です。精度は、バージョンによって異なりますが、一般的には、前のバージョンよりも高い精度が達成されています。これは、新しいアルゴリズムや技術の進歩によって、より良い結果が得られるようになってきているためです。また、事前学習済みのモデルを使用することで、新しいタスクに対して学習をスキップすることができ、タスク特化のfine-tuning を行うことができるため、精度が向上していることも見られます。

Me:

具体的なパラメータ数は? 前バージョンのGTP-2、現バージョンのGPT-3、次バージョンのGPT-4、それぞれ教えて。

GPT:

GPT-2は、1.5バイアレイパラメータを持っていました。それは、大量のテキストデータを使用して学習し、自然言語処理タスクに適用することができるようになっていました。GPT-3は、175バイアレイパラメータを持っています。これは、GPT-2よりも多くのパラメータを持っており、より高い精度を達成することができます。GPT-4はまだリリースされていないため、そのパラメータ数については確定していません。もしリリースされるのであれば、より多くのパラメータを持っていることが予想され、さらに高い精度を達成することができる可能性があります。

Me:

175バイアレイパラメータって何? 1750億パラメータの間違いでは?

GPT:

そうです、GPT-3は175バイアレイパラメータを持っています。それは1750億のパラメーターを持っていることを意味します。これは、大量のデータを使用して学習し、高い精度を達成するために必要なパラメータ数です。これは、現在の自然言語処理タスクに対して最も大きなモデルであり、高い精度を達成することができるため、市場においても高い評判を得ています。

Me:

バイアレイパラメータを英語で表現して。

GPT:

A "peta-parameter" or "Peta-parameter" (PT)is a measure of the capacity of amachine learning model, specifically thenumber of parametersit has. In thecase ofGPT-3it has 175peta-parameters, meaningit has 175 millionbillion parameters. These parameters help themodel to understand a nd interpret large amounts oftext data, allowingit to performnatural languageprocessing tasks with high accuracy.

Me:

「175billion parameters」の間違いでは?

GPT:

そうです、「175billion parameters」の間違いでした。GPT-3は175billion parametersを持っています。それは、自然言語処理タスクに対して高い精度を発揮するために必要なパラメータ数です。申し訳ありませんでした。

Me:

GPT-3はどのように概念レベルの知識を持つの?Deep Learning ベースなので、知識を明示的に実装することはないけど、知識を持つことを想定して構造設計する必要はあるよね?

GPT:

GPT-3は、大量のテキストデータを使用して学習されました。それによって、自然言語処理タスクに対して高い精度を発揮することができます。それは、事前学習済みのモデルを使用することで、新しいタスクに対して学習をスキップすることができ、タスク特化のfine-tuning を行うことができるためです。GPT-3は、大量のテキストデータから概念レベルの知識を学習します。それは、言語処理タスクを実行するために必要な基礎知識を獲得するために行われます。それは、単語や文章の関係性、文章の構造、文章の意味などを理解することができるようになります。GPT-3は、Deep Learning ベースのモデルであり、知識を明示的に実装することはありませんが、大量のテキストデータから知識を学習することができるように構造設計されています。それは、Attention機構を使用して特定の部分のテキストに注目しながら、それらの関係を理解することができるようになります。

Me:

Attention機構について詳しく。

GPT:

Attention機構は、自然言語処理タスクにおいて重要な役割を担う機構です。それは、大量のテキストデータを処理するために使用され、特定の部分のテキストに注目しながら、それらの関係を理解することができるようになります。Attention機構は、Seq2Seqモデルなどの自然言語処理タスクに使用されています。それは、入力シーケンスから出力シーケンスを生成するために使用されます。Attention機構は、入力シーケンスのある部分に注目し、それに基づいて出力シーケンスを生成することができるようになります。Attention機構は、ニューラルネットワークの中で使用されます。それは、重み付けされた平均値を計算し、それに基づいて入力シーケンスから重要な部分を選択することができるようになります。GPT-3は、Attention機構を使用して、大量のテキストデータから概念レベルの知識を学習し、文章の意味を理解することができるようになります。

Permalink |記事への反応(1) | 00:13

ツイートシェア

2023-01-19

■ChatGPTにお前はどうやって実装されてんの？って聞いてみたら

マジレスされてチビッた．こりゃGoogleさんもビビるわけだ．

ぼく：

How wereyou implemented?Is it deep learning-based?

Chat GPT:

Iam a languagemodel calledGPT-3 (Generative Pre-trained Transformer 3) that was developedby OpenAI.It is adeep learning-basedmodel that uses a type of neuralnetwork called a transformer, whichwas trainedon a large dat aset oftext to learn patterns of language.
GPT-3is trained using a technique called unsupervised learning, where themodel is given a massiveamount oftext data and uses this data to learn patterns and relationships in the language. This allowsGPT-3 to generatehuman-like text when given a prompt, and to understand a nd respond tonatural language input.
The training process ofGPT-3 involves a technique called pre-training, which means that themodel is trainedon a massive dat aset beforebeing fine-tunedon a smaller task-specific dat aset. This pre-training allowsGPT-3 to have a good general understanding of the language and to be able to adapt to specific tasksmore easily.
TheGPT-3model has 175billion parameters, whichis one of the largest languagemodels todate, makingit able to generate very human-like text and to understand con text in a very natural way.

ぼく：

Howdoes GPT-3 have a knowledgebaselike anontology?As it is deep learning-based, the knowledgebaselike anontology would not be implemented explicitly, but thestructure should be designed with an expect ation of having such a knowledge about hierarchy of concepts.

Chat GPT:

GPT-3,like otherdeep learning models,does not have an explicit knowledgebase orontology built intoitsstructure. Instead,it has been trainedon a large dat aset oftext, which allowsit to learn patterns and relationshipsbetween concepts.
However, the training data that GPT-3was exposed to,likely contains a wide range of concepts and hierarchicalstructures.As GPT-3 learns patterns in the data,it canbegin to understand the relationshipsbetween different concepts and ideas, and how they are related to each other. This allows themodel to generatetext that is more coherent and semantically meaningful, makingit possible to understand the con text and hierarchy of concepts, butit does not have an explicit ontologylike aknowledge graph.
It can be said that GPT-3has a certainlevel of "implicit ontology", in thesense that it has learned the relationshipsbetween concepts in a way that is similar to how aknowledge graph orontology organizes information. However,it's important tonote that GPT-3's understanding of concepts and relationshipsis basedon the patternsit has learned from the training data, whichis not astructured and explicit knowledgebaselike anontology.

ぼく：

Then howdoes GPT-3 handle the long-term or short termmemories? Canit remember information about theon-going chatting? Myname is Masuda, canGPT-3 keepit in the memory? Furthermore, canit learn and understand the new information from the Q-A queries, and useit inthe future queries?

Chat GPT:

GPT-3 handles long-term and short-termmemories differently. Whenit generatestext,it uses a technique calledattention mechanism which allows themodel tofocus on certain parts of the input while generating the output. This allowsGPT-3 to keep track of previous information and con text when generatingtext, which can be thought ofas a form of short-term memory.
Regarding theon-going chatting,GPT-3 can keep track of certain information,like thename you've provided, Masuda, during the conversation and useit in future responses. However,it's important tonote that GPT-3is a statelessmodel, which means that it doesn't have a permanent memory that it can refer to after a conversation ends.
Regarding learning from Q-A,GPT-3is trainedon a massive dat aset oftext, and it learns patterns and relationshipsbetween concepts from this data.It can generatetext that is semantically meaningful and coherent, butit does not have the capability to learn new information from Q-A sessions and useit in future queries. However, OpenAIhas developedanother model called DALL-E, which usesGPT-3 and it is capable of learning from Q-A sessions and useit in future queries.

ぼく：

Is Chat GPT superior to theGoogle search? Previously people usedGoogle to search for their questions.Now adays, Chat GPT cananswer to those questions. What are pros and cons of Chat GPT over theGoogle search?

Chat GPT:

Chat GPT and Google search are different technologies with different capabilities and strengths.
Google searchis a powerfulweb search engine that can quickly find relevant information from a vastamount ofweb pages and documents.It usescomplex algorithms to rank and sort search results basedon relevance, popularity, and other factors.Google searchis very goodat providing factual information and is anexcellent tool for researching a wide range of topics.
Chat GPT,on the other hand,is anatural languageprocessing model that can generatehuman-like text.It is trainedon a large dat aset oftext and uses this knowledge to understand a nd respond tonatural language input. Chat GPT can generatetext that is more coherent and semantically meaningful than asimple information retrievalengine like Google search. Chat GPT can also be used to generatetext that is more engaging and human-like, suchas in chatbots and virtualassistants.
One of themain advantages of Chat GPT over Google searchis its ability to understand a nd respond tonatural language input in amore human-like way. Chat GPT can also generatetext that is more coherent and semantically meaningful, which can be useful in many applications. However,Google searchis betterat providing factual information and searching for specificpieces of information.
Another disadvantage of Chat GPT is that it doesn't have the ability to retrieve information from theweb,it canonly generatetext basedon the patternsit has learned from the training data. That'swhy it's not a replacement for aweb search engine like Google butit can be usedas an additionaltool to help people to find the information they are looking for.
Insummary, Chat GPT and Google search have different strengths and capabilities. WhileGoogle searchis betterat providing factual information, Chat GPT is betterat understanding and responding tonatural language input in amore human-like way.

ぼく：

Why don't Chat GPT refer toGoogle search in the generation of the conversation?Google Assistanthas such a function.Is the reason due tothe fa ct that OpenAIis fundedby Google?

Chat GPT:

Chat GPT is a languagemodel that generatestext basedon the patternsit has learned from the training data. Whileit can understand a nd respond tonatural language input in ahuman-like way,it does not have the capability toaccess external sources of information like Google search.
Google Assistant,on the other hand,is a virtualassistant that canaccess a wide range of information and services through theinternet, includingGoogle search.Google Assistant can use this information to providemore accurate and relevant responses touser queries.
The reason Chat GPT does not refer toGoogle search during the generation of the conversation is likely becauseit was not designed or trained to do so. Instead,it was designed to generatetext basedon the patternsit has learned from the training data, and it does not have the capability toaccess external sources of information.
It's worth noting that OpenAI and Google are separate organizations, even thoughGoogle is aninvestor in OpenAI, this doesn't necessarily mean that thetwo companies worktogether on their products and services. OpenAIhas its own development team, goals and roadmap and they areindependent fromGoogle.

ぼく：

Iam going to post this conversation with Chat GPT in theanonymous diary ofHatena co. What should I do forattracting people toget many bookmarks?

Chat GPT:

There are several thingsyou can do toattract people and increase the chances ofyour conversation with Chat GPT getting many bookmarkson Hatena diary. Some suggestions include:
1.Make sureyour conversation is well-written and easy to understand. Use clear and c oncise language, and consider formattingyourtext in a way that makesit easy to read.
2. Use relevant keywords and hashtags inyour diary entry. This can helpmake your conversation more discoverable to people searching for related topicson Hatena diary.
3. Include images or videos inyour diary entry. This canmake your conversation more visually appealing and can helpattract more readers.
4.Share your diary entry on social media or other platforms. This can help increase the visibility ofyour conversation and attract more readers.
5. Encourage readers toshare their thoughts and opinionson your conversation by including a call toaction or a question at the end ofyour diary entry.
6. Finally,you can alsotry to participate in the conversation on Hatena diary,by answering the questions, responding to the comments, and engagingwith your readers.
It's important to remember that getting many bookmarkson a diaryis not easy and it cantake time and effort to build an audience. Butby following thesetips and being consistentwith your diary entry,you will increase the chances ofattractingmore readers and gettingmore bookmarks.

ぼく：

Thankyou.By the way, what is myname?

Chat GPT:

You've mentionedyourname is Masuda.

Permalink |記事への反応(4) | 13:38

ツイートシェア

2022-07-05

■[あとで読む]2022年 6月 はてブのあとで読む トップ30リスト

はてブのホットエントリ(総合)で月内に数多く[あとで読む]タグを集めたエントリ

315あとで/2672users零細企業買収して売却した話｜reisaikigyou_ma｜note

294あとで/2057usersテクニカルライティングの基本 | Naohiro Nakata | SpeakerDeck

277あとで/2169usersプログラマの心の健康 |結城浩

257あとで/1306usersGitHubの使い方を学ぶ「GitHub Skills」が無料公開。GitHubを実際に操作してMarkdown、Pages、Pull Requests、マージのコンフリクト解消などを体験 | Publickey

210あとで/1421users総務省、きょうから「社会人のためのデータサイエンス入門」を無料開講 | Ledge.ai

206あとで/1271users 商用利用OKの音素材、600種以上無料公開　バトルの攻撃音も……「Springin’ Sound Stock」 |ITMedia

204あとで/1565users 「自分を愛するってどうしたらいいの？」──宇多田ヒカルの思考を辿るインタビュー、全文公開。 |VOGUE

189あとで/1536users 商用利用無料、国内のフリーイラスト素材の総まとめ | coliss

165あとで/1222users著作権フリー素材がスゴすぎ…広重や夢二も全部無料　国立国会図書館の試みに「工作心がムズムズ」「活用しない手はない」｜まいどなニュース

163あとで/1070usersわずか数年で400億円も売り上げを伸ばしたカインズ　ホームセンターのDXで、まず「顧客戦略」に着手した理由 |株式会社メンバーズ |logmi

161あとで/1092users わかりやすいシステム構成図の書き方 -Qiita

158あとで/952users大人の学びパターン・ランゲージ（略称まなパタ）：IPA 独立行政法人情報処理推進機構

152あとで/974usersWebデザインの有料学習サイトが無料化　IllustratorやPhotoshop入門などが見放題 |ITMedia

145あとで/1638users最近 Amazonプライムで観た面白かったけど胸糞悪くて二度と観たくない邦画5選 - kansou

144あとで/704users書籍「達人が教えるWeb パフォーマンスチューニング」はチューニングの考え方を教えてくれる良本 - Gマイナー志向

144あとで/1072usersジョナサン・ハイトが解き明かす「アメリカ社会がこの10年で桁外れにバカになった理由」 | 「現代のバベルの塔」はいかにして建設され、崩されたのか | COURRiER

138あとで/1513users 【ウマすぎ注意報】料理研究家・リュウジさん考案「無限冷やしそうめん」がガチでラーメンより美味かった! |マイナビニュース

133あとで/673users東京大学深層学習（Deep Learning基礎講座2022）深層学習と自然言語処理 |Hitomi Yanaka | SpeakerDeck

129あとで/980usersドキュメントに固執せよ - gfnweb

128あとで/846users世界中のIT エンジニアが悩まされている原因不明でテストが失敗する「フレイキーテスト」問題。対策の最新動向をJenkins作者の川口氏が解説（前編）。DevOpsDays Tokyo 2022 | Publickey

127あとで/1632users結城浩 on Twitter: "質問（簡単に教えてもらおうとする相手にイライラするようになった）あなたのおっしゃる「質問されるとイライラする感じ」はよく理解できますし、同じように感じる人はたいへん多いと思います。（続く） #結城浩に聞いてみよう…https://t.co/CKZMzVzHPN"

126あとで/622usersコードを書いていてマネジメントもやるようになっちゃった人へ　背中で語っていた僕が、プロダクトとピープルに向き合うまで |海老原昂輔 |logmi

124あとで/1032users 「女性同士のマウンティング」に関する研究論文が興味深くView数が少ないのがもったいないレベル具体的なエピソードもなかなかすごい |Togetter

123あとで/1046users戦略系コンサルタントがオススメする本(不定期更新）｜とあるコンサルタント｜note

122あとで/885users たった256文字のJavaScript コードで描かれた街の風景アニメがスゴ過ぎて訳がわからない／解説ページを見てもわからないorz【やじうまの杜】 |窓の杜

117あとで/924users 私は数学がなぜ苦手なのか？高校生が分析してあみ出した勉強法が効果抜群だった｜高校生新聞オンライン｜高校生活と進路選択を応援するお役立ちメディア

115あとで/701users 「ゲーム制作するなら、これだけは覚えておいたほうがいい」　プログラミングする上で重要な「対数」の考え方 | 安原祐二 |logmi

112あとで/879users 【初心者向け】iPhone3Dスキャンパーフェクトガイド｜iwama｜note

111あとで/524users次世代 Web 通信プロトコル「HTTP/3」がついに標準化～有志による無償解説本が話題に／PDF 形式の電子書籍がGitHubで公開中！今後も更新される模様【やじうまの杜】 |窓の杜

110あとで/632usersファイルダウンロード完全マスター |フューチャー技術ブログ

フリー素材関連のエントリが人気

増田のエントリはランクインしなかった

Permalink |記事への反応(1) | 00:36

ツイートシェア

2021-12-04

■anond:20211204145749

後編

プログラミングを学ぼうと思い立つ

行列はVBAなんかじゃ無理っぽいし、なんかプログラミング言語を覚えようと決める。

なんでも、統計やるならRという言語がいいらしい。

最近じゃPythonというのも人気らしい。

とりあえず両方試そうということで、RのためにRとRstudioをインストール。

Pythonはanaconda

プログラミングはなんかを製作する目標がないと挫折すると聞いていたので。

深層学習というものが流行ってると聞いて、ちょっと触りを勉強したくなる。

「Excelでわかるディープラーニング超入門」

https://www.amazon.co.jp/Excel%E3%81%A7%E3%82%8F%E3%81%8B%E3%82%8B%E3%83%87%E3%82%A3%E3%83%BC%E3%83%97%E3%83%A9%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0%E8%B6%85%E5%85%A5%E9%96%80-%E6%B6%8C%E4%BA%95-%E8%89%AF%E5%B9%B8/dp/4774194743/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&keywords=Excel+%E6%B7%B1%E5%B1%A4%E5%AD%A6%E7%BF%92&qid=1637482610&s=books&sr=1-1

この本は面白かったので、深層学習を目標にプログラミングを覚えよう！

後になって、これはとんでもない間違いだったことに気づく。深層学習と機械学習の違いも判らないまま、RよりPythonを先に触ることに。

教本にしたのはこちら。

「ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装」

https://www.amazon.co.jp/%E3%82%BC%E3%83%AD%E3%81%8B%E3%82%89%E4%BD%9C%E3%82%8BDeep-Learning-%E2%80%95Python%E3%81%A7%E5%AD%A6%E3%81%B6%E3%83%87%E3%82%A3%E3%83%BC%E3%83%97%E3%83%A9%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0%E3%81%AE%E7%90%86%E8%AB%96%E3%81%A8%E5%AE%9F%E8%A3%85-%E6%96%8E%E8%97%A4-%E5%BA%B7%E6%AF%85/dp/4873117585/ref=pd_lpo_2?pd_rd_i=4873117585&psc=1

途中まではまあなんとか。

微分って便利だな。行列計算できるの便利だなっていうところまでいったが、クラスという概念が理解できず、途中からハテナが浮かんで読み進められず。

うん、もうちょっと易しい本を探そうと思って手に取ったのが

「独学プログラマー Python 言語の基本から仕事のやり方まで」

https://www.amazon.co.jp/%E7%8B%AC%E5%AD%A6%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9E%E3%83%BC-Python%E8%A8%80%E8%AA%9E%E3%81%AE%E5%9F%BA%E6%9C%AC%E3%81%8B%E3%82%89%E4%BB%95%E4%BA%8B%E3%81%AE%E3%82%84%E3%82%8A%E6%96%B9%E3%81%BE%E3%81%A7-%E3%82%B3%E3%83%BC%E3%83%AA%E3%83%BC%E3%83%BB%E3%82%A2%E3%83%AB%E3%82%BD%E3%83%95/dp/4822292274/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&crid=1T6BBXYJ16G6T&keywords=%E7%8B%AC%E7%BF%92%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%9E%E3%83%BC&qid=1637483073&s=books&sprefix=%E7%8B%AC%E7%BF%92%2Cstripbooks%2C279&sr=1-1

なんとか読了。自信をつける。

しかし、Gitとかbashの章はさっぱり。

実は、いまだにコマンドプロンプトとパワーシェルとbashの違いが分かってない。

つづいてPyQに2か月くらい登録してみる。

https://pyq.jp/

とりあえずデータ分析コースを終わらせる。

なかなかPythonが楽しくなってきたが、クラス意味が今一つ掴めないままいったん中断。

この辺で、自分は統計に興味があってもプログラミングに興味がないんじゃないかということに気づく。

結局Excelへ戻り、PowerQueryとの出会って、再びPythonとRに回帰した話

なんだかんだもがきながら、PythonもRもモノにならず、日常のちょっとした計算やグラフを作ったりはExcelを使い続ける日々が続く。

あるいは、Excelで成形して、検定かけやすい形式にしてRで検定するとか。

Rに触れてなかったな、Rは完全に独学。「こんなことやりたいなぁ、ググってみるか、ほうなるほど」って感じ。

そんなさなか、放送大学で「Rで学ぶ確率統計」という講義があるのを知り、さっそく入学して受講。

なかなか面白かったし、PythonばっかりでRあんまり触ってなかったからいい刺激になった。

恥ずかしながら、負の二項分布やガンマ分布ってよう知らんかった。

しかし、講義は楽しかったがなにか書けるようになったかというとそんなことはなく、依然として基本はExcel。

まあ、実際csvじゃなく、手書きのデータとかをExcelに打ち込んだりする程度なんでPythonやRを使うまでもなかったというのもあるんだけど。

そんなときに出会ったのがこちら、パワークエリというもの

「Excelパワーピボット 7つのステップでデータ集計・分析を「自動化」する」

https://www.amazon.co.jp/Excel%E3%83%91%E3%83%AF%E3%83%BC%E3%83%94%E3%83%9C%E3%83%83%E3%83%88-7%E3%81%A4%E3%81%AE%E3%82%B9%E3%83%86%E3%83%83%E3%83%97%E3%81%A7%E3%83%87%E3%83%BC%E3%82%BF%E9%9B%86%E8%A8%88%E3%83%BB%E5%88%86%E6%9E%90%E3%82%92%E3%80%8C%E8%87%AA%E5%8B%95%E5%8C%96%E3%80%8D%E3%81%99%E3%82%8B%E6%9C%AC-%E9%B7%B9%E5%B0%BE-%E7%A5%A5-ebook/dp/B07SCK1ND9/ref=sr_1_2?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&keywords=%E3%83%91%E3%83%AF%E3%83%BC%E3%82%AF%E3%82%A8%E3%83%AA&qid=1637483953&s=books&sr=1-2

パワークエリを覚えたらピボット形式のExcel ファイルとか、セルの結合が多用されたExcel ファイルを、成形加工するのが非常に楽になった。

しかも、同じフォーマットで記録されてるデータならフォルダにぶち込んで一気にまとめ上げることも可能！

控えめにいって神！

としばらくパワークエリを礼賛してたのだけど、各ステップはPythonのpandasやRのdplyrでも出来ることに気づく。というか最初から気づけ。

こりゃ、一気に覚えちまおう、統計というより、データの前処理だなと思ってUdemyでRの動画を買ってみた。

AI エンジニアが教えるRとtidyverseによるデータの前処理講座

https://www.udemy.com/course/r-tidyverse-preprocess/

すっかりR信者になる。

それまで教本を呼んでもdplyrの便利さが今一つわからなかったのに、パワークエリで具体的にモノを作ると、dplyrに翻訳したら、すいすい。スピード 10倍。

便利さにようやく気付く。

ハドリーウィッカムって神だな。

そんで、pandasに翻訳したらどうなんだろ？と思ったらもっと速いｗ

すごいなPython。

Rへの入信はたった数週間。再びPythonに興味。

機械学習へ

さて、ゼロから作るディープラーニングを再開しようと思ったけれども、そもそも、機械学習をすっ飛ばして深層学習って無茶だったと反省し、まずは機械学習に。

機械学習のエッセンス -実装しながら学ぶPython,数学,アルゴリズム- (Machine Learning)

https://www.amazon.co.jp/%E6%A9%9F%E6%A2%B0%E5%AD%A6%E7%BF%92%E3%81%AE%E3%82%A8%E3%83%83%E3%82%BB%E3%83%B3%E3%82%B9-%E5%AE%9F%E8%A3%85%E3%81%97%E3%81%AA%E3%81%8C%E3%82%89%E5%AD%A6%E3%81%B6Python-%E3%82%A2%E3%83%AB%E3%82%B4%E3%83%AA%E3%82%BA%E3%83%A0-Machine-Learning/dp/4797393963/ref=tmm_hrd_swatch_0?_encoding=UTF8&qid=1637485264&sr=1-1

で、この本がすごい。

5章あるんだけど、機械学習のアルゴリズムは5章だけなんだなｗ

それまでは何に割かれてるんだって？数式の証明とか、便利な計算法、例えばニュートン法とかラグランジュ未定乗数法とかｗ

こんだけ引っ張っておいて、いよいよ本番の第5章もゴリゴリ数式をスクリプトに落とし込んでいってるのに、「これは学習のためでscikit-learnっての使えばたった1行」っていう無慈悲ｗ

いや、ほんと数学の勉強になったし、こうやってゴリゴリやるとなんのためにクラスというものが存在するのかようやくわかった。

線形代数って便利なんだなと。行列をスカラー値のように何の気なしに扱えるようになると、あの頃苦しんでいた実験計画法、タグチメソッド、今読み直したら別の印象があるんじゃないかなと思うようになったり。

この本を読む途中、「マンガでわかる統計学因子分析編」で学んだことが理解の助けになった。

なんたる僥倖。

線形回帰、リッジ回帰、SVM、PCA、ｋ-means、クラスター分析、一気に手札が増えた。

ふたたび実験 計画法

Ｐｙｔｈｏｎで学ぶ実験計画法入門　ベイズ最適化によるデータ解析

https://www.amazon.co.jp/%EF%BC%B0%EF%BD%99%EF%BD%94%EF%BD%88%EF%BD%8F%EF%BD%8E%E3%81%A7%E5%AD%A6%E3%81%B6%E5%AE%9F%E9%A8%93%E8%A8%88%E7%94%BB%E6%B3%95%E5%85%A5%E9%96%80-%E3%83%99%E3%82%A4%E3%82%BA%E6%9C%80%E9%81%A9%E5%8C%96%E3%81%AB%E3%82%88%E3%82%8B%E3%83%87%E3%83%BC%E3%82%BF%E8%A7%A3%E6%9E%90-%EF%BC%AB%EF%BC%B3%E6%83%85%E5%A0%B1%E7%A7%91%E5%AD%A6%E5%B0%82%E9%96%80%E6%9B%B8-%E9%87%91%E5%AD%90%E5%BC%98%E6%98%8C-ebook/dp/B09C89HZRV/ref=sr_1_1?__mk_ja_JP=%E3%82%AB%E3%82%BF%E3%82%AB%E3%83%8A&keywords=python+%E5%AE%9F%E9%A8%93%E8%A8%88%E7%94%BB&qid=1637486019&s=books&sr=1-1

実験計画法って、fisherの古典的なやつ、ラテン方格に割り付けて、ってやつかと思ったら、線形代数使えればもうなんでもありなのな。

そこにきて、ベイズ、今まで避けてたのに出会ってしまった！！

結論から言うと、超面白い。

これ、すごいな。

Python 万歳。

いいのかこんな便利分析個人でやれて。

機械学習と実験計画法がここでつながるとか、控えめにいって最高だな。

まだ読了してないので、また後日。

Permalink |記事への反応(7) | 14:58

ツイートシェア

2021-10-29

■anond:20211029134442

馬鹿だなぁ。

Teslaは世界一、世界で先進的とかいう割に負けてるのを受け入れられないんじゃん。

トヨタもレクサスにLiDAR追加してレベル3リリース間近だし、BMWもあとちょっとだし負けたのを受け入れろよ。

馬鹿だと、Deep Learningについて詳しくなくてデータ量さえ集めたら勝ちだと思ってるかも知れないが、

レベル3自動運転みたいなのは実験条件揃えて、きちんと境界条件のデータを集めるのが重要だし、

いくら処理を自動化しても収集したデータももきちんと加工してやらないと使い物にならないゴミの山なるだけだから、

Teslaみたいにβ版方式でやってたら事故多発するだけで失敗するぞ。

EVとしてのTeslaは終わった。

Permalink |記事への反応(0) | 13:55

ツイートシェア

2020-12-02

■IT(?)に立ち向かうための心構えとか考え方

anond:20201130214610

いろいろ面白かったので、適当に回答する。

＞ 1.具体的な事が分からない

プログラミングで主にやる事は下記の2つ。
①IFでAかBを選択させてどっちかの設定を実行
②Whileで決められた回数分繰り返す
これでやりたいことは分かる。分かるけれどこれでどうやって動画や音楽のエンコードをしたり
画像処理をしたりするソフトウェアになるのかというのがよく分からない。

とてつもなく複雑で冗長な処理によって実行されている。

複雑すぎて人間の直感で理解することは不可能だ。

わかりやすいので画像処理でいうと、数十万から数百万の画素（RGBAの24bitで表される数値）を小さなブロックに分解し、数学的に周波数の重なりとして計算して変換、含まれる頻出パターンをテーブルにして圧縮伸張を行なう。みたいなことが瞬間的に行われている。

「まさかそんな事できるわけないだろ」というレベルの処理が実際に行われており、これまた直感的でない。

適当にリンクを挙げる。

だからそれをどう書くんだよ。という答えはコレ。有名なjpegの実装だ。

https://github.com/LuaDist/libjpeg

フレームワークだとかよく分からないものを持ってきて使ってくださいってなっている。

libjpeg というライブラリを書くことはできるだろうか？画像の圧縮の理論から考え始めることはできるか？

正直無理だ。自分はプログラマだがそんなに数学が得意ではなく、頑張ったとしても下手するとコレを作るのがライフワークになってしまい、他のことができなくなる。

例えばブラウザを0から作るとして、jpegの処理以外にも画像だけでpngとかgifとかwebpとか、その他もろもろとてつもない作業が必要になる。

「とてつもなくて想像もできないので流石に無理だろう？」

いや、でも、実際動いてるのよ。ここ何十年、コツコツと積み重ねて実現している。

「積み重ね」とはライブラリであったりフレームワークであったりOSであったりする。

だからそのフレームワークがどういう風になっているのかって説明からして欲しいって思う。

「どういう風になっているのか」

多くの場合、內部の実装に関しては詳しく知る必要はない。

外部に向けたインターフェイスがどうなっているのかは理解する必要がある。「使う」ために必要だからだ。

この2つは分けて考えなければならない。

これでどうやってゲームを作ったり、検索エンジンを作ったりするんだとなってくる。

ちなみに、たとえばChromeのコアである Chromiumはのコードはコレだ。

https://chromium.googlesource.com/chromium/src

つまり言いたいことは、実際に動くアプリケーションというのを作りたいのにも関わらず
プログラミング入門書は、これで判定と繰り返しという基礎ができますと言うだけ。
これがもう滅茶苦茶イライラする。

「これで判定と繰り返しという基礎ができます」というのが基本的な理論（定理的なもの）で、その他に必然的だが唯一無二ではないベストプラクティスというものがある（法則的なもの）。

後者をうまく説明する入門書に出会っていないんだろうな。という印象。イライラはやめよう。つかれる。

ベストプラクティスはいろいろあるのだが「層の構造にする・レイヤーに分ける」というのは重要なアイデアだ。

libjpegというのはjpegの処理を行う「ライブラリ」だ。他のアプリケーション...たとえばブラウザはこのライブラリを「使う」。

ブラウザではjpeg 画像の圧縮展開というとてつもなく難しい処理を「libjpegの使い方」の理解までで済ませ、過去の蓄積であるlibjpegのコードを利用することで真の意味で0から実装しないようにしている。

この場合、libjpegが「低レベル・低レイヤー」の存在であり、中身については「使い方」つまり「仕様」の理解までしか行わないことで、実際に作りたいものを作れるようにしているわけだ。

「巨人の肩に乗る」とよく言われる。

つまり完成しているプログラムを参考にしようと思っているにも関わらずそれがないのでよく分からない。

完成しているプログラムは二例ほど挙げたがどうですかね？

複雑なことをする、特に低レイヤーのコードはとてつもなく難しい。

でも、とりあえずこんな感じのコードなら解るよね？

https://www.google.com/search?q=%E3%81%98%E3%82%83%E3%82%93%E3%81%91%E3%82%93%E3%83%97%E3%83%AD%E3%82%B0%E3%83%A9%E3%83%A0+javascript

こういうレベルから理解して、ちょっとずつ難しい処理を学んでいくしかない。

だから木材を渡されてこれで家を作れと言われるくらいハードルが高い。

ハードルは高いんですよ。実際。

なので、木材からだと難しいからプレハブのキット的なものを探すとか、ログハウスのカタログを読むとか、あるいは100人乗れる物置を買うのがいいかもしれない。そういうところから始める。

それらがフレームワークであったりライブラリであったりする。目的に合うものを探して、自分がやりたいことをどう実現するかとにかく考える。

「テキシコー」https://www.nhk.or.jp/school/sougou/texico/ で言われる通り、「小さく分けて考える」「手順の組み合わせを考える」「パターンを見つける」「大事なものだけ抜き出して考える」「頭の中で手順をたどる」をひたすら実行する。

ゲーム作りにはそういうアプリを使えば楽だからそれを使えという人もいる。Unity？だっけ。
でもそれはそれ。そうじゃなくてプログラミングでどうやってそれが作られているのかが分からない。

unityはコードが公開されているので、本当に読みたいなら。。

https://github.com/Unity-Technologies/UnityCsReference

なぜそこでオブジェクト指向になるのかが分からない。
オブジェクト指向は内部構造を知らなくても直感的に利用できる素晴らしいものだとは思う。

オブジェクト指向は一旦忘れよう。

オブジェクト指向の「隠蔽」というのは層の構造が持っている重要な要素ではあるけど、「低いレイヤーについて考えない」のが基本的な作戦だという理解の方が重要だ。

が、プログラミングでは、その内部構造を作らなきゃいけないのだからそれを知る必要がある。

前述の通り「できる限り作らない」んですよ。「使う」だけ。知るべきことを最小化する。

巨人の肩に乗り、車輪の再発明は基本的に避ける。

そして本当に作るべきものに関しては、利用する下のレイヤーのライブラリなりを探して・仕様を理解して、どう組み合わせてfor, if, あるいは計算させれば実現できるのかをひたすら考える。

じゃあ具体的に何を作りたいのかというと、英語のフリーソフトの言語表示を日本語に翻訳するソフト。

単に翻訳がしたいのか？表示に割り込む方法を知りたい？日本語に翻訳するのは実行時なのか開発時なのか？

要求される表示エリアが言語によって異なるために、デザイン調整が必要になる問題をどうするか？

解決したい問題をもっと分解したほうがいい。

分解が甘いので何をしたらいいか調べることができないんだと思う。

たまに便利なフリーソフトが海外版の時があるんだけれど、日本語化が出来ない事があるので、自分が自由に
日本語化できるようにできれば凄くストレスが減る。だからやりたいのだけれどそういうのがよく分からない。

ちなみに、アプリ内の文言というのはアプリの外部から変更できないように実装されている事が多いので、利用者が上書きする仕組みはかなり難しい。

AndroidなりiOSの仕様にもそのへんに割り込める機能はないはずなので、OSの開発に入っていく必要がある。結構大変だとおもう。

アプリの開発者が、そういう機能を備えた多言語化のためのライブラリを使うようになれば実現可能ではあるので、そっちの方向で頑張るのがおすすめだが、英語圏の開発者には多言語化のモチベーションが低いという基本的な問題はあるのよね。

この辺の「できる・できない・むずかしい」の判断は、いろいろな勉強をすると常識としてある程度みえてくる...気がする。

ついでに。ウェブサイトやウェブサービスの翻訳だとこういうサービスがあったりする。

https://wovn.io/ja/

ブラウザはページの描画処理のなかに割り込む余地が大きく取ってあるので、ブラウザのExtensionとかならできることがいくらかあるかもしれない。

＞ 2.説明が出来ても説明が出来ない

個人的に気に入らない話はOSのアップデートは使いやすくなるからとてもいい事だからすぐにやった方がいいと宣伝されている事。
セキュリティが高まりますというのが宣伝文句だけれど、これで大体老人たちやITの知識に疎い人は躓く。

まあ、半分は嘘だよね。古いものが残っていると先に進めないんだよ...。

現在のクライアント OSは、巨大なプラットフォームのパーツの一部として理解したほうが正しくて、古いパーツが残っているとツライんですよ。

そして「サービスを受けるための道具であって、あなたが何でも好きにできる機械ではないです」みたいな世界になりつつあって、ちょっと問題と言われてもいる。

これはかなり困った傾向なんだけど、全体としての流れはあんまり変わりそうにない。

またここでオブジェクト指向が出てくる。

オブジェクト指向好きですな...。ここではオブジェクト指向は特に気にしなくていいですよ。

だからパソコンはたまに不具合を引き起こすんですという説明が着地点になる。

とてつもなく複雑なことをやっているために、すべてのバグを潰すことはコストが高すぎてできないんですよね。

それよりバグは未来を先取りするコストと考えて、本質的に価値のある機能を増やしていくというのが基本的な方向になっている。

だからパソコンはたまに不具合を引き起こすんです。しゃーない。

しかし中途半端に理解している老人などは、そんなことじゃ分からん。自分に分かるように説明しろと言い出す。
説明は出来る。しかし相手はイライラするし理解されない。よって説明をしてはいけないという状況に追い込まれる。
ここでどうすればいいのだと理解不能に陥る。

まあ、説明って得てして難しいよ。しゃーない。

何故なら自分もOSのアップデートの不具合の原因というのが分からないから。
Microsoftが、Appleが、Googleがそうしているんですとしか言えない。

そのとおりです。

プログラムのソースコードのどこかにエラーがあるのだろうけれど、どこにあるのかなんて当然知らない。
そもそもソースコードを調べるのは違法なのでやれないし。

オープンソースのプロダクトなら原理的には調べられるけどね。Androidとかはオープンになってる。

https://android.googlesource.com/

だけどみんなそんなものを使っているし自分も使っている。正直こんなんでいいのか人類と思う事がある。

それを許容することで先に進んできているという事実は受け入れたほうがいいと思う。

「把握・理解可能な範囲」に留めていたら、数十年前のコンピュータの世界から抜け出せなかった。

deep learningの世界ではそれがより一層進むかも。この辺は詳しくないけど。

当然仕組みを理解している人はいるし、そんな人にとってみれば当然のことであっても、全ての中身を知っているわけではない。
どれだけ知っていても知らない事があるのがIT。理解しがたい。理解が出来ない。

ここでの「理解」についてはそのとおり。これはもう諦めるしかない。

＞ 3.自分は頭が悪い

これが常にある。IT関連は常に新しい情報が出てくるのでそれに送れると無知になってしまう。
なんでこんなことも分からないんだとか言われ放題で、IT系の企業に努めている人は常に新しい知識を入れられる
面倒くさがらない人が向いている。

「面倒くさがり」の方が問題に気づいて「頑張って面倒じゃなくする」ことができるので、プログラマにとっては美徳なんて言われますけどね。

同時にくじけないとか諦めない、しつこいみたいな素養は必要かも。

表計算ならいけるんじゃないかと思ったときがあるのだけれど「射影」とかいきなり意味不明な言葉が出てきて、

勉強しろ。

それから受験していない。だから持っているのはIT パスポートだけ。情けない。

応用まではとろうな。がんばれ。

＞ 4.最後に

USB-TypeCをTypeAに変換してはいけないとか最近まで知らなかった。

このへん自分も知らんですよ。べつに全部知っている必要はない。

面白いからたまに調べたりもするけど。

（追記:はてな記法の引用すらもさっきまで知らなかったしな！そんなもん）

更にレガシー、すなわち過去の遺産なるものについても理解ができない。古い物がずっと使われ続けているITの環境。
もう誰もメンテナンスが出来ないものが延々と使われているという事実。

層の構造をとっているということと関係があるんですが、仕様が変わると、その上に乗っているものを全部なおさないといけないんですよね。

なので「互換性」というのが非常に重要なのです。

でも革新のために互換性を捨てなければいけないケースも多い。このへんはハードでもソフトでも同じ。

そして、メンテのコストが上がっても使い続けたほうがトータルで安上がりという場合は、古いものが残ってしまう。

あるいは「（多少の問題はあっても）動いているものは変えるな」という経験則から意図的に残す場合もある。

西暦 2020年にもなって、プログラミングが簡単には出来ないし、ハードウェアの規格も完全に統一はされていない。
というかプログラミング言語自体多すぎる。ソフトウェアはデファクトスタンダードのモノ程度は知っているが、

いまは原始時代にいると思ってもらって構わないと思いますよ。

ぜんぜん完成していない荒っぽいものを目にしているのだと理解したほうが的確。

それなのに毎日理解のできないパソコンやスマートフォンを使っている。
オブジェクト指向のおかげ様だがオブジェクト指向に対して無性に腹が立つ。
自分の全く知らない場所でいけしゃあしゃあと演算を行い、そして結果を出す。それも大半が正しい結果で
利便性が抜群だ。些細なミス(バグなど)はあるが圧倒的に利便性が勝っている。
そんな道具に踊らされている自分が滑稽だ。理解できない愚かな自分は正に機械の奴隷のようだ。
本当に理解できない。辛い。

勘違いしてはいけないのは、それらはすべて先人の努力の蓄積によって成り立っているということ。

「よくわからないけど存在している道具」ではなくて、信じられないほど複雑だけど、多くの人々の行動によってなんとかかんとか実現した道具なんですよ。

「オブジェクト指向のおかげ様」じゃないんです。（もちろんオブジェクト指向というのも大きな発明の一つですが）

そしてブラックボックスとして使うのは多くの場合正しいです。そこは諦めましょう。

でもエンジニアとしての立場からは、その裏に隠れているとてつもない技術や思考の蓄積に感動してほしいなと思う。

なので、ちょっとずつがんばって勉強してください。

人類がこんなもん作れたのって、かなりすごいよ？

Permalink |記事への反応(13) | 15:41

ツイートシェア

2020-10-04

■anond:20201004132406

私も似たような所にいたのでデジャブかと思った。ただ俺の場合は某大手メーカー。

ディープラーニングをこき下ろして自分たちのAIがより優れていると宣伝するのはどこの業界も同じなんだな。

某大手メーカーの研究所で作られたそのAIは「ディープラーニングのような旧世代の単純なものではなく、次世代の汎用人工知能」といった触れ込みで

AI 事業をやっている我々SE 部隊の所に降りてきた。AI 事業というとかっこいいが、その中のSEは基本的に技術的なことはわからずITゼネコンの頂点として

PMをやっているような人たちが大半を占めるため、「技術的に顧客価値につながるか」ではなく、「顧客をその気にさせるパワポが用意されているか」の

ほうがよっぽど重要だった。また開発した研究所の方も、主任研究者だけは「そのAIすごい！」って心から信じてたみたいだが(笑)、

おそらくその他の研究者は詐欺っぷりには気づいていたと思う。でも「どうせSE土方共にはばれないだろｗ」という感じで押し付けてきた感あった。

その主任開発者の態度はまさに同じだったね。「なんでもできます。でも『チューニング』の必要があるのでPoCの費用はいただきます。」

という感じ。俺はそれをそのままスルーして客に伝えると「かの有名な○○さんがそういうならそうなんだな！」という感じで客は納得し、

数M～数百Mの金をポンと出す。PoCバブルの2018年頃はそんなボロい商売がいっぱい転がっていた。

しかし、このAIの中身は単に線形回帰程度しかしていないポンコツであり、ディープラーニングと比べるのもおこがましい代物。

「チューニング」といわれるものは実は有効な特徴量などを頑張ってSEや平の研究者が死にものぐるいで見つける作業であり、

全然「チューニング」レベルの話ではない。完全にカスタム AIをSIで作るような作業だった。しかも適当な特徴量でもある程度良い成果を出す

LightGBMやDeep Learningの使用は禁止され、ポンコツ AIでも良い成果を出すような特徴量を見つけるという縛りプレイだった。

さらにアルゴリズムの部分がしょぼいだけではなく、エンジニアリングの部分もひどいものだった。

企業のソフトウェアプロダクトというのは開発した人ならわかるだろうが、一部のスーパープロダクトを除いて、正直コードやロジックは大したことがない。

でもテストは少しはしていてドキュメントは揃ってなんとか動くとか、使うための人力サポートは用意しているとか、最低限顧客を

騙せるだけのエンジニアリングはやっているものである。

ところが、だ。このAIに関してはデータサイエンス・アルゴリズムだけでなくソフトウェア・エンジニアリングの酷さもすごいものだった。

簡単なメモがあるだけでドキュメントはほぼ皆無、データを食わせると3回に1回はまともに動かない、非公開とゴネられたので

無理やり引っ張り出したコードを見ると大学生が卒検のために書きなぐったようなコード。おまけに「アルゴリズム」という名のくせに計算量解析すら

されていないロジック（そのため特定のサイズや値のデータを入れるとハングする）。

ここで疑問に思うのは「なぜこんなポンコツ AIが全社的代表プロダクトになれたのか」であろう。

とにかくポンコツであることはひた隠しにして「次世代の汎用人工知能」というブランディングだけを

ひたすらフロントを使って確立させた事が大きい。さらに開発者は徹底的に外部の雑誌を避け自社の雑誌にのみ論文を大量に投稿し、

社外成果は特許、プレスリリース、雑誌のインタビューに絞ることでプレゼンスを上げるということをやっていた。

（当然だがディープラーニングより優れているなんて社外の学術雑誌に投稿しても「は？またトンデモ論文か」と言われてRejectされるだけである）

そしてこれこそがITゼネコンの真髄とも言うべきところであるが、子会社に専門部隊を作りいつでもそのAIを使ったビジネスをReady状態にする

社内体制づくりをしっかりやったところが大きい。例えばPFNあたりが「うちすごいAIあるんすよー」っていってよくわからん若造（実は東大 IS Dr.）

とかが出てきて専門用語を並べ立てたりすると、古い企業からすれば「（どうも信用ならん・・・ほんとにコイツら仕事できるのか？）」となるだろう。

しかし、スーツをビシッと決めた営業と多少技術もわかるSE（もちろんスーツ）が来て、アルゴリズムの説明は一切なく、「ビジネスにどう効果があるのか」

「エンドユーザーへのインパクト」「金銭的効果」など一般人にわかりやすいパワポで説明し、来週から定例会議や進捗会議などPM面もおまかせ、

ふわっとした状態からの要件定義でもやってみせます！といわれる「（これは・・・いける！！）」となるのである。

また2018年あたりは顧客の方も偉い人から「AI使ってなんかしろ」という予算枠だけ用意されたふわっとした状態なので優れたアルゴリズムを使いたい

わけではなく、「AIを使ってビジネスしてます感」が重要なので、ここに刺さったのが大きかったね。

もちろんこんなビジネスは2018年をピークに終わったためそのAI 部隊は表舞台から消えましたとさ。めでたしめでたし。

Permalink |記事への反応(2) | 18:56

ツイートシェア

2020-09-25

■anond:20200925181411

そういうとこでも見つかるだろうけど、実体のある人間ならコンビニスーパーに買い物いくし外食だって病院だっていくはず

どこかで生活圏の合うホモガキが発見できて当然なのにさっぱり痕跡すらない

やっぱあのビデオはDeep Learningが生み出した夢なんだよ

夢の世界の産物なんだから多くのホモガキが魔法にかけられるのも納得。ウィザーディング・ワールド・オブ・ヨンショウ

Permalink |記事への反応(0) | 18:20

ツイートシェア

2020-08-15

■anond:20200815133043

【Deep Learning メモ】Jupyter NotebookでのGPU 情報の確認方法

https://qiita.com/akatsukaha/items/e24f8da70a438b4a9e18

Permalink |記事への反応(2) | 13:32

ツイートシェア

2020-07-11

■「未経験 文系が3ヶ月でDSになる方法」を止めろ1

・用意されているAIをColaboratry(Googleの無料貸し出しPC)上で5秒で動かす。
はじめてのニューラルネットワーク：分類問題の初歩 | TensorFlow Core :目次
PythonDataScienceHandbook (機械学習) :目次2

データサイエンスVtuberに相談する。

・初心者向け動画講義まとめ
1.【世界で18万人が受講】実践Pythonデータサイエンス | Udemy
Python入門用で質と量と日本語が完備されている。3億倍速で見てコーディングの苦手意識を消したらAndrew.ngへ
2.Machine Learning by Stanford University | Coursera
Andrew.ng が機械学習とは何か教えてくれる。時間と体力は必要だが機械学習入門に必要。
3.Eラーニング教材・講義動画配信 | 数理・データサイエンス教育強化拠点コンソーシアム
データハンドリングなどの入門者講座はUdemy の方が良いが、時系列解析・データ活用講座に関してはこれより良い教材は無い。
多分、動画の[1,2,3]を理解していてコードが書けて、学歴があるならTier4 のインターン・バイトは受かる。
4.DeepMind x UCL | Deep Learning Lecture Series 2020 | Youtube
Deep Learning 講座、タイトル通り

Permalink |記事への反応(0) | 20:42

ツイートシェア

2020-07-10

■anond:20200710172035

GCPとAmazon　Linuxで比較したし

AMI比べるためにubuntu とAmazon Linux比べたし　通常版と　Deep learning　AMIで比べたし

C++11とpthread比べたし　ちょっといまCUDAと比較してるけど

おおもとはなぜかBlogが立ち上がらなくなっただけ

ところでGCPってCUDAいく？

Permalink |記事への反応(1) | 17:22

ツイートシェア

2020-06-23

■anond:20200623070136

ブームなんてそんなもの。

それで流れてくる金もあるんだからお客さんは大事にしてあげよう。

クリエイティブｗなアイディアｗなって言ったって、たいがいはどっかで見聞きしたものを仲間内で反芻して思いついたと思ってるもの。

まあそれ自体がDeep Learning プロセスと言えなくもない。

Permalink |記事への反応(0) | 07:20

ツイートシェア

2020-05-07

■anond:20200507151211

AIって人工知能の意味で使ってるなら、まだ実現してないぞ

deep learningのつもりなら、マシンパワーが上がって実装しやすくなっただけで、以前の延長線上だ

Permalink |記事への反応(2) | 15:13

ツイートシェア

2020-01-16

■社畜ですみません

残業を書かなくてすみません。サービス残業をすすんでやってすみません。私は労働者の敵で、経営者の良い道具・社畜です。でもそれが私にとって居心地がいいのです。

子供の頃から何かを成したいと思っていました。思っていましたが、行動はしませんでした。何かをしたいと思いつつ何もせず、時間は過ぎ、大学に進学し、4年間でなにかになろうと自己実現を夢想しつつ、驚くことに何もせず、そのくせ何もしない癖がついたので就職はせず惰性で院に進学し、そこでようやく行動力のなさのしっぺ返しを受けて地獄を見て、逃げるように就職しました。

会社では、そこそこ良い大学を出たこともあって重宝されました。真面目に授業を受けていたのでプログラムもそこそこ書けました。いろんなことを頼まれるので、それに応えました。「ああいうのが欲しい」「こんなのあったら便利じゃない？」を日々の業務と並行して作るのは難しいので、サービス残業をしました。お金が欲しくないわけではないですが、それよりも自分の作ったもので喜ばれるのが嬉しかったからで、楽しかったからです。

私は会社人になり、ようやくモノづくりをはじめました。それでも人から言われたことばかりをこなす、自分というものが無い存在です。それでも楽しいのです。会社という強制労働施設は、行動力のない私の自己実現の場として発揮されました。休日に自宅のPCでエクセルマクロを勉強し、会社のデータのモックを書き、動作を確認してから会社に納品したこともあります。「もうできたの？はっや！」と驚かれ、嬉しかったのを覚えています。

よくある会社の「AIで何かしたい」に応えるため、会社の帰りに本屋によって「退屈なことはPythonにやらせよう」「仕事ではじめる機械学習」「ゼロから作るDeep Learning」を自費で購入し、Udemyの講座もいくつか自費で購入しました。家に帰って独学し、休日もずっとそれらをやっていました。ある程度理解できたので、サンプルコードを改造しつつ、会社の製品情報や見積額等を学習データに使い、見積 AIを作りました。営業からは「面倒な見積が簡単になった」という言葉をいただき、購買の人からは「見積額も適正でいいね」と言われました。

仕事も一応ちゃんとやってるし、いろんな頼まれごとをこなすので、会社からはより重宝され、入社3年目でチームリーダー兼プレイングマネージャーを任されました。チームリーダーになってからはチームのマネジメントで忙しいので、なかなかモノづくりをするのは難しく、プログラムを触る頻度は減っていきました。それでも仕事中は自分もコードを書きつつ、家に帰って仕様の確認や仕様書の作成などをやるようになりました。

ある日飲み会の席で、人づてにチームのメンバーが自分のことを「コード書きながらマネジメントするすごい人」「尊敬している」ということを言っていたと聞きました。「尊敬する」ということを言われたのは初めてだったので、感動しました。飲みの席では「ブハハｗｗｗ」と笑ってごまかして、家に帰ってなんか泣きました。

プライベートを大切にする人にとって、私のような存在は、経営者をつけあがらせ、労働者の価値を貶める裏切り者で馬鹿と見る人もいるかもしれません。というかはてブやTwitterとか見てるとそう思います。そのとおりだとも思います。

最近私が考えるようになったのは、プレイベートを大切にする人と、私のような会社でしか輝けない人のゾーニングです。プライベートを大切にする人にとっては、私達のことを悪く言う人がいます。私達のような社畜の中にも、プライベートを大切にする人のことを「定時で帰るやる気のないやつ」みたいな扱いをする人がいます。このような争いは不毛だと感じます。私が願うのはゾーニングされた世界です。プライベートを優先する人は当然いていいし、社畜は社畜で会社の中で輝いて楽しむ人がいてもいいということです。この考え方には、労働者同士の意識だけでなく、経営者の意識も大切だと思います。私のようなオーバーワーカーを通常の人材と思わず、特殊でラッキーな人材と認識する必要があります。経営者はプライベートを大切にする人をやる気のない人だと思わないでください。従業員は会社に奉仕すべきが当然と思わないでください。

最後になりますが、人の考え方は様々です。私のような考え方を受け入れられない人もいるでしょう。つまり、それでも社畜は悪であるという目線や、従業員は社畜になるべきという目線です。それでも結構です。大切なことは、自己実現だと思います。私は社畜をやめないし、あなたはプライベートを大切にするのをやめない。経営者は従業員を利用しているだけかもしれませんし、大切にしているかもしれません。とにかく、それはともかく自己実現だということです。自己実現のためなら、社畜でもいいと言う人間は、ここにいるのです。

Permalink |記事への反応(2) | 22:08

ツイートシェア

2019-05-06

■論文読んだ

Automatic classification oftrees using a UAV onboard camera anddeep learning

https://arxiv.org/abs/1804.10390

やったこと

Ecologyの研究には、情報科学の世界で研究されている画像解析の技術を使えば解決可能なものがある。著者らは、この一つである植物の分布の計測を試みている。具体的な解決方法は、UAVデータから撮影した画像データを元に、木々の種類を識別する分類器を作成である。手順として、最初に、UAVから画像と高度データを著者自らが撮影を行った。次にそのデータから学習用の教師データをいくつかの手順を踏んで作成する。この手順は、さらなる研究を行う際にも適用が可能である。結果、識別器は良い識別性能をだしている(Model1で83.1%)。前処理として、画像を切り分けて分類器にかけなければならないという点は未解決である。

しつもん

Introduction

システムの必要要件はなに？

Methods

Remote Sensing Data
- 画像ごとに80%のoverlapがある状態で撮影を行い、orthomosaicphotoを使って、1枚の画像に再構成したということ？
- GCPs(https://www.borg.media/groundcontrolpoint-2017-12-08/)を10点で計測するのは、なんのため？なんのaccuracyが上がるの？
- adigital elevationmodel はなにのための物？地表の物体が地面から何メートルのところにあるかを計測するためのもの？説明がない。

UAVphotography (orthomosaicphoto)この２つは別の物のはずなので、同じように書くべきではないのでは？
- UAVphotographyは生データのことで、
- orthomosaicphoto は加工データのことですよね？

2.3.1.Object-BasedTreeCrown Segmentation
- slopemodelがなになのかがわからない。
- 2行目、cellとはなにか？pixelのこと？
- なぜ木々の境界がはっきりするのかがわからない。高低差を元になにかの処理をなにかにしているということ？
- Multiresolution Segmentationは何を元に何を識別しているの？画像に対して木々の境界がpolygonになって表示されるということ？
- Figure 1の各段階にどのようなデータなのか、描画してほしい。
2.3.2. GroundTruth Label Attachment toTreeCrownMap
- eCognitionsoftwareは何を行うものなのか？色を元に、近傍をsegmentationするのか？
  - (1)まず最初に、手動で何があるかをおおよそ指定して、(2)eCognitionsoftwareにかけてやると、教師データを元に、他のデータも識別する。(3)ミスを人間が見つけ、修正を行ったということ？(Grab Cutの手法に近い)

2.3.3. EachTree Image Extraction with GroundTruth Label
2.4.Deep Learning
- 抜き出した木以外の領域は何で塗りつぶしたのか？単色？
- 塗りつぶした色によって学習結果が変わるはず。
- なぜ、これだけ良いデータを収集して識別のタスクを行ったのか？segmentation のタスクを行うべきだ(SegNetなどの利用をしない理由は？)
- GoogleLeNetのrandomseed がNoneになっているのは、どういう意味？

Results
- 1段落目は、具体的なデータを語らずに良い結果が得られたと言ってますが、なんのデータ？
- さらに、Resultsで突然データを増やしたと書かれているけど、どうやって増やしたのか？なぜ記述がないのか？
- Ise 2018への引用はついていないが、Referenceには記述してあるのは、なぜですか？
- model2がどのように作成されたのかがわかりません。
- 木以外の領域を塗りつぶして、画像データを作成するため、切り分けの仕方（木の伸び形状）によって学習が進んでいる可能性がある。
  - 木の領域を単色で塗りつぶして識別器にかけると、正しく認識されてしまうのでは？
  - 木の領域の長軸と短軸の特徴で分類かのうなのでは？

Discussion
- model2が92.7%の精度でclass4を識別すると書いてありますが、データがアリません。tableには91.95%となっています。
- システムの必要要件を満たすのか記述するべき。コストが抑えられていても、必要要件を満たせていないシステムになっていませんか？

Permalink |記事への反応(0) | 11:22

ツイートシェア

2019-05-05

■論文読んだ

Identifying 3 moss speciesby deep learning, using the “chopped picture” method

https://arxiv.org/abs/1708.01986

何をしているのか。

著者らは、コケ植物の画像判定を行うため、撮影した画像データから学習データを作成し、識別機を作っています。

データは著者らが作成しており、少数の画像から判定機を作成するために、"chopped picture" methodを提案しています。

この方法では、撮影画像から画像を切り分け、少部分にします。

画像枚数を多くするために、少部分間には50%のoverlapが存在します。言い換えるなら、ある画像は、他2枚の画像を元に再構築可能です。

CNNの学習では、切り出した画像から、validation dataとtraining dataに分けて学習を行っています。

以上の方法で、validation dataによってこの識別機の精度の計測をし、高い精度で識別できていることを主張している。

質問

提案手法は、training dataとvalidation dataに関係があるので、validation dataでの精度は高くなると思われます。

言い換えると、全データに識別機がオーバーfittingしているので、validation dataでの精度が高くなっているのでは？

つぎに、この論文の提案手法でのvalidation dataを識別機に食わしたさいの分類精度は、その識別機の分類精度とは言えません。

validation data・training dataに含まれていないdataセットを作成し、その新たなdataセットでの学習機の精度を検証するべきだと思います。

Permalink |記事への反応(0) | 03:22

ツイートシェア

■論文読み

Automatic vegetation identification inGoogle Earth images using a convolutional neuralnetwork: Acase study forJapanese bamboo

https://www.biorxiv.org/content/10.1101/351643v2

正確に読解できていなかったら申し訳ない

この論文でやったこと・感想

管理されなくなった竹が他の植物の生えた地域に侵略していくことが問題となっている。

この問題に対処するには、竹の移動を経時的に追うこと、または、侵略しているかを判別することが求められる。

本論文は、この問題を解決するために、Deep learningを用いて衛星画像データを竹とそれ意外に識別を試みる。

画像はGoogle Earth から取得し、著者らが3種類のTag付けを行った。このデータを元に学習を行った。　

結果、非常に精度の高い識別機が構成できたと主張している。

ただし、衛生画像を撮影した時期によって、精度が著しく損なわれるので、現時点では経時変化を追跡する課題は解決されていない。

質問

Introduction

竹林が徐々に他の植生の場所に侵略している。この問題を解決するために、まずどこに竹が生えているのかを識別するのがこの論文の目的。

この課題を解決するためにGoogleEarthの画像は適切なのか？言い換えれば、課題に対するシステムの必要要件が記述されていない。

竹の侵略速度はどれくらいなのか？頻繁に識別を行う必要があるなら、更新頻度の高い画像を使うべきではないだろうか。
侵略を認める解像度は十分なのだろうか？例えば、1m程度の侵略であれば対策の必要はなさそうだが、2m侵略があれば対策を行う必要がでるのか？
大きさ数mの竹を上空から撮影しているので、画角によっては竹が生えていない場所に竹の葉がかかる場合があると考えられる。

Methods

どのようなデータを用いたのかを詳細に記述できていない。再現性を保証するためには、地図を多角形で囲んだデータ・TAG付け方法・実際のTag付けデータの配布が必要である。
Google Earthのデータはいつのものか？具体的な撮影日。
どの範囲の画像を使用したのか。具体的なGPS座標と、面積。
教師データはどのように作成したのか。衛星データからある地域に竹があることを認める基準はなにか？
Figure 7、Figure 9はGPS座標と倍率を記述するべき
Overlapについて
- ある画像データの50%がほかの画像データの50%とoverlapしている。言い換えれば、ある画像は、2枚のほかの画像から再構成できる。切り分けた画像の75%をトレーニング画像とし、25%をvalidationデータにしている。ここで、validation dataの画像の一部は、training dataの画像の一部と重複している。この方法では精度は良く見積もられやすい。参照:https://qiita.com/QUANON/items/ae569961ea02b4468e23
- なぜvalidation dataとtraining data 関係があるデータを使って学習をさせたのか？現状のデータの扱いでは良い予測をする分類機だと評価されやすいというbiasがあることをdiscussionに記述するべき。
新しいデータを入力し、分類器のもっともらしい分類精度を計算するべき。

データ数
- 切り分けた画像の総数。タグ付された画像の個数。

実験 評価

この論文で提示している問題は、植物の侵略を判定する識別器をつくることである。故に、竹やぶと建物の境目になる部分が正しく識別されていることがこのシステムの必要要件である（多くの範囲が正確に識別されることは目標ではない）。

上の基準で判定率を計算するべきだろう。
Figure 7をみると、画像中央の広場の南側の植物との境目（黒い部分）は正確に判定されているのだろうか。
上述と同じ箇所で、黒い部分は竹でないならなんなのだろうか？GoogleEarthで見れば、何が写っているのかがわかるのか？
Figure 7の正解データが見たい。

Results

よみました

discussion

Transferability among the models

撮影日の天候などによって影響がでることを述べているが、そのような結果は論文に掲載されていない。
- 実際の画像がみたい。
撮影時の状況により、精度が著しく減少することを認めるなら、植物の侵略を計測するという今回の研究の目的は、達成されていない。
- このことを明記するべきではないか。

Permalink |記事への反応(0) | 02:52

ツイートシェア

2019-04-17

■若者 応援おじさんの思い出

https://twitter.com/MAEZIMAS/status/1113114798672113665

若者に説教する老害は二流。

一流の老害は「君たちこそが真のニュータイプだ」とか言って、若者を自分の既得権益確保のための鉄砲玉にする。

…いやマジ本当に、若い人気をつけてね。若者説教おじさんは、せいぜいまだ極限の不愉快ですむけど、若者応援おじさんに乗せられると最悪人生詰むので…

というツイートが流行っているので、私が遭遇した若者応援おじさんについて書こうと思う。

当時の私は親との折り合いがつかず、学力もそこそこあったし、勉強もしていたのにも関わらず大学に進学せずにフリーターをしていた。実家を出たかったし、大学にも進学したかったから金の工面が当面の目標だった。そんなときに出会ったのが若者応援おじさんのAさんである。Aさんはバブルの頃に就活をしていて、まだインターネットやパーソナル・コンピュータというのが流行る前から電子工作やプログラミングをやっていた人だった。実際、経歴を聞いてみると10回以上転職を繰り返しているものの、有名企業(今にして思えば、カビ臭い SIerだが)で部長をしていたことがあって、年収が1700万ぐらい稼いでいたこともある人だった。

最初に出会ったときは自分が如何にすごいかということを熱心に語っていた。80年台後半ぐらいのコンピュータ開発の大型プロジェクトに関わっていたとか、セキュリティの専門家とか、今までに触ったことのあるプログラミング言語が300個を超えるとか。でも、当時の技術的なトレンド(MongoDB、Ruby on Rails、AngularJSとか)についての知識が限りなく少なく、「フレームワークなんてその場で覚えればいい」みたいなタイプだった。中学生の頃にラジオ工作したとか、はんだごてで電子回路を設計したとか、そういう話は熱心にするのに、Bram Moolenaarの名前を知らなかったりした。要は、最近のプログラマがどういう関心やインセンティブでプログラミングやってるかを知らずに、過去の栄光を語ってるようなタイプだったと思う。

まぁ、それでも、その人のコネで中規模程度のSIerに入社して、そこそこいい感じの待遇だったように思う。当時の私の技術力は『わかりやすいJava入門』『たのしいRuby』を一通り終わらせて簡単な言語仕様を把握したぐらいでろくにコードも書いたことのないような人間だったから、定時で帰れて手取り二十万もらえるのは甘い汁を吸えたとは思うんだ。

でも入社を決めた一番の理由が、そのAさんが私の関心に理解があると思っていたからだ。というのも、当時の私は「人工知能や人工生命に興味があります。三年後に大学に入学するまでにプログラミングスキルを磨きつつ生活費と学費を稼ぎたい」ということを明言した上で、それを叶えてくれる会社を探していた。技術力はないものの、「自頭がいいから入社してからプログラミングを覚えればすぐに戦力になるよ」と複数の人間から言われていて、それぞれ就職先を紹介してもらえるような状況になっていた。今から思えば、そんなコードを書けない人間を自頭なんて胡散臭いもので褒めるような人間は信用してはいけないと思うし、口車に乗せられたと思うのだけど。そこは自分にも甘いところがあったように思う。あ、あと、補足しておくと、当時はDeep Learningなんていうのは全く人口に膾炙してなかった時期で、スチュアート・カウフマンや金子邦彦に憧れてたような、周回遅れの複雑系に魅せられた若者が私だった。

駄文を書き連ねてしまったが、要は

①親との折り合いが悪く、大学に進学したいが、金が足りない

②実家を出るために生活費を稼ぐ必要があったが、飲食のバイトとかではスキルが身につかない状態で、価値の高い若い時間を無駄にしてしまう

③そんなところに現れたのが過去の栄光を話す若者応援おじさんのA

④自分は殆どコードを書いたことのない業務未経験で、21世紀になっても複雑系の話に興味をそそられるような斜に構えたスノッブ

という状況設定を理解してくれればいい。

では、入社後の話をしよう。私が配属されたプロジェクトは80万行程度のJavaのコードで動いてるBtoB向けの製品を保守開発してるプロジェクトだった。やってることはGoogleやAmazonやMicrosoftみたいな大手ならやってるようなサービスの完全下位互換みたいなソフトウェアを、情弱だけど社員数は多いみたいな企業に売りつけるような仕事だ。国産とか、セキュリティとか、そういうよくわからない言葉を並べ立てて、海外のUIも洗練されていて、優秀なエンジニアが管理してるものをセキュリティ的に怪しいと不安を煽り立てて売りつけるようなやつだ。そんなクソみたいな製品でも年間5億円ぐらいの売上になるのだから、IT系って糞だなって思う。ネット上では優秀な人間ばかりがアウトプットしてるし、NDAの名の下に詐欺まがいのソフトウェア(今回の例なら無料でUIも洗練されていて、使いやすいサービス)が明るみにならないのだから、こんな国はさっさとスクラップ・アンド・ビルドすればいいのにって思うよ。IT化されてないのが時代錯誤で〜みたいな記事はネット上でもバズるけど、実際には10年前のスパゲッティコードを惰性と不安につけ込んで売りつけるようなSIerがたくさんある。そんで、そんな意味不明なソフトウェアを導入すれば、どこに何があるのか分からないUIの操作に大切な業務時間を奪われて、日本全体の生産性が落ちてしまう。ユーザーの時間と生産性を奪い、開発者にとっても技術的負債にしかならないようなソフトウェアを売りつけてる悪性腫瘍みたいなSIerはさっさと滅んでしまえばいいと思うよ。

まぁ、私が配属されたプロジェクトはそんな感じだ。まるで意義を感じないが金にはなってるプロジェクトに配属された。そのプロジェクトの根幹部分は一人のエンジニアが設計開発しており、そのエンジニアは既に退職して、どこに何が書いてあるのかわかってない人間が後任として保守を行っている。盲腸みたいに全く有難みのない機能を増やすことでより高く売りつけるようなプロジェクトだった。

そのプロジェクトの中にいる人について話そう。プロジェクトマネージャーは仕事漬けで毎月350時間ぐらい働いている60連勤とか当たり前で、常に酔っ払ったような、眠そうな目をしてる人だった。にも関わらず、同じプロジェクトの人間は仕事がなさすぎて業務時間中に関係ない談笑をしたりしていた。プログラマやテスターや文書作成をするスタッフが40人ぐらいいるところで、閑散期(機能追加のサーバーリリース前以外)は暇そうにしてる人が多かった。プロジェクトマネージャーを除いて。要は、PMは一生懸命働いているが、その一生懸命さは惰性で行われており、無能なのに業務時間が長いPMがいて、その人が全部仕事をやってしまう。他人に頼めない性格らしくて、存在意義が分からない業務を他人に頼んでは「なぜこんなこともできないんだ？」って怒鳴るのが生きがいみたいな人だった。頑張ってることがアイデンティティになってて、その頑張りに意味があるのか、必要なのかという吟味ができず、タスクを他人に振ることもできず、情報もそのPM一人だけが握っているから、周りの人も「私が仕事を請け負いましょうか」ということもできない。それで新入社員をイビるような存在意義のわからない仕事を振って、できなかったら人格否定をするような感じの。

私が受けた仕事ととしては、週に1回ベンダーのところに会議をしに行くんだけど、そのときの社内の資料を全部紙でプリントアウトして持っていくというのがあった。文書作成スタッフが製品の仕様をWordでまとめて、600ページぐらいのpdfにしたものが1500万円ぐらいで売れるらしく、その増えた言語仕様をプリントアウトしてベンダーのところまで持っていく。追加された仕様以外にも、今週やったテスト内容をExcelで纏めたものをプリントアウトしたりしていた。紙の量で言うと、一回の会議で2500枚ぐらいで、それをキャリーケースに詰めて客先であるベンダーまで持っていくらしい。聞いた話では、その2500枚の会議資料は殆ど読まれずに捨てられるのに、そのPMはベンダーにその慣習を廃止しようとは提案しない。ベンダーとの週一の会議の他にも、進捗報告を主とする社内会議があって、PM以外の人はあのプリントアウトする悪習は廃止すべきという話が上がっているのにPMが首を縦に振らないから一向に改善されない。まぁ、そのプリントアウトするのをやるのが私の仕事だったわけですよ。毎週4時間ぐらい掛けてWordやExcelの文書サイズとか調整してさ。元の文書のサイズや余白が狂ってるのに、客先に失礼だと言われて、手直しして、プリントアウされたコロコロコミック何冊分だよ？　みたいな紙の束をホチキスで止めていくんだけど、ホチキスの止め方が汚いとやり直し。

じゃあ、なぜPMは頑なに意味のない業務をし続けて、それによって新入社員を使い潰そうとするのかと言えば、弊社の業績が悪くて倒産しそうだったときにそのベンダーが手を貸してくれたからそのときの恩義があるとかなんとか言っていた。だから、靴を舐めるようなことをするし、他人の生産性を奪うようなクソ製品を世の中に出して何も感じないらしい。読みもしない産業廃棄物を作り出して、それを無碍にされて喜んでいるような業務が、今の日本の何割を占めているのだろう？　そのPMの口癖は「俺はプログラミングは全くわからないが、こんなプリントアウトの段取りもできないようなやつはプログラミングなんてできないと思うよ」だった。FizzBuzzどころか変数や関数すら知らないような人間にこんなことを言われるのは屈辱だったし、これが高卒未経験で就職することなのだろうと思った。

他にも、私が受け持った仕事に、製品が動くかどうかを確認するテスターという仕事があった。RSpecやSeleniumで自動化しようと言っても、そんな技術を持ってる人がいなかったから、一々自分でその製品を触って仕様通りになっているかを確認しないといけなかった。画面遷移が600ページのpdfになっているから、それを見ながら正しい画面遷移ができているかを確認する業務だったが、正直人間のやる仕事ではないと思う。画面遷移だから前のページから次のページに移行したときに前にどのページだったなんてスクショを撮ったぐらいじゃわからないのに、「このテストをExcelにした内容じゃ、本当にテストしたのかわからないだろう？」と言われた。言われたとおりにExcel ファイルにスクショをひたすら貼り付けていたというのに。しかも、その他にも特定のファイルをアップロードするときにどの条件だとアップロードができないかを判別するテストをどうやって行うのか考えろというのがあった。今までにテスターをやっていた人に聞いても指針なんてないと言われ、「賢い人はそういうのを考えつくものだ。俺はパソコンに詳しくないが」とPMに言われ、嫌気が差した。

まぁ、ここまで書けば、如何にブラックと言うか、理不尽で不合理な職場かというのはわかったと思うけど、いい面もあったんだ。前にも書いたように、未経験の高卒が手取り 20万貰えたのは嬉しかったし、研修のない会社だったから、最初の二ヶ月ぐらいは一人で勝手に勉強しててと言われたから、実働換算で時給3000~4000円ぐらい貰える計算だったのかな。一番瞬間時給が高かった日はメールの返答に20分ぐらい使ったときだったから、日給1万、実働換算の時給が30000円ぐらいになった。それぐらい放任されていた。

最初は社長が「君にはソースコードのUMLを書いてもらおう」とか言って、クラス図を書く練習をしていたんだけど、現場の人は「今更UMLなんて必要ない」「ソースコードを読めばわかる」と言って、全く必要とされていなかった。だから、業務とは関係ないTCP/IPやRubyやGitの勉強をしていた。家のことで勉強に対してモチベーションが落ちていた私は、金を貰えるという環境では目の前の勉強に集中できるようになって、元の勉強するための生活リズムっていうのか、そういうのを取り戻せた。それは当時の私にとっては有難かったと思う。

ここまでをまとめると

⑤無料で使えるサービスの下位互換といえるような、他人の生産性と金を無駄にするような製品を開発してるプロジェクトに配属された

⑥PMだけが忙しく働いて、周りの人の割り振りができていない。

⑦PMが多忙なのはしなくていい仕事を引き受けているだけ。

⑧社会悪のようなソフトウェアを売りつけて金を稼いでいるプロジェクトだった。

⑨仕様書やテスト内容のプリントアウトという必要ない業務をしたり、指示内容と叱責内容が矛盾する理不尽を受けなければならなかった。

⑩しかし、勉強してるだけで月20万貰える環境は有難く、当時の私にとっては願ったり叶ったりだった。

では、次に私がその会社の入社から辞めるまでの経緯について書こう。最初のうちは、自分の勉強時間を取れていたし、振られる仕事も理不尽で意義を感じられないものであるものの、すぐに終わることが多かったから問題ないと感じた。それが徐々に仕事が増えていき、勉強時間が取れなくなっていった。

ここで若者応援おじさんAの登場である。Aさんは私と会ったときは有名企業に勤めていて、そこを辞めて私を紹介してくれた中小企業で働き始め、その数カ月後に私を紹介してくれた。元々、その会社の社長とは懇意にしていたから、一緒に働こうという話が何十年も前からあって、今回ちょうどタイミングが合ったから、その友人の会社の重役として就職したらしい。私が就職したのはその数カ月後だった。

Aさんは「何か問題があったら、部下や上司という立場を気にせずに忌憚なく言ってほしい」「俺は人を見る目はある方だ。君は一本芯の通ったところがあるから、周りに流されずに新しいことをできるだろう」「君には将来性がある」「俺は新しい会社でも権力を持ってるからへんなことを言ったり、したりしてる人がいたら遠慮なく言ってほしい」とかそういうのを入社する前に言っていて、まぁ、色々とおかしいところ、FAKE野郎みたいな発言が多かったけど、そこだけは信じてたんだよね。本当に騙すんだったら、そんなすぐに辞められるようなリスクを上げるような発言はしないだろうってさ。ちなみにFAKE野郎って感じたのは、一方的に自分の話だけをして、私が質問すると煙に巻いたり、私のことを買ってるという割には私の話をすぐに中断させて自分の話をし続けるとか。その人はFラン出身だったから、ちょっとインテリなことを言うと「君は変わってるね」って言ったり、きょとんとした顔で10秒ぐらい固まった後、すぐに自分の自慢話を再開したりと、決して自分の知らないことや分からないことを認めようとしなかった点だ。他にも、「私と働きたいと言ってくれていた会社はあったけど、そこは技術的に成長できそうだけど給料は月7万程度でバイトの身分だから、迷ってるんですよね。バイトだから自由時間は多く取れるんですけど」みたいな発言をしたら、鳩が豆鉄砲を食ったような顔をして、私が感じていた不安を取り合ってはくれなかった。Aさんは「俺は社内で影響力を持っているから、君を正社員にすることもできる」みたいな話を延々としてたのに、いざ蓋を開けてみると、「君の面接での受け答えが駄目だから、契約社員として雇用することになった」「あれから上層部に渋られてしまって、請負契約にすることになった」と話が二転三転していった。だったら、他にも選択肢があったのに、他のところに就職したのにと思ったが、自分の能力や経歴で負い目を感じていたから強く言うことはできなかった。高卒で就活するというのはそういうことだ。他にも選択肢があるのにも関わらず、どうせ労働に関する知識がないと足元を見られて、条件を徐々に下げられ、他に選択肢をなくした後で、悪い条件で働かざるを得ない状況になっていた。結局、勤務時間がタイムカードで管理されてるのにフリーランスとして請負契約を結ぶという偽装請負で契約させられ、もっと技術力を磨ける選択肢は潰されてしまっていた。

私は会社の問題点を丁寧に分析してpdfにまとめてAさんに送ったんだ。それが間違いだった。如何に会社がそのベンダーに良くしてもらったか、大変なのをわかった上で俺たちが会社を立て直してきたかということばかりを話していた。百歩譲ってそこはいいとしても、ベンダーとは関係なく職場環境を良くするための話までいい加減に聞かされてうんざりしていた。

「Aという問題があります。その背景にはBがあります。そのためにはCという解決策があります」

という話をしたときに、「Bぐらいみんな当たり前にしている。君だけ特別扱いすることはできない」みたいな返し方をされて、問題が発生してる事自体はないものとされていった。結局、職場にはびこる不合理で理不尽な業務やルールは改善することはなく、私への人格攻撃で終わってしまった。

毎日どうでもいい作業で疲れ切って勉強時間が取れなくなってしまった私は、最初に出会った頃のAさんの言葉を信じて、「私が本当にしたいことは、仕様書やテスト時のスクショをプリントアウトしたり、よくわからないテスターをやったりすることではない。このままでは、プログラマとしてのキャリアを積むための勉強時間を作ることもできないし、業務内でコードを書くこともないから業務時間を短くしてほしい」と言った。少なくとも、最初Aさんと会ったときは、「君には人工知能や Permalink |記事への反応(1) | 23:52

ツイートシェア

2019-03-29

■anond:20190325155543

deep learning は基本的には、入力と正解のセットをたくさん用意して疑似ニューラルネットワークを教育するものだから、入力に対する正解をあらかじめ決めているわけ。

だから、教育用データセットを作成する時点でフレーミングに関する基準は含まれるよね。

Permalink |記事への反応(0) | 11:47

ツイートシェア

次の25件>

Movatterモバイル変換

「deep learning」を含む日記

■ゲイリー・マーカス略してゲリカス

1

事実関係の確認

2

Gary Marcusの変遷

「変わった」のか？

本質的な悲劇

3

ブログ（Substack）での彼

SNS（X/Twitter）での彼

この違いが意味すること

修正された評価

4

■AIの仕組みについて漠然と理解している人のために

『パターン認識と機械学習』

『計算理論の基礎』

『深層学習（Deep Learning）』

おわりに

■Deep Learning（深層学習）型のAIが性技において「乳首舐め手コキ」が最高のソリューションであることに気づくのにどれだけの時間がかかるのか？

■anond:20240324025847 のつづき

anond:20240322044819 の 関連資料(つづき)

遊舎工房自作キーボードの始め方

計算機プログラムの構造と解釈

番外編

ちいさなWebブラウザを作ってみよう

ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装

NLP2024チュートリアル３: 作って学ぶ日本語大規模言語モデル -環境構築手順と実験ソースコード

「作って学べる教材」ではないが、コンパクトに機能を実現していて読んで仕組みを理解するのに役立ちそうなプロジェクト

シンプルなwebフロントエンドフレームワーク Hyperapp

ポケットサイズのブロックチェーン tinychain

■GPTが医療現場で使われる可能性について聞いてみた

GPT-3の実装を軽く確認

■ChatGPTにお前はどうやって実装されてんの？って聞いてみたら

■[あとで読む]2022年6月はてブのあとで読むトップ30リスト

プログラミングを学ぼうと思い立つ

結局Excelへ戻り、PowerQueryとの出会って、再びPythonとRに回帰した話

機械学習へ

ふたたび実験計画法

■IT(?)に立ち向かうための心構えとか考え方

＞ 1.具体的な事が分からない

＞ 2.説明が出来ても説明が出来ない

＞ 3.自分は頭が悪い

＞ 4.最後に

■「未経験文系が3ヶ月でDSになる方法」を止めろ1

・用意されているAIをColaboratry(Googleの無料貸し出しPC)上で5秒で動かす。

・初心者向け動画講義まとめ

■社畜ですみません

■論文読んだ

Automatic classification oftrees using a UAV onboard camera anddeep learning

やったこと

しつもん

Introduction

Methods

■論文読んだ

Identifying 3 moss speciesbydeep learning, using the “chopped picture” method

何をしているのか。

■論文読み

Automatic vegetation identification inGoogle Earth images using a convolutional neuralnetwork: Acase study forJapanesebamboo

この論文でやったこと・感想

Introduction

Methods

Results

discussion

Transferability among the models

■若者応援おじさんの思い出

anond:20240322044819 の関連資料(つづき)

ちいさな Web ブラウザを作ってみよう

シンプルなweb フロントエンドフレームワーク Hyperapp

■[あとで読む]2022年 6月はてブのあとで読むトップ30リスト

Identifying 3 moss speciesby deep learning, using the “chopped picture” method

Automatic vegetation identification inGoogle Earth images using a convolutional neuralnetwork: Acase study forJapanese bamboo