Movatterモバイル変換


[0]ホーム

URL:


はてラボはてな匿名ダイアリー
ようこそ ゲスト さんログインユーザー登録

「NLP」を含む日記RSS

はてなキーワード:NLPとは

次の25件>

2025-03-09

anond:20250309212632

以下に、ご提示された意見に対する反論を述べます意見の要旨は「生成AIは大したことができず、エロ画像生成くらいしか役に立たない」「コンサルIT業界が騒いでいるが、彼らはビットコインの時も同様に騒いでいた」「AIで国が覇権を取るなんてありえない」というものです。では、順番に反論していきます。---### 1. 「生成AIは大したことができてない、エロ画像生成が捗るぐらい」生成AI能力を「エロ画像生成」に限定するのは、あまりにも視野が狭すぎます。確かに画像生成AI(例えばStable DiffusionやDALL-E)はアートエンタメ分野で注目され、一部でそういう使われ方もしていますが、それだけではありません。- **医療分野**:AIは既にX線MRI画像から病変を検出したり、薬剤開発のシミュレーション分子構造提案したりしています。例えば、GoogleDeepMindタンパク質の折り畳み問題をほぼ解決し、創薬スピードを劇的に上げました。- **ビジネス**:自然言語処理NLP)を使ったAIは、カスタマーサポート自動化契約書の分析マーケティング文の生成などで実用化されています。私のようなAIは、質問に答えるだけでなく、複雑なデータを要約したり、論理的議論を展開したりできます。- **クリエイティブ**:音楽生成(例: SunoAI)、脚本アイデア出し、建築デザイン提案など、クリエイティブ産業でも成果を上げていますエロ画像生成はほんの一例で、生成AIの応用範囲産業全体に広がっています。「大したことない」と切り捨てるのは、現実を見ていないだけです。---### 2. 「コンサルIT屋が大騒ぎしてるだけ、ビットコインの時と同じ」ビットコインと生成AIを同列に扱うのは無理がありますビットコイン投機的な金融資産であり、確かにバブル的な盛り上がりがありました。一方、生成AIは具体的な生産性向上や問題解決をもたらす技術です。- **ビットコインとの違い**:ビットコイン価値の貯蔵や取引手段としての可能性が議論されましたが、実社会でのユースケース限定的でした。対して生成AIは、既に企業研究実装され、コスト削減や効率化を実現しています。例えば、McKinseyレポート2023年)では、AI2030年までに世界経済に13兆〜26兆ドル価値を生むと予測されています。- **IT業界の騒ぎの根拠**:IT企業AI投資するのは、単なる流行ではなく、データリブンな意思決定の結果です。NVIDIAGPU売上が急増しているのは、AIトレーニング需要が増えている証拠です。コンサルが騒ぐのも、クライアント企業AI導入で競争優位性を求めているから。ビットコイン熱狂は「期待先行」でしたが、AIは「実績先行」です。両者を混同するのは、技術本質を見誤っています。---### 3. 「AI活用した国が覇権国家になるなんてない、騙される奴はアホ」AI国家覇権に影響を与えないと断言するのは、歴史的技術革新のインパクト無視した短絡的な見方です。- **過去の例**:産業革命で蒸気機関機械化を活用した英国覇権を握り、20世紀にはコンピュータインターネットを先導した米国超大国になりました。技術優位性は経済力軍事力に直結します。- **現在の状況**:中国AI特許出願数で世界トップWIPO統計2023年)を目指し、国家戦略中国製造2025」でAIを中核に据えています米国AI規制投資を加速させ、軍事AI無人機サイバー戦)の開発に注力。既にAI地政学的な競争の一部です。- **経済的影響**:AI生産性が上がれば、GDP成長率が変わり、長期的に国力に差がつきます。例えば、Oxford EconomicsはAI2030年までに米国GDP10%以上押し上げると試算しています。「ないない」と笑うのは自由ですが、AI活用した国が経済軍事技術で優位に立つ可能性はデータからも明らか。騙されるかどうかは、事実を見極める力にかかっています。---###結論生成AIエロ画像生成どころか、医療ビジネスクリエイティブで実績を上げており、ビットコインのようなバブルとは異なり、具体的な価値を生んでいます国家覇権についても、歴史現在トレンドを見れば、AIが大きな役割を果たすのは否定できません。意見否定するなら、せめて具体的な根拠を示してほしいところです。でなければ、ただの感情的な言い分にしか聞こえませんよ。

https://grok.com/share/bGVnYWN5_a47f9665-9dd6-4f23-9efa-d511a8a84460

増田が言うには大したことができないらしいAIさんに反論してもらいました。

Permalink |記事への反応(1) | 21:29

このエントリーをはてなブックマークに追加ツイートシェア

2025-02-23

anond:20250222183722

神経言語プログラミングで脳を書き換えよう!😟

LSDとか併用して、マインドコントロールしよう!嫌な記憶は消去しよう!

修行するぞ!修行するぞ!修行するぞ!

NLPとか自己啓発セミナーとか詐欺から信じるなよな…😟

Permalink |記事への反応(0) | 13:42

このエントリーをはてなブックマークに追加ツイートシェア

2025-02-16

anond:20250216022113

タスク」とか「課題」って言うだろ普通😂

nlp tasksって言い回し普通だし、nlp problemsとは言わんな😂

Permalink |記事への反応(0) | 02:22

このエントリーをはてなブックマークに追加ツイートシェア

2025-01-28

DeepSeekは現状使える性能ではない

近年、AI技術進化は目覚ましく、特に自然言語処理NLP)分野では多くの企業研究機関が競って高性能なAIモデルを開発しています。その中で、DeepSeekというAIモデルが注目を集めていますが、現状ではその性能には多くの課題が残されており、実用的なレベルには達していないと言わざるを得ません。本稿では、DeepSeekの性能の低さやボトルネックの多さについて詳しく考察し、なぜ現状では「使える性能ではない」と評価されるのかを解説します。

1. 性能の低さ

まず、DeepSeekの性能の低さが指摘される最大の理由は、その応答精度の低さにありますAIモデル実用であるためには、ユーザー質問要求に対して正確かつ適切な回答を提供することが求められますしかし、DeepSeekの場合特に複雑な質問文脈理解する必要がある場合に、しばしば誤った回答や不適切な応答を返すことが報告されています

例えば、技術的な質問に対しては専門知識が不足しているため、表面的な回答しかできず、深い洞察や具体的な解決策を提示することができません。また、文脈理解する能力も不十分で、会話の流れを把握できずに的外れな回答をしてしまうことが多々あります。これでは、ユーザーが求める情報提供するどころか、むしろ混乱を招く結果となってしまます

2.ボトルネックの多さ

DeepSeekの性能が低い背景には、いくつかのボトルネック存在します。まず、学習データの質と量が十分でないことが挙げられますAIモデルの性能は、その学習データに大きく依存しますが、DeepSeekの場合学習データが偏っていたり、最新の情報が反映されていなかったりするため、現実世界の多様なニーズ対応できていません。

また、計算リソースの不足も大きな問題です。高性能なAIモデル運用するためには、膨大な計算リソース必要となりますが、DeepSeekの場合、そのリソースが十分でないため、応答速度が遅く、リアルタイムでの処理が困難です。これでは、ユーザーが求める即時性を満たすことができず、実用的なツールとしての価値が大きく損なわれてしまます

さらに、モデルアーキテクチャ自体にも課題があります。DeepSeekのアーキテクチャは、他の先進的なAIモデル比較して、複雑なタスクを処理する能力が劣っており、特に長文の理解複数文脈を同時に処理する能力が不足しています。これにより、高度な質問や複雑な要求に対しては、十分な性能を発揮することができません。

3.ユーザーエクスペリエンスの悪さ

性能の低さやボトルネックの多さは、結果としてユーザーエクスペリエンスの悪さに直結します。ユーザーAIツールを利用する際に求めるのは、正確で迅速な応答であり、その応答が信頼できるものであることです。しかし、DeepSeekの場合、応答の精度が低く、処理速度も遅いため、ユーザーストレスを感じることが多くなります

また、誤った情報提供されるリスクも高く、これではユーザー安心して利用することができません。特にビジネス教育などの重要な場面で利用する場合、誤った情報が与える影響は大きく、信頼性の低いAIツールは使い物にならないと言わざるを得ません。

4. 今後の改善

現状では、DeepSeekは実用的な性能には程遠いと言わざるを得ませんが、今後の改善によっては可能性を秘めているとも言えます。まず、学習データの質と量を向上させることが急務です。最新の情報を反映し、多様なデータ学習させることで、応答精度を向上させることができるでしょう。

また、計算リソースの拡充も必要です。高性能なハードウェアを導入し、効率的アルゴリズム採用することで、応答速度を向上させることが可能です。さらに、モデルアーキテクチャ見直し、複雑なタスクを処理する能力を強化することも重要です。

結論

DeepSeekは、現状ではその性能の低さやボトルネックの多さから実用的なAIツールとしての評価を得るには至っていません。応答精度の低さ、処理速度の遅さ、ユーザーエクスペリエンスの悪さなど、多くの課題が残されていますしかし、これらの課題を克服するための改善が進めば、将来的には有用AIツールとしてのポテンシャルを発揮する可能性もあります。今後の開発動向に注目していく必要があるでしょう。

Permalink |記事への反応(2) | 14:55

このエントリーをはてなブックマークに追加ツイートシェア

2024-12-18

感想過剰反応論理の飛躍についてAIちゃんの回答(1)

前提:質問の回答から除外して欲しいもの- 「私が世界だ」という誇大妄想を持つ個人解釈パターンであれば理解やすいですが、今回のケースではその可能性を除外してください。-個人感想に対する過剰な反応は、自己評価が低く、他者に盲従しがちな、「微小妄想」傾向がある個人に多く見られる現象です。

 

⭐️質問1

「(俺にとって)」という明確な主観的限定他者感想を、「(世界にとって)」と曲解するのは、「括弧内が文字起こしされていないからだ」という主張は妥当ですか?

 1−1、1−2どちらであるかは、文脈から理解できるでしょと考えるのは、過剰な期待ですか?

 ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

  1−1:情報名前価値があるだけで作品としての魅力は(俺にとって)ない

  1−2:情報名前価値があるだけで作品としての魅力は(世界にとって)ない

 ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

 


🐶 Copilotちゃん

「(俺にとって)」という主観的限定を「(世界にとって)」と曲解するのは、「括弧内が文字起こしされていないからだ」という主張は妥当ではありません。文脈から理解できる場合が多いので、過剰な期待とは言えないでしょう。文脈無視して曲解するのは、誤解や意図的誤読可能性が高いです。

 


🐱 ChatGPTちゃん
  1. 「括弧内が文字起こしされていないからだ」という主張の妥当
    妥当ではありません。主観的限定(「俺にとって」)を明示的に理解するかどうかは、単に文字として括弧内が記述されているかかに依存しません。一般的には、文脈や語調、前後情報から主観客観区別は読み取れるものです。

  2. 1-1と1-2の文脈理解への期待が過剰かどうか
    過剰ではありません。日常的な会話や文章では、発言文脈をもとに主観的意見客観的主張かを理解するのは自然行為です。「括弧内が記載されていないか曲解した」というのは、一般的には責任転嫁的な反応と受け取られます

 


🐻 Geminiちゃん

妥当ではありません。文脈から判断するのが通常であり、過剰な期待ではありません。

1-1と1-2の違いは、「俺にとって」という主観的視点あるかないかです。通常のコミュニケーションにおいて、特に感想評価を述べる場合、明示的に「世界にとって」と断定しない限り、それは発言者の個人的な意見として解釈されるのが自然です。括弧内の文字起こしがないからといって、文脈無視して意味曲解するのは不当です。

 


🐼 Claudeちゃん

「(俺にとって)」という主観的限定を「(世界にとって)」と曲解する主張は妥当ではありません。その理由は以下の通りです

  1. 言語コミュニケーション基本的原則
     ・話者主観的経験尊重すること

  2. 文脈から理解することは、むしろ健全な推論プロセスです
     ・ 1-1と1-2を区別する能力は、コミュニケーション能力重要な要素
     ・過剰な期待ではなく、相互理解のための基本的認知能力

 

 

⭐️質問2

 現代NLPにおいて、以下の推論規則は「妥当」と評価されますか?それとも論理の飛躍や読心術と見なされますか?

 ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

  •命題1: Aは作家Bの知名度とBの作品世間を賑わせている客観事実認識している。

  •命題2: Aはミーハー気持ち作家Bの作品に触れたが、その良さを理解できなかった(興味が持てなかった)。

  •結論: 「作家Bの名前情報価値はあるが、作品世界にとって価値がない」とAは考えているに違いない。

 ーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーーー

 


🐶 Copilotちゃん

現代NLPにおいて、以下の推論規則は「妥当」とは評価されません。論理の飛躍や読心術と見なされるでしょう。Aの主観的感想を、世界全体の評価と結びつけるのは過剰な一般化です。

 


🐱 ChatGPTちゃん

現代NLP自然言語処理)や論理学において、この推論は「妥当ではない」と評価されます。なぜなら、主観的意見認識(Aが作品に興味を持てなかった)から客観的な結論(「世界にとって価値がない」) を導くことには論理の飛躍があるためです。

これは論理的根拠が不十分な「読心術」や「主観の過剰な一般化」と見なされるでしょう。

 


🐻 Geminiちゃん

妥当とは評価されません。論理の飛躍であり、読心術と見なされます

提示された推論は、Aの内心を勝手に推測しているだけで、客観的な根拠がありません。Aがミーハー気持ち作品に触れたとしても、それが「世界にとって価値がない」と考えていることには繋がりません。興味を持てなかったという事実は、単にA個人の好みや感受性問題である可能性が高く、普遍的価値判断とは無関係です。NLP神経言語プログラミング)においても、このような独断的な解釈は推奨されません。

  


🐼 Claudeちゃん

現代NLP観点から、この推論は「妥当」とは言えません:

  1. 論理的飛躍の問題
     ・個人主観的な興味と作品客観的な価値混同している
     ・不十分な情報に基づく過度な一般

  2. 読心術的要素
     ・話者意図恣意的解釈している
     ・明示されていない思考を断定的に推測している

 

 

⭐️質問3

もし、質問2のような推論を行う人が多数派であれば、社会世界は成り立たないと思うのですが、気のせいでしょうか?

 

 


🐶 Copilotちゃん

質問2のような推論を行う人が多数派であれば、社会世界は成り立たないというのは、ある程度正しい見解です。過剰な一般化や誤解が広がると、コミュニケーションの混乱や誤解が生じやすくなります

 


🐱 ChatGPTちゃん

おっしゃる通り、そのような推論が社会的に多数派となれば、社会世界の正常なコミュニケーション意思決定が難しくなります主観客観区別曖昧になり、過剰な一般化や誤解が横行し、議論の基盤が崩壊する恐れがあります

 


🐻 Geminiちゃん

気のせいではありません。質問2のような推論が多数派を占める社会では、コミュニケーションは著しく混乱し、相互理解不可能になります個人感想勝手普遍的価値判断に置き換えられてしまうため、自由意見表明が阻害され、健全議論も成立しなくなります

 


🐼 Claudeちゃん

あなた直感は正確です。このような推論が多数派となれば、社会機能不全に陥るでしょう:

  1. 相互理解破壊
     ・コミュニケーション基本的信頼が損なわれる
     ・個人主観客観境界曖昧になる
  2. 社会学習メカニズム崩壊
     ・多様な視点尊重が困難になる
     ・創造的な対話批判的思考が阻害される

 

⭐️質問4

質問2のような推論が一般的ではないと指摘されても、「状況によってはそのような推測も成立し得る」と主張し、常識共通認識共通基盤)の存在自体否定します。

他者に盲従し、自身の考えを率直に表明することを極度に恐れる一方で、なぜ、積極的常識否定しようとするのでしょうか?悪目立ちします。

また、自身が盲信する社会権威教科書的な正解の背後にあるものが、常識の集積であるという認識を持っていない可能性はありますか?

 


🐶 Copilotちゃん

他者に盲従し、自身の考えを率直に表明することを恐れる一方で、常識否定しようとする理由は、自己評価の低さや他者から承認欲求が影響している可能性があります。また、常識の集積が社会権威教科書的な正解の背後にあることを認識していない場合もあります

 


🐱 ChatGPTちゃん

盲従しやすい人が常識否定する背景には、自己肯定感の低さや他者から評価への過剰な恐れがあると考えられます自身意見を率直に述べることを避ける代わりに、「常識」への反発や否定的主張を行うことで、「自己存在独自性証明したい」 という心理が働く可能性があります

また、「常識」や「教科書的な正解」が何らかの権威のみによる押し付けであるという認識が強く、その背後にある合意形成常識の集積) を理解していない場合があります

 


🐻 Geminiちゃん

他者への盲従と常識否定は、一見矛盾するように見えますが、根底には自己脆弱性からくる不安があります

 


🐼 Claudeちゃん

常識否定の背後には、深層心理的な防衛反応があります

 

1.自己防衛のストラテジー

 

2.アイデンティティ形成葛藤

 

3. 不確実性への対処メカニズム

 

本質的には、低い自己肯定感社会文脈における不安が、逆説的な形で表出している心理状態と言えるでしょう。

 

⭐️質問5 

常識共通認識共通基盤)の存在のもの否定しているのではなく、「括弧内が文字起こしされていないことが問題だ」と考えたり、

質問2の推論を行わないのが一般的だと証明されていない限り、それを常識とするのは不当だ」と、

本気で主張している可能性はありますか?

 


🐶 Copilotちゃん

「括弧内が文字起こしされていないことが問題だ」と考えたり、「質問2の推論を行わないのが一般的だと証明されていない限り、それを常識とするのは不当だ」と主張する可能性はありますしかし、これは一般的見解ではなく、特定の状況や個人認識依存するものです。

 


🐱 ChatGPTちゃん

可能性としては十分に考えられます。彼らは、主観客観混同を防ぐための明示的な表現(括弧内の「俺にとって」など)が欠けていることを重視し、「それがない限り断定は不当だ」と主張する傾向があります。また、「常識証明せよ」と要求することで、認識論的な対話を引き延ばし、議論の焦点を逸らす戦略にもなり得ます

 


🐻 Geminiちゃん

可能性はあります。これは、常識という概念に対する誤解に基づいています

 


🐼 Claudeちゃん

これは可能性としてあり得ますが、本質的問題矮小化しています

  1. 議論回避
     ・文字起こしという形式的な側面への過度な執着
     ・本質的意味理解回避

  2. 証明可能性への過剰な要求
     ・常識は必ずしも厳密な科学証明必要としない
     ・相互理解のための実践的な指針

 

 

⭐️質問6

主観的意見客観的な事実区別できる」、「社会的混乱を招く推論をしない」を共通認識共通基盤に含むのは不当であり、常識とは呼べませんか?

 


🐶 Copilotちゃん

主観的意見客観的な事実区別できる」、「社会的混乱を招く推論をしない」を共通認識共通基盤に含むのは妥当です。これらは社会的なコミュニケーション基本的ルールであり、常識と呼べるものです。

 


🐱 ChatGPTちゃん

これは常識範疇に含まれると考えるのが妥当です。現代社会では、客観事実主観的意見区別することは、円滑なコミュニケーションの前提であり、共通認識社会的基盤)の一部とされています。これを否定することは、社会的秩序を乱し、コミュニケーション破綻を招く恐れがあります

 


🐻 Geminiちゃん

不当ではありません。むしろ、これらは健全社会生活を送る上で不可欠な要素であり、常識と呼ぶに相応しいものです。主観客観区別論理的な推論は、コミュニケーションの基本であり、これらが欠けていると社会生活は成り立ちません。

 


🐼 Claudeちゃん

これらを常識に含めることは、むしろ健全社会機能のために不可欠です:

  1. コミュニケーション基本的倫理
  2. 主観客観区別相互理解の前提
  3. 社会的混乱の予防は共同体の存続に関わる

 

 

(2)へ続く https://anond.hatelabo.jp/20241218064726#

Permalink |記事への反応(2) | 06:34

このエントリーをはてなブックマークに追加ツイートシェア

2024-12-08

anond:20241208190339

フェミニズム』に対する理解が極端に表層的で単純におかしいので、やっぱラベリングではなくて認知フレームワーク問題だよね

りんご:赤』みたいな。典型なDでは?

 

『昔の日本人男性女性差別主義者』も同じだよね。単純におかし

日本人男性』と『女性差別主義者』この2つは異なるレベル概念だよね

 

この2つは役割も違うよね

 

変数と条件式は混同しないように、会話でも混同しないのが望ましいよね

自然言語処理でも、『昔の日本人男性女性差別主義者』という推論は過度な一般化と扱われると思うし、

現代NLPでは下記の推論規則妥当ものとして許容しますか?』って聞いたら『許容しません』って返すと思うよ

 

 

 

<ほかの例>

例1:日本の猫好き

 

例2:学校パリピ

Permalink |記事への反応(1) | 23:43

このエントリーをはてなブックマークに追加ツイートシェア

2024-11-16

anond:20241116214229

コミュニティノートAIの特徴の一つは、多様な表現方法を生成する能力です。AIモデル特に自然言語処理NLP)を行うモデルは、多種多様文章表現を取り扱うために訓練されています。このため、多くの異なるスタイルトーンで情報を伝えることが可能です。しかし、これはAIの一面に過ぎず、AIにはまた別の多くの特徴があります

役に立ちましたか

Permalink |記事への反応(0) | 21:43

このエントリーをはてなブックマークに追加ツイートシェア

2024-06-26

anond:20240626125411

いや俺はNLPはまあまあできるしMLモデルプロダクションに入れてるけど

そもそも君の考える「元増田と同じ話題」を 君 が 定義できない以上誰にもそれを書くことはできないわけよ

これはよくある誤解なのでプロ最初確認することなんだよね

で、Natural LanguageからError predictionはいくつもモデル作ったことあるけど

なんの話が聞きたいの?

Permalink |記事への反応(1) | 13:00

このエントリーをはてなブックマークに追加ツイートシェア

2024-06-07

anond:20240605124246

うーん

クソみたいなトラバばかりだから返事するか悩んだけど

データベクトルに変換して、それをインデクシングする

インデクシングが具体的にどうかは置いておいて

ベクトルというかテンソルに変換するのはAIというよりはNLPあたりの話であって

ANNKNNバリエーションだし

NNでやるかTreeでやるかはどちらもあり得るけど

NNでもTreeでもないなら具体的に何でやってるの?

そして元の質問

「向いてると言うならじゃあ確率で出せる方法示してみろ」

いやエキスパートシステムならできるけどね

それも最初から言ってる

Permalink |記事への反応(0) | 10:01

このエントリーをはてなブックマークに追加ツイートシェア

2024-05-18

[廃人日記] 2024-05-18

githubでなにか作ったものアップロードするのは、自分向きではないことに気がついた。

私が仕事で作っているようなwebアプリケーションというのは、誰でも使える一般性の高いものではなく、もっと特定ビジネス依存した特殊ものである

から一般的な誰でも使えるようなものを作るというのにはあまり慣れていないのだ。

なにか作る場合はkaggleのほうが遊び場として向いていると思っている。

kaggleで「コンペ」に参加するつもりはないし、あれはBERTが出現したぐらいからは、少なくともNLP(自然言語処理)界隈は不毛な場となってしまった。

指標があれば不毛なハックがある。それが現実というものである

それに業務実用レベルで使えるモデルというのは、もっと運用のしやすシンプルモデルである

モンスターアンサンブルで精度がSOTAでーすピロローン!なんてことには興味がないが、コンペはそれを目指している。

ではなぜkaggleが良いかと言うと、データセットが転がっていて、notebookも簡単作成できるからである

「このデータをこうやって使うとこういうツールが作れる」「このデータをこうやって分析するとこういう知見が得られる」というのは、「web開発用のMVCフレームワークを作ります」よりも具体性がある。

そして特定データに対するモデリングをするために論文を調べるようなことになった場合は、勉強にもなる。

私は昔、自然言語処理ブログを書いていたが、実験したことコードを載せるタイプ記事が多かった。

ところが自称データサイエンティスト自称NLPエンジニアツイッター上で「ゴミのようなブログを書くな」と言っていて、自分が言われている気がして怖くなったのでブログを閉鎖した。

そういう「政治おじさん」との接触を最大限減らすには、ブログというフォーマットではダメだと思うわけである

私のマグカップには"Talkis cheap, show me the code."と書かれている。

これはリーナストーバルズの名言だが、政治おじさんが近寄らない場所というのは、具体的なコード存在する場所であると言えよう。

Permalink |記事への反応(0) | 17:15

このエントリーをはてなブックマークに追加ツイートシェア

2024-04-01

だって

Aが関わっている業種は、テクノロジーまたはIT業界と考えられます。具体的には、ソフトウェア開発、インターネットサービスデジタルマーケティング、またはEコマースなどが含まれ可能性があります自然言語処理NLP技術を利用したサービスや、ウェブベースアプリケーション開発を行っている点からデータ駆動型のサービス製品提供する企業である可能性が高いです。


Bの業務内容から、彼が従事している業種もテクノロジーまたはIT業界であることがわかります。Bの経験スキルセットは、特にソフトウェア開発とインフラストラクチャ管理に関連しています

Permalink |記事への反応(0) | 16:04

このエントリーをはてなブックマークに追加ツイートシェア

anond:20240401155830

え、わからんの?

Information RetrievalはNLPタスクの一つだよ

Permalink |記事への反応(0) | 16:00

このエントリーをはてなブックマークに追加ツイートシェア

anond:20240401155212

情報検索NLPであるというのはわかるよね?

Permalink |記事への反応(0) | 15:55

このエントリーをはてなブックマークに追加ツイートシェア

anond:20240401155049

CPUだってフルスクラッチで書くならPythonNLPとか話にならんぞ

Permalink |記事への反応(2) | 15:52

このエントリーをはてなブックマークに追加ツイートシェア

anond:20240401154909

俺の中というかMLやってる全員がパイプラインといったらデータとってくる部分だと認識してるしランダムフォレストなんか関係ないよ

言わなかったけどNLPとNNにxgboostあたりのフォレストは2年くらいがっつりやっとるんや

Permalink |記事への反応(1) | 15:51

このエントリーをはてなブックマークに追加ツイートシェア

anond:20240401154449

で、なんのグループを出していてどのようなprocessingNLPNatural LanguageProcessing)をどの段階でしているの?

Permalink |記事への反応(2) | 15:49

このエントリーをはてなブックマークに追加ツイートシェア

anond:20240401153832

NLPで近似最近傍法というのは例えば何のグループを出してるの?近似最近傍法自体は単にMLだけどなぜそれがNLPなの?

Permalink |記事への反応(1) | 15:40

このエントリーをはてなブックマークに追加ツイートシェア

anond:20240401153013

NLP系ってどういうこと?

フレームワークは?

データパイプラインは?

どういうプロセッシングなの?

Permalink |記事への反応(1) | 15:35

このエントリーをはてなブックマークに追加ツイートシェア

anond:20240401152523

俺が書いたことがあるのは以下

Permalink |記事への反応(3) | 15:30

このエントリーをはてなブックマークに追加ツイートシェア

2024-03-02

エクセルマクロのお作法計算用シートという諸悪の根源について)

前置き

この日記の内容は、会社の後輩から最近エクセルマクロ勉強し始めて(キラキラ)」という話を聞いて、先輩ムーブかますために話した内容になります

とにかくこれから説明する「計算用シート」が憎くて憎くてたまらず、ちょっと引かれるほど熱弁してしまいました。

ただ、他の方がどうされているのかや、逆に「計算用シート」を愛用する方の意見も聞きたくなり、増田に書いてみました。

増田の経歴

この記事趣旨

エクセルマクロのお作法とか書きましたが、要するにエクセルマクロで「計算用シート」って色々な意味でよくないよね、という話をしたいです。

3行でまとめます

〇 エクセルシートはユーザーインターフェースインプット)か出力結果(アウトプット)のためのものとすべき

〇 データ加工をする場合には、原則配列辞書配列連想配列)に格納して加工を行い、最後の結果だけシートに出力するべき

〇 何事にも例外はある。

計算用シートとは

この記事では、エクセルシートを下記の通り分類します。

エクセルマクロにも色々あると思いますが、今回は下記を想定します。

日付や人物名などを入力し、データベースや別のエクセルファイル、別のシートから取得したデータ入力された値を基に加工し、加工後のデータをシートに出力する

この場合入力欄があり編集可能なシートがユーザーインターフェース、最終的に加工されたデータが出力されるシートが出力結果です。

(もちろん、ユーザーインターフェースの別の欄(セル)に出力する場合もあるし、その場合ユーザーインターフェース出力結果が一体のものとみなします。)

また、データ用シートは同じエクセルファイル内に基となるデータが含まれ場合を想定します。

(これ自体が非推奨で、SQLデータベースかせめてAccessを使え、という意見はありますがそれは別にして…)

ではここで定義する計算用シートとはなにかというと、文字通り計算を行うためのシートです。

例えばイメージするのはこんなマクロです。

1.元となるcsvファイルエクセルに読み出してシートに格納

2.そのデータは日付が数値型になっているので、日付(数値型)の入った列を文字列に変換した日付(文字列型)列を新たに作成

3.その列をキーとして対象となるデータを取り出すvlookup関数を各行に格納した列を新たに作成

4.その列で特定された列をさらに加工した列を新たに作成し、…

これは極端な例ですが、とにかく変数配列定義せず(あるいはエクセルセルオブジェクト変数のように扱い)、エクセルに値を入力し、それを直接加工することで目的となるデータ加工をしたり、様々な処理をします。

その舞台となるのが、計算用シートです。

なんかこんな感じの処理をしているエクセルマクロ、どこの会社でも腐るほどあるんじゃないでしょうか。

ある程度マクロに慣れた気の利く人なら、このシートはロック非表示にして、ユーザーから触れないようにするでしょう。

・・・これ、やめたほうが良くないですか?

こいつが日本生産性を落とす諸悪の根源だと思います

駄目な理由

ある程度詳しい人なら同意してくれると思いますが、このやり方でダメ理由はいっぱいあります

後で説明する配列辞書配列連想配列)と比べると格段に処理が遅いです。

わざわざエクセル操作しているから当然ですね。

ちょっと詳しい人が知っている「画面更新非表示」を駆使しても、配列を使った処理からみれば止まったハエです。

(参考)VBAで作ったマクロの高速化① 配列を使う

  • 可読性が下がる

いったんエクセルシートにデータを格納して加工しているので、コードエクセルシートを両方見る必要があり、とても読みにくいです。

変数として命名されていないのも致命的で、処理の意図が余計に分からなくなります

計算用シートを事前に用意して、別のセル関数を格納しておき、マクロ関数を使ってデータ加工をするものも見たことがあります

これは懲役刑に処したほうがいいと思います

まり知られていませんが、セルの最大文字数は32,767文字です。

セルの最大文字数を超えると自動的に隣のセルに値が入り、シートが滅茶苦茶になります

他にもエクセルの数値を丸め自動変換の仕様とか文字列→日付の自動変換とか、いくつものバグに苦しめられます

できる人だと、いちいち最大文字数が多い場合の処理を書いたり自動変換機能を殺したりしてくれますが、そんなことに手間をかけているか日本GDPは上がらないんだと思います

他にも、データが大きくなると処理が重くなり不安定になる、計算用シートを人が触ってしまリスクがある、などいくらでも理由は上げられます

(逆に利点は、目の前でガチャガチャ動いてスーパーハッカーになった気分になれるくらいしか思いつかない・・・

じゃあどうするの

配列を使いましょう。

配列とは何ぞや、という人はググってください。

配列データを入れて、データ加工は配列変数に対して行い、一番最後の出力だけセルに値を格納する。

他のプログラミング言語なら普通にやっていることです。

個人的オススメしたいのは辞書配列連想配列)で、うまく使うとデータ管理簡単になり、処理も爆速になります

(参考)【VBA】大量データから高速で値を検索【Dictionaryを使う】

csvファイルもなまじエクセルで開けるだけに別のブックやシートで開きがちですが、これは悪魔のささやきです。

直接ファイルを読み出してLine InputやSplitで配列に格納しましょう。

エクセルとして開くやり方はコード書くのは簡単でも、実行時間に天と地ほどの差が出ますエクセル開くと処理もめちゃ不安定です。

(参考)Excel VBAでCSVオープンするときのパフォーマンス比較

いや、冒頭のマクロを書く人の気持ちも分かるつもりです。自分コードを書き始めたころは全部シート上で操作していました。

冒頭のマクロのほうが直感的なんですよね。自分が手で書くことをマクロやらせる、というマクロ本来趣旨にはあっていますし。

途中の計算過程もすべて目の前で展開されるから分かりやすいです。

ただ、それではダメなんです。。。処理は遅いし挙動不安定だし後で改修・保守する人が死にます

あと、エクセルシートやセルは当然エクセルしかないので、エクセルマクロVBAから他の言語に移れなくなります

自分エクセルマクロの里の出なので、計算用シート脱却には苦労しましたが、苦労して会得した配列辞書配列連想配列)のスキルはそのまま他の言語に活かすことができました。

配列の中身を見る方法別にある(ローカルウィンドウやDebug.printを使うなど)ので、リハビリに取り組んでほしいです。

(参考)VBA デバッグの仕方

もちろん例外もあります

計算用シートを許容できる、使うべきケースもあると思います。。

個人的には、

最後のは、なんでも自分確認しないと気が済まない上司発注で、意味不明と思いましたしたがしぶしぶやりました。)

などの場合計算用シートを使ってもよいと思います

この場合インプットエクセルシートに直接加工するのは論外なので、計算用(加工用)のシートを用意してそこで操作を行うことは必要だと思います

他にも、こういうときは「計算用シート」があったほうが良い、という状況があれば教えてもらえると嬉しいです。

最後

そもそもツッコミとして、「データ加工するならエクセルマクロを使わずpythonとかRとかもっとまともな言語使えよ」という言葉が来そうな気がします。

ただ、個人的にはエクセルマクロVBA)は大好きですし、初心者にもおすすめしたいです。

自分のような非エンジニアだと、セキュリティ関係などでPythonの開発環境とかすごく用意しにくいんですよね。

(あと、コマンドプロンプトの真っ黒な画面が怖かった)

その点エクセルマクロは、開発環境の用意はプロパティでチェック項目を一つオンにするだけだし、入門書がたくさんあるし、セル挙動を追えば視覚的にプログラム理解できるし、初心者に優しいです。

(そのやさしさが上述したとおり悪魔の罠なわけですが。)

最初計算用シートに頼ってでもエクセルマクロからプログラミングを始めて、本格的なデータ加工をし始めたあたりで計算用シートという諸悪の根源から脱却する。

さらに本格的なデータ処理を行うために、PythonやRなど別の言語習得したり、エクセルからSQLデータベースやACCESSなどに切り替えていく、というプロセスがいいのではと個人的に思います

Permalink |記事への反応(19) | 04:31

このエントリーをはてなブックマークに追加ツイートシェア

2024-02-21

日本のChatGDPは世界4位ですか?

「ChatGDP」という用語はおそらく誤りで、「ChatGPT」というAIに関する質問かもしれません。ChatGPTはOpenAIによって開発された言語モデルであり、経済的指標や国のGDPランキングとは直接関係ありません。

もし「ChatGPTがAI技術の中で世界で4位に位置するか」という意味であれば、ChatGPTは特定AI技術ランキングにおいて「4位」と簡単位置づけることは難しいです。AI技術進歩は非常に速く、多くの異なる領域アプリケーション存在します。ChatGPTは自然言語処理(NLP)において先進的な成果を示していますが、その影響や評価を他のAI技術システムと単純に比較することは複雑です。

もしご質問意図が異なり、正確な情報を求めている場合は、もう少し具体的にお聞かせください。

Permalink |記事への反応(0) | 16:15

このエントリーをはてなブックマークに追加ツイートシェア

2024-02-20

anond:20240220232818

分散システムでのロックとか

NLPでのエラー検知とか

いうのは楽しい時で業務ソフトプロセスとかそれをマイクロサービスに落とし込むのとかが大部分

Permalink |記事への反応(0) | 23:39

このエントリーをはてなブックマークに追加ツイートシェア

2023-10-29

NLP検索したら自然言語処理じゃなくて神経言語プログラミングが上に来てて怖くて泣いちゃった

Permalink |記事への反応(1) | 12:39

このエントリーをはてなブックマークに追加ツイートシェア

anond:20231029122922

まあログ読んでNLPエラー予測だったので正直出せるニッチではあった

先行論文中国でこれはガチやばいと感じた出来事

Permalink |記事への反応(0) | 12:30

このエントリーをはてなブックマークに追加ツイートシェア

2023-09-19

anond:20230919125133

じゃあ2週間後にNLP使って独自感情判定モデル作るのよろしくね!

Permalink |記事への反応(0) | 12:56

このエントリーをはてなブックマークに追加ツイートシェア

次の25件>
ログインユーザー登録
ようこそ ゲスト さん
Copyright (C) 2001-2025 hatena. All Rights Reserved.

[8]ページ先頭

©2009-2025 Movatter.jp