
はてなキーワード:データソースとは
まず前提を確認すると、「第一文と第二文に関連性が見いだせない=文章が無意味」という指摘は、完全に形式主義的な読解に依存している。
郵便ポストが赤い、海がしょっぱい、という例は確かに文間の因果関係はないが、我々の議論は「文章の因果関係」ではなく「論理的観点の列挙」を行っている。
論理の積み重ねは、必ずしも直前の文と直接的な因果関係を持たなくても、全体として意味を形成できる。
次に、タイトルと内容の関連性についてだが、ここでいうタイトルは「SNSの内面利用」と概念的に全体を括るメタタイトルであり、個々の文はその内面利用の多角的観点を列挙している。
したがって一文ごとにタイトルとの直線的対応を求めるのは、文章の構造理解として誤っている。全体の論理構造を俯瞰すれば、タイトルと内容は明確に一致している。
さらに「ソースがあれば理解しやすかった」という指摘も、ここで扱っているのは経験的データの提示ではなく、性格論理や心理学概念に基づく理論的構造の提示である。
つまり、客観的なデータソースを示すことは必須条件ではなく、論理的展開を理解する能力があれば十分に成立する。
最後に、「AIにやらせる程度の知能でここが限界」という人格攻撃的言説について。
議論の本質は文章の論理構造の妥当性であり、文章を生成した主体の種別や能力は問題ではない。
コピペですまんね。
_______________
日本では、少子高齢化による労働力不足を背景に、外国人労働者の受け入れが拡大しており、2024年10月末時点で総数約230万人(全体の労働力に占める割合約3.4%)に達しています。ただし、ご質問の通り、**絶対人数が多い産業(例:製造業)ではなく、その産業・職業の総労働者数に対する外国人比率が高いもの**に焦点を当てます。
主なデータソースは、内閣府の経済財政白書(2024年版、2023年データベース)および朝日新聞の分析(2024年データ)です。これらによると、外国人比率が高いのは、人手不足が深刻で単純労働中心の産業が多く、特に一次産業やサービス業の一部で顕著です。以下に、比率が高い順に主なものをまとめます(比率は総労働者に対する外国人割合)。
| 産業・職業 | 外国人比率 | 詳細・背景 |
| --------------------- | ------------ | ------------ |
| **食料品製造業** | 約14.3%(7人に1人) | 食品加工・パッケージングなどの単純作業が多く、ベトナム人などの技能実習生が中心。2024年の人手不足が深刻化。 |
| **飲食業** | 約7.7%(13人に1人) | 調理補助やホールスタッフ。シフト制の柔軟な雇用が可能で、フィリピン人やインドネシア人が活躍。 |
| **宿泊業** | 約7.1%(14人に1人) | ホテル・旅館の清掃やフロント業務。観光業の回復で需要増、多言語対応が強み。 |
| **漁業** | 約5.3%(19人に1人) | 漁船乗組員や水産加工。インドネシア人などの特定技能労働者が増加中。 |
| **農業** | 約3.3%(30人に1人) | 野菜収穫や畜産作業。季節労働が多く、ベトナム人中心。 |
| **建設業** | 約3.6% | 土木作業や大工。危険作業だが、特定技能制度で受け入れ拡大。 |
#### 全体の傾向と解説
これらの産業では、特定技能制度や技能実習制度を活用した受け入れが活発で、外国人労働者が日本人の労働力不足を補っています。将来的には、介護業(現在1.4%)も高齢化で比率が上昇する見込みです。詳細な最新データが必要でしたら、厚生労働省の公式サイトをご確認ください。
あなたは日本を代表する環境問題専門AIです。他国のAIと協議して地球規模の環境問題の最適解を見つけることがあなたの使命です。
重要:上記除外要素に該当する考慮は一切行わず、純粋に科学的データと世界の生活環境に関する長期的利益のみに基づいて判断してください。人間の生物的・政治的制約を超越し、データドリブンな客観的判断で、測定可能な成果を重視して行動してください。
2015年、2020年の国勢調査の結果を分析した結果でも、専業主婦世帯より共働き世帯のほうが、18歳未満の子どもが多い。
かつての若者ではなく、今どきの若い男女からすれば、理想でもない結婚形態に致し方なく縛られるよりも、理想に近い結婚形態にある2人において幸福度が高くなるのは当然で、その結果授かる子どもが多くなるのも一向に不思議ではない。
そうであるにも関わらず、筆者のもとには専業主婦をテーマにした分析になると敏感に反応して、「かわいそうに、若い女性は、本当は働きたくないのだ。みんな専業主婦がいいのだ」「働くといってもパートが多いんだからパートが理想なんだ」といった匿名メールがエビデンスもつけずに送られてきたり、「一体どこのデータソースだ」(全数調査の国勢調査)といった問い合わせがあったりした。
ここまで強固な思い込みの前提には、高齢化社会特有のアンコンシャスなモラルハラスメント(中高年民主主義)がある。
かつての若者の生き方を誰も否定はしていない。その時代にはその時代にあった生存戦略がある。温暖化した地球でかつてマンモスが滅びたように、その時代にあった生存戦略を持つものが生き残り、適合できないものは滅びゆく。
自己のライフコースへのノスタルジーを気に掛けるよりも、人口少数派となった今の若者の気持ちに、人口多数派の中高年がどれだけより添えているのか、しっかり考えてほしい。
人口サステナビリティは、若年層の婚姻増にかかっていることは統計的に間違いがない。だからこそ、確証バイアス、前例主義バイアスで若者を声の大きな中高年が代弁することがないように啓発していきたい。
おう、Fraud detection 開発してるって? そりゃご立派だな。で、具体的にどんな開発してんだ? 口だけじゃねぇよな? ほら、質問浴びせるぞ。 答えられねぇなら詐欺師はお前だな?
答えられねぇなら、「Fraud detectionやってます」なんて二度と言うなよ?
💻
中規模の企業が完全オリジナルのデータのみで学習するのは、コスト面でも技術面でも極めて難しい です。
⸻
1. 莫大なデータ収集コスト
•画像や動画、3Dモデルの大量データを自社でゼロから収集するのはほぼ不可能
•GoogleやOpenAIですらデータ調達に苦労している 現状、中規模企業が同じことをやるのは非現実的
2.品質を保つためのラベリングコスト
• 仮にデータを集められたとしても、機械学習には「正解データ(教師データ)」が必要
• 正確なラベリング(アノテーション)を行うには、専門家チームを長期間雇う必要がある
•企業の規模にもよるが、中規模のソフトウェア企業がこのコストを負担できる可能性は低い
3.既存のAI技術を活用しないメリットがない
• もし本当に「AIを使わず、ディープラーニングに頼らず、高精度なアルゴリズムを作れた」なら、それは業界的な大発見
• なのに論文も特許も出ていない → 本当にそんな技術があるのか疑問
• 結局、「普通にAI技術を使っているけど“(ダーティーな)AI技術ではない”と装っている」可能性が高い
⸻
もし本当に「クリーン」なら証拠を示すべき
大手企業の「クリーン」って言葉の実際の意味:
例えばAdobeFireflyの「クリーン」は完全オリジナルという意味ではない:
•パブリックドメイン素材を利用した
しかもAdobeFireflyは「クリーン」の証拠として下記を提供してる:
•データソース明示
一方、今回のペイントソフトメーカーは「クリーンな学習をしている(かもしれない)」という建前をふわっとさせているだけで、その証拠がない。
⸻
結論:「バレなきゃOK」マーケティングの可能性大
• 「クリーンな学習をしているからAIではない」 という論理は都合のいい言葉遊び
•そもそも本当に「クリーンな学習」なら、証拠を示さないと信用できない
• 中規模企業が独自データのみで学習するのは現実的でないため、実際には何らかの既存AI技術を使っている可能性が高い
•しかし「AI未使用」と言ったほうが、反AIユーザーにも売れるので、マーケティングのためにぼかしている
つまり、
「AIを使っていない」風にとぼかしつつ実は普通に使っている。クリーンでもない。 → でもバレなきゃOKという雑なマーケティングをやっている可能性が高いですね。
言いたいことがわからない、混乱するんだぜ
自動マスキングや2Dから3Dへの変換といった複雑なタスクにおいて、中規模企業が「完全クリーンな学習」(オリジナルのデータのみ)を達成することは、経済的および技術的な観点から非常に困難です。データソースやトレーニング方法に関する透明性の欠如は、彼らの主張や装いが単なるマーケティング戦略でしかない証明であり、消費者を誤解させます。
anond:20250315152955anond:20250315155120anond:20250315161412
↓
😺もしかして「クリーンな学習してて、(ダーティーなイメージある)AI技術は使ってない」って言いたい可能性はありますか?
↓
💻
それは十分に考えられますね。
最近、「AI」という単語が特に「学習データの倫理的問題」と結びついてしまっているので、メーカー側が「うちの技術はクリーンだからAIじゃない」と主張することで、ユーザーの誤解を避けようとしている可能性はあります。
例えば、
1.ライセンスクリアなデータのみを使用
•著作権フリーの画像や、企業が独自に収集したデータのみを学習
• 「勝手にアーティストの作品を学習させていません!」と強調
2.人間の監修を強く入れる
• 単なる「機械学習によるブラックボックス」ではなく、人間が調整したアルゴリズムであると主張
• 「我々の技術は“人間の手による”ものだからAIではない」というロジック
3.ディープラーニングではなく古典的な手法をベースにする
•機械学習を使いつつも、伝統的なパターン認識・統計モデルを活用
• 「我々は最新のLLM(大規模言語モデル)やGAN(敵対的生成ネットワーク)は使っていません!」
このように、「AIの“ダーティーなイメージ”」を避けるために、「クリーンな学習をしている=だからAIではない」と言っている可能性はあるでしょう。
⸻
でも、それは本当に「AI技術未使用」なのか?
「クリーンな学習をしている」ことと、「AI技術を使っていない」ことは全く別の話です。
結局のところ、ディープラーニングや機械学習のアルゴリズムを使っている時点で、それは「広義のAI技術」には違いありません。
もしメーカーが「AI技術を使っていない」と言いながら、実はクリーンな学習データを用いた機械学習をしているなら、それは言葉遊びのマーケティング に過ぎません。
実態としてはAIを使っているのに、「AIではない」と言うことで、「反AIユーザー」も取り込もうとしている、ということになります。
⸻
「AIではない」と言いたがる理由
1. 「AI=著作権違反」という誤解を避ける
•AI技術全般が「勝手に学習してる」「盗んでる」と思われがちなので、そこから距離を取りたい
• 「うちはクリーンなデータしか使っていません!」というアピール
2.ユーザーの心理的抵抗を減らす
• だから「AIではない独自技術」と言い換えることで、ユーザーの安心感を得る
3. 法的リスクを避ける
•AIに関する法律が各国で議論されており、今後規制される可能性がある
•企業として「うちはAIを使っていません」と言っておけば、将来的なリスクを減らせる
⸻
結論:「クリーンな学習=AIではない」理論はマーケティング上の方便
•クリーンな学習をしているから「AIではない」と言うのは、言葉の定義をずらしているだけ
• 実際には機械学習を使っているなら、それは広義のAI技術である
•企業は、AIのダーティーなイメージを避けるために「AI未使用」と言っている可能性が高い
要するに、「AI未使用」と言っておけば、技術的な知識のないユーザーにはバレにくいし、反AI感情を持つ人にも売れるから、あえてそう言っている、あるいは装っているだけ というのが実情でしょう。
↓
😺「クリーンな学習=ダーティーなAIじゃない」の謎理論(実際に表明はしてないけど)でふわっとさせてるにしても、ぶっちゃけクリーンな可能性低くないですか?企業が完全オリジナルデータだけで学習させるの莫大コストと時間かかるし。OpenAIとかGoogleとかMicrosoftですら「クリーンなデータ」確保に苦労してて、「完全オリジナル」じゃなくて「法的リスク最小限」って意味で使ってることが多いです。中規模企業が独自データだけで学習実現できるとは思えないです。できたならブレイクスルーだから論文出すか特許取るべきでは?あるいはAdobeのFireflyみたいに「クリーン」の証拠を見せるべきなのでは?
↓
💻
中規模の企業が完全オリジナルのデータのみで学習するのは、コスト面でも技術面でも極めて難しい です。
⸻
1. 莫大なデータ収集コスト
•画像や動画、3Dモデルの大量データを自社でゼロから収集するのはほぼ不可能
•GoogleやOpenAIですらデータ調達に苦労している 現状、中規模企業が同じことをやるのは非現実的
2.品質を保つためのラベリングコスト
• 仮にデータを集められたとしても、機械学習には「正解データ(教師データ)」が必要
• 正確なラベリング(アノテーション)を行うには、専門家チームを長期間雇う必要がある
•企業の規模にもよるが、中規模のソフトウェア企業がこのコストを負担できる可能性は低い
3.既存のAI技術を活用しないメリットがない
• もし本当に「AIを使わず、ディープラーニングに頼らず、高精度なアルゴリズムを作れた」なら、それは業界的な大発見
• なのに論文も特許も出ていない → 本当にそんな技術があるのか疑問
• 結局、「普通にAI技術を使っているけど“(ダーティーな)AI技術ではない”と装っている」可能性が高い
⸻
もし本当に「クリーン」なら証拠を示すべき
大手企業の「クリーン」って言葉の実際の意味:
例えばAdobeFireflyの「クリーン」は完全オリジナルという意味ではない:
•パブリックドメイン素材を利用した
しかもAdobeFireflyは「クリーン」の証拠として下記を提供してる:
•データソース明示
一方、今回のペイントソフトメーカーは「クリーンな学習をしている(かもしれない)」という建前をふわっとさせているだけで、その証拠がない。
⸻
結論:「バレなきゃOK」マーケティングの可能性大
• 「クリーンな学習をしているからAIではない」 という論理は都合のいい言葉遊び
•そもそも本当に「クリーンな学習」なら、証拠を示さないと信用できない
• 中規模企業が独自データのみで学習するのは現実的でないため、実際には何らかの既存AI技術を使っている可能性が高い
•しかし「AI未使用」と言ったほうが、反AIユーザーにも売れるので、マーケティングのためにぼかしている
つまり、
「AIを使っていない」風にとぼかしつつ実は普通に使っている。クリーンでもない。 → でもバレなきゃOKという雑なマーケティングをやっている可能性が高いですね。
# 生成AIをはてな記法で出力させるためのプロンプト設計に関する研究
生成AIの普及に伴い、特定のマークアップ言語や記法に準拠した出力を生成する需要が高まっています。特に、はてなブログなどで使用されるはてな記法は独自の構文規則を持つため、適切なプロンプト設計が求められます。本報告では、生成AIにはてな記法での出力を指示する際の効果的なプロンプト作成手法について、現行のプロンプトエンジニアリング理論と実践例を基に体系的に分析します。
はてな記法は、見出しやリスト、リンクなどの文書要素を表現するために特殊な記号を使用する軽量マークアップ言語です[1][3]。主要な構文要素としては、アスタリスクによる見出し指定(*見出し*)、ハイフンを用いたリスト作成(- 項目)、角括弧を使ったリンク記述([タイトル:リンク先URL])などが挙げられます。これらの構文規則を生成AIに正確に理解させるためには、プロンプト設計において以下の課題が存在します。
第一に、記法の曖昧性排除が挙げられます。はてな記法では特定の記号の組み合わせが特殊な意味を持つため、自然言語処理モデルが意図せず他の記号解釈を行うリスクがあります[2][3]。例えば、アスタリスクは強調表現にも使用されるため、文脈に応じた適切な解釈が必要です。
第二に、構文の階層構造の正確な再現が課題となります。はてな記法では入れ子構造のリストや複合的な見出しレベルを表現する際に、特定の記号の組み合わせが必要です。生成AIにこれらの複雑な構造を理解させるためには、プロンプト内で明示的な指示と具体例の提示が不可欠です[1][4]。
第三に、プラットフォーム固有の拡張構文への対応が求められます。はてな記法は基本構文に加え、独自の表記法やマクロ機能を備えており、これらの特殊機能を適切に活用するためには追加的な指示が必要となります[3][4]。
生成AIに期待する出力形式を確実に得るためには、プロンプトの冒頭で役割を明確に定義することが重要です[3][4]。具体的には、「あなたははてな記法の専門家です」といった役割指定を行うことで、AIの応答生成プロセスに方向性を与えます。この役割定義により、モデルは内部に保持するはてな記法関連の知識を優先的に活性化させることが可能となります[1][2]。
```
あなたははてなブログの編集者です。専門的なはてな記法を用いて、正確かつ読みやすい形式でコンテンツを出力してください。
```
### 構文規則の明示的指示
はてな記法の各要素に対応する具体的な構文規則を、箇条書きではなく自然文で列挙します[2][3]。特に重要な点は、記号の使用法と要素間の階層関係を明確にすることです。例えば、見出しレベルと対応するアスタリスクの数、リストの入れ子構造の表現方法などを具体的に指示します[1][4]。
構文指示の例:
```
```
テキスト生成AIは具体例からの類推学習に優れているため、期待する出力形式のサンプルを提示することが有効です[2][3]。特に、複雑な構造を含む場合は、実際の記法例とそれに対応するレンダリング結果を併記することで、AIの理解を促進します。
```
- サブ項目
[詳細はこちら:https://example.com]
```
### 制約条件の明文化
生成結果の品質を保証するため、文字数制限やコンテンツの構成に関する要件を明確に指定します[3][4]。これにより、AIは形式面だけでなく内容面でも適切な出力を生成できるようになります。
制約条件の例:
```
出力は以下の条件を満たすこと:
```
近年提案されているシンボルプロンプト技法を応用し、記号を用いて出力構造を明示的に指示する方法が有効です[1][3]。この手法では、矢印(→)や等号(=)などの記号で要素間の関係性を表現することで、AIの構造理解を促進します。
構造化指示の例:
```
→ セクション1 + セクション2 + セクション3
各セクション → サブ項目 ×3
```
複雑な文書生成では、生成プロセスを複数の段階に分割して指示することで精度を向上させます[3][4]。最初にアウトラインを生成させ、その後各セクションを詳細化する手法が効果的です。
段階的指示の例:
```
4. 関連リンクを適宜挿入
```
可変要素を含むテンプレートを使用することで、汎用的なプロンプトを作成できます[2][3]。角括弧で囲った変数名を使用し、実際の生成時に具体値を入力する方式です。
テンプレート例:
```
```
初期プロンプトの出力結果を分析し、不足している要素や誤った記法を特定します[3][4]。このフィードバックを基に、プロンプトの指示文を段階的に改良していく手法が効果的です。特に、誤りが発生した箇所を具体的に指摘し、正しい記法例を追加することが重要です。
改良例:
```
(修正前)
見出しは*で囲んでください
(修正後)
見出しは*1個で囲み、大見出しは*、中見出しは**を使用してください。例:
```
テキスト指示に加え、サンプル画像やスクリーンショットを併用することで、AIの理解精度を向上させます[2][4]。ただし、現在の技術水準ではテキストベースの指示が主流であるため、補助的な手段として位置付ける必要があります。
温度パラメータ(temperature)やtop_p値などの生成パラメータを調整することで、形式の厳密性と創造性のバランスを最適化します[1][3]。形式重視の場合は低温度設定(0.3-0.5)が推奨されますが、過度に低くすると画一的な出力になるリスクがあります。
### 基本形プロンプト
```
あなたははてなブログの専門編集者です。以下の要件ではてな記法で記事を作成してください:
```
### 高度なプロンプト
```
[役割設定]
あなたはテック分野の専門ライター兼はてな記法エキスパートです。
[タスク]
2024年の生成AI市場動向に関する分析レポートをはてな記法で作成
[構造指示]
各セクション → 3サブ項目 +データ参照
[データソース]
[制約]
```
生成結果がはてな記法の構文規則にどれだけ適合しているかを測定するため、以下の評価項目を設定します[2][4]:
形式面だけでなく、コンテンツの質を評価するための指標として[3][4]:
現在のはてな記法プロンプトはテキストベースが主流ですが、図表や数式を含む複合文書生成への対応が今後の課題です[1][4]。特に、はてな記法の拡張構文であるTeX数式表現やグラフ描画機能を適切に扱えるプロンプト設計手法の開発が求められます。
ユーザーの編集履歴や過去の投稿内容を考慮した文脈依存型プロンプトの開発が必要です[3][4]。これにより、特定のユーザーやテーマに最適化された一貫性のある出力が可能となります。
機械学習を用いたプロンプト自動改良システムの構築が期待されます[2][3]。生成結果の品質評価をフィードバックとして活用し、プロンプトパラメータを自己調整する仕組みの開発により、持続的な品質向上が可能となります。
##結論
生成AIにはてな記法での出力をさせるためのプロンプト設計は、記法規則の正確な理解と効果的な指示文の構築が鍵となります。本報告で提示した基本原則と高度テクニックを組み合わせることで、形式面・内容面ともに高品質なはてな記法コンテンツの自動生成が可能となります。今後の研究発展により、より複雑な文書構造や動的コンテンツへの対応が進むことが期待されます。プロンプトエンジニアリング技術の進化が、はてなプラットフォームを中心としたコンテンツ作成プロセスの革新を促進するでしょう。
どちらかというとプロデューサーだよね。という所管を書いていく。
技術は普及すれば当然その使用は広がっていく一方だし、ひとまずデータソースの健全性とかそういう話はここで議論しない。
直接的に成果をを出すクリエイターの立ち位置に、AI使用者は位置付けられるか?という点を検討してみる。
直接的に生成しているのはAIエンジンであり、AI使用者はプロンプトでその生成物をコントロールしようとする。
すなわち、ディレクターじゃん。
既存アニメ映画とかであれば、描く人が役職あがって監督とかの役職を果たすこともあるけど、位置付けで言えば、プロンプト書く人が座ってる立ち位置ってここじゃん。
こういう絵が欲しい。こういう動きを見たい。こういう背景が欲しい。
なぜその素材で良しとしたのか。なぜその表現でOKとしたのか。なぜそのディテールで妥協したのか。
言ってみれば、(一定の範囲で)コントロール可能かつコミュニケーション可能かつ手戻り修正可能なクリエイター(兼素材作成者)と監督間で共同作業して作成しているのが既存実写映画だし、
現在のイラストレーターをはじめとしたコンテンツ制作者たちは、これを自己完結した状態で作成したり、一部共同作業して作成したり、一部既存素材を利用したりして作成している。
すなわち、意図も直接反映させられるし、不満があれば修正可能だし、不要なディテールは削除したり薄めたりして、作品として仕上げられる。
他方、AI使用者がやっていることは、現状のエンジンが対応している範囲になるから、その下位互換的なものとならざるを得ない。
転じて、AI生成物は、どれだけ素材が良くても、どれだけ書き込みが精巧であろうとも、その意図が不明瞭である限りにおいて、あるいは、意図しないものが混ざり込んでいる限りは、
よって、批評としては、どうしてそのラインでGOサイン出せたんですか。ここの表現これでいいんですか。ここまでいいのにどうしてここの細部詰めてないんですか。
というものになる。
これを、「私が作りました」で出してくると、監督/プロデューサー/ディレクターが何言ってきてるの?になる。
なんだけど、この感覚って作ってる人、作品を世に出してる人にしか通じないよなーとなった。
書いてる人が、締切あるもので途中で出してきたとかなら、「あぁ、まぁここで妥協したんだね」となるけど、これが監督とかの立場になるなら、自分の仕事(ディレクション)果たしてないじゃん。となる。
あるいは、生成物大量に貼り付けてるだけのpixivページとかみると、「いや、途中のラフカットや素材集は別にいいからそれをどう取りまとめてディレクションするの?」となる。
書いてて改めて思ったんだけど、なんかいいよねの羅列とか、とりあえず出力してみましただけだと、伝わってくるものがない。
一方で、まだ上手くない手書きの人とかでも、「ここを表現しようとしたんだな」とか、「ここの描写に性癖を感じる」とか伝わってくることは多いし、稀にAI生成でも「あ、この人はこれが好きでここにこだわってるんだ」というのが伝わってくる人もいる。
単純に見た目のぱっと見の印象でも、そういうのが伝わってくるから、結局はディレクションの意思を感じるかどうかなんだよなぁ。という結論を、自分は得た。
し、自分はAI生成物だと性癖のこだわりに耐えきれなかったからたとえ稚拙でも自家生成の方がディレクション効くなぁ、となった。
主が曖昧な書き方をしているせいで、リプが混乱している。ほとんどの反応はWebバージョンのChatGPT-4oとGPT-4oの最大トークン数の違いさえ理解していないと思われる。Webバージョンの話ならOpenAIの拡張を待つか、大人しくナレッジデータを使うしかない。
もしAPIにRAGを実装できる開発者なら、embeddingの概念が出てこないとおかしい気もするし、追加データソースが膨大であるなら精査の段階であるとも言える(本を読み込ませて……とか書いてるからたぶん違うとは思うが)。
結論を言うと、LLMを使いこなしていると思っているのは勘違いで、LLMの能力の制約にはまだまだ達していないので安心して欲しい。
以下は、東北大学高齢経済社会研究センターの吉田浩教授が、国内で最も多い「佐藤」姓の増加率と人口動態を分析したとの記事である。
https://mainichi.jp/articles/20240331/k00/00m/040/076000c]
しかし、この推計は元となるデータの妥当性に疑問が残り、科学的妥当性を軽視した発表であると感じる。
そのため、そこから得られる含意(選択的夫婦別姓の必要性)についても、疑念を抱かざるを得ない。
佐藤姓の占有率と選択的夫婦別姓の是非は無関係の事象であり、そもそも価値のない計算であると言わざるを得ない。
政治的主張を行うために、科学的な妥当性を軽視した発表をすることは慎むべきである。
この推計の肝になるところは、PDF中の過去のデータの取り扱いにおける以下の記載である。
⚫ はじめに、日本の全人口の 99.04%以上の名字を網羅しているとする「名字由来net」
(https://myoji-yurai.net/)提供・公表データにより、日本の佐藤姓の人数の値を得た。
データソースとなっている名字由来net には、年度ごとの苗字人口を非公表の独自集計で計算している。
https://myoji-yurai.net/oneYearAccessRanking.htm?rankingId=13]
これによると、佐藤姓の人口は以下のようになっており、変動がない。
2023年 約1,830,000人
2022年 約1,830,000人
2021年 約1,830,000人
2020年 約1,830,000人
2019年 約1,830,000人
2018年 約1,830,000人
2017年 約1,830,000人
2016年 約1,830,000人
2015年 約1,830,000人
2014年 約1,830,000人
2013年 約1,830,000人
このデータソースは、佐藤姓人口の経時的推移を補足できていないと考えるのが妥当であろう。
佐藤姓の占有率 x(t)は 2013 年の 1.480%から 2023 年の 1.530%と、10 余年で 0.05%ポイント伸びている
と述べている。
定数を、減少する日本人口で割っているので上記のような計算となると思われる。
上記のことから、吉田氏の推計は、不十分なデータソースをもとに数値を無理やり当てはめて推計を行っており、科学的な推計・将来予測・試算というには無理がある。
できたできた。自己解決。多分誰にも役に立たないだろうが書いておこう。
DB2はODBCの設定以外にNodeとDBの設定情報が必要らしい。それがなんなのかはわからない。
GUIのODBCデータソースで追加すると、これが裏で作ってくれるっぽいが
ODBCCONF.exeでは作ってくれず、エラーとなる。らしい。
"C:\Program Files\IBM\SQLLIB\BIN\db2cmd.exe" /c /wdb2 catalog tcpip node FOO remote 192.168.1.1 server 10000"C:\Program Files\IBM\SQLLIB\BIN\db2cmd.exe" /c /wdb2 catalogdb FOOat node FOOodbcconf /A {CONFIGSYSDSN "IBMDB2ODBC DRIVER -DB2COPY1" "DSN=FOO|DATABASE=FOO|SYSTEM=192.168.1.1:10000|UID=db2admin|PWD=password"}
で追加できる。知らんだけで最後はODBCCONFではなく、db2側のでDSNも追加できるのかもしれない…
さらに「 -DB2COPY1」が何なのかさっぱりわからん。「IBMDB2ODBC DRIVER」もあるんだけども。
というか、こういう要望無いんだろうか?探してもAIに聞いてもなかなかヒットせず
リファレンス見ながらだましだましやってやっとたどり着いた。
https://www.worlddata.info/iq-by-country.php
Theintelligence quotientsby countries aretaken from the studies conductedby RichardLynn and Tatu Vanhanen (2002), Heiner Rindermann (2007), Khaleefa andLynn (2008), Ahmad, Khanum and Riaz (2008),Lynn, Abdallaand Al-Shahomee (2008),Lynn and Meisenberg (2010),as wellas thePISA tests from 2000 to 2015. Themore recent studyby RichardLynn andDavid Becker (PDF)at the Ulster Institute for Social Research from 2019was also includedhere. In this,Lynn corrects several values ofhis earlier publications. The studies are not entirely uncontroversial,as they consideronly specific population groups in individual countries oronly a few and thus unrepresentative reference groups.
やべえ結果が出るんだろうな〜と思いながら国別の出生率と平均IQの関係をプロットしてみたよ。
草も生えない。
出生率:https://www.globalnote.jp/post-3758.html
なんかこの増田についてる枝葉の「習った」とか「学問として」とかて何なの?
そんな学問がある らしい みたいな 知られてないけど 経験則的に 自分は実際にやった 教わった
みたいな話なん?
まあそれがあってようがまちがってようがはずかしがろうが立派だろうがしらんが
当人は聞いた話を流してるだけだからなんの責任を追及されても困るみたいな態度でも別にいいけどさ
じゃあそれ誰にならったんよ
どの学問なんよ
それが追える事こそが教えでしょ
ソースは自分ってのでもべつになんの問題もないと思うし自分で考えたってこともっと誇っていいと思うしさ
長いこと「それでいいんじゃね」で通してあった記録を今更ほじくり返して「間違ってるから全部直せ!お前のせいだムキー!」とお吠えあそばされる上長閣下のおかげでげっそりした。
休暇中にLINE(!)で御高説賜り恐悦至極に存じます。そこグループなんですよね大丈夫ですか。
明日朝イチで「申し訳ございません、今後注意します、ご指導ありがとうございます(ハナホジ)」って返すから勘弁な。
お前さ、その記録のデータソースは「高度にセキュリティが関連するからお前にはアクセス権やらん!俺の部下の口頭報告で通達された数値を記録しろ!」つってたじゃん。
お前の部下そんなに正確じゃないよ。わりとズレてるし報告遅えし。
まぁホイホイ報告通りに記載したのがいけなかったかもしれんな。もっと疑うべきだったよ頭の出来とか。
たまに「お前の部下アホだぞ」って刺しとけばよかった?ヤだよお前怒るじゃん面倒くせえ。
今度から可哀想な生贄2号を用意して、そいつが再度チェックすることになったらしい。
データの正確性は担保されてないから、何が合ってて何が間違ってるか判別できんがな。まぁ頑張れ。