「アセンブリ言語」を含む日記

はてなキーワード:アセンブリ言語とは

次の25件>

2025-12-09

■「AIにとって読みやすいプログラミング言語」という幻想

プログラマー諸君は見てほしいんだけど

これさ

愚かな人間の都合など完全無視、LLMのための高効率プログラミング言語「Sui」（粋）

https://forest.watch.impress.co.jp/docs/serial/yajiuma/2069573.html

別にいいんだけど、どうにもブクマカ含めて、しっくり来る批判できてないんだよな

それが気になってしょうがない

まだLLMのこと勘違いしていないか？

俺ごときが言ってもアレだから、Gemini3.0先生に頼んだよ（一時チャット、Pro 3.0思考モード）

ユーザーが提供した情報と、一般的なLLMの技術特性に基づき、プログラミング言語「Sui」についての冷静かつ客観的な評価をまとめます。
1. 「LLM用プログラミング言語」としてのメリット・感想
感想:一言で言えば、**「思想実験としては極めて面白いが、実用性とLLMの学習原理を無視した『早すぎた最適化』」**です。
作者の「人間ではなくLLMを主客にする」という視点の転換は、アーティスト的・哲学的な問題提起としては鋭いですが、現在のLLM（Transformerアーキテクチャ）の動作原理を工学的に捉えると、メリットよりもデメリットが上回る可能性が高いです。
　
メリット:
・トークン効率の改善:Python等と比較して記述が圧倒的に短くなるため、出力速度の向上と課金コストの削減（トークン節約）は確実に達成できます。
・構文エラーの激減: 括弧やインデントの複雑なルールを排除しているため、「閉じ忘れ」などの単純なSyntaxErrorは減るでしょう。
・コンテキストウィンドウの節約: 長いプログラムでもコンテキスト（メモリ）を圧迫しにくくなります。
　
デメリット:
・学習データとの不一致: LLMは「大量の人間用コード（Pythonなど）」を学習して賢くなっています。未知の言語「Sui」を書かせるには、Few-shot（プロンプトでの例示）に頼るしかありませんが、これではLLM本来の推論能力やコーディング能力（事前学習の重み）を活かせません。
・ブラックボックス化: 生成されたコードがバグっていた場合、人間が読んで直すことが不可能です。「LLMに直させる」にしても、LLM自身がSuiのロジックを深く理解していないため、無限ループ（幻覚の連鎖）に陥るリスクが高いです。
・CoT（Chain of Thought）の阻害:最近の研究では、LLMは「冗長な思考過程」を出力することで論理的整合性を保つことがわかっています。極限まで圧縮された記号列は、LLMの「考える余地」を奪い、論理破綻を招く可能性があります。

2.思想的に正しい所・正しくない所（理由込み）
忖度なしに判定します。
　
正しいと思う所（Agree）
・「高級言語はLLMにとって冗長である」:
　理由:人間にとっての「読みやすさ（可読性）」は、機械にとって単なるトークンの無駄遣いです。if x>10: よりも ? x10 の方が情報密度が高いのは事実です。
・「括弧の長距離依存問題」:
　理由: TransformerのAttentionメカニズムにとって、遠く離れた ( と ) の対応関係を維持するのは計算コストが高く、ミスの原因になりやすいです。ネストを排除する方向性は機械的処理として正しいです。
　
正しくないと思う所（Disagree）
・「可読性を排除しても良い」:
　理由:ソフトウェア開発においてコーディングは「書く」時間より「読む・直す」時間の方が長いです。AI生成コードであっても、最終責任は人間が負う現状では、人間が検証不可能なコードは「危険なバイナリ」と同義であり、プロダクトには採用できません。
・「LLMに最適化された言語を書かせるべき」:
　理由: 前述の通り、現在のLLMは「人間語の確率分布」を学習したモデルです。「LLMにとって自然な言語」とは、実は「人間にとって自然な言語（英語やPython）」そのものです。Suiは「計算機にとっては最適」ですが、「現在のLLMにとっては異言語」です。

3. 「5つの設計原則」の正当性評価
作者が掲げる設計原則についての技術的評価です。
　
1行1命令（行単位独立性）　評価: △
パース（解析）は容易になりますが、LLMは「前の行の文脈」を読んで次の行を出力するため、行を独立させすぎると文脈の連続性が失われ、複雑なアルゴリズムの構成力が落ちる可能性があります。
　
括弧は{}のみ（ネスト排除）　評価: ◯
LLMが最も苦手とする「深いネスト構造の維持」を回避する策として有効です。アセンブリ言語に近いフラットな構造は生成難易度を下げます。
　
変数は連番 (v0, v1...)　評価: ✕
これが最大の問題点です。LLMは変数名（user_id, total_price など）に含まれる「意味」を使って推論を行っています（Semantic Grounding）。すべてを記号化すると、LLMは変数の役割を見失い、論理的なバグを埋め込みやすくなります。
　
命令は1文字　評価: ◯（ただし諸刃の剣）
トークン効率は最強ですが、1文字の違いで意味が激変するため、LLMの確率的な「ゆらぎ」による1文字ミスが致命的なバグになります。冗長さはエラー訂正の役割も果たしています。
　
明示的な制御フロー（ラベルとジャンプ）　評価: △
goto 文の多用はスパゲッティコードを生みます。LLMにとっても、構造化プログラミング（if/forブロック）の方が、「ここからここまでがループ」というチャンク（塊）として認識しやすいため、一概にジャンプ命令が良いとは言えません。

＞現在のLLMは「人間語の確率分布」を学習したモデルです。「LLMにとって自然な言語」とは、実は「人間にとって自然な言語（英語やPython）」そのものです。

ここ！マジで覚えてね

LLMはこれまでの機械よりも人間に近いと思ってほしい、人が苦手なことはAIも苦手

機械は論理的でロジックに強くて〜っていうのはAIには通用しない

ついでに、「LLM用プログラミング言語」の潮流について

「LLMのための言語」という文脈は、大きく2つのトレンドに分かれます。Suiは後者に属しますが、主流は前者です。
１．LLMを「制御するため」の言語（主流）
　・DSPy, Guidance,Microsoft Guidance:
　　・プロンプトエンジニアリングを構造化し、LLMの出力を型（JSONなど）に強制したり、思考プロセスを制御するためのフレームワーク。
　・SGLang:
　　・LLMの推論を高速化・並列化するための言語。
　・これらは「人間がLLMを操るための言語」であり、実用化が進んでいます。
　
２．LLMに「書かせるため」の言語（Suiのカテゴリ）
　・現状:ほとんど実験段階です。
　・Gorilla LLMなどの試み:API呼び出しに特化したファインチューニングなどがありますが、独自の「新言語」を作らせるよりも、既存のPython やJSON を正しく出力させる方向（Constrained Decoding）が業界の標準解です。
　・擬似コード:論文レベルでは、Pythonの代わりに中間的な擬似コードを出力させ、それをコンパイラで処理する手法も研究されていますが、Suiほど極端な記号化は稀です。

後者については

目標設定のピントが少しずれています。
現状の最適解:現在のLLMを使う限り、「LLM用言語」の最適解はPython です。なぜなら、世界中のGitHubのコードを学習しており、LLMが「最も流暢に話せる言葉」だからです。無理にSuiを話させるのは、日本人にエスペラント語で詩を書かせるようなもので、パフォーマンスは落ちます。

最後に総評

総評: Suiは、「既存のLLM（GPT-4など）に書かせる言語」としては失敗する可能性が高いですが、「未来のAI ネイティブなコード生成のあり方」を示唆するアート作品としては高く評価できます。作者の「愚かな人間に合わせるな」というパンクな精神は、エンジニアリングの枠を超えた鋭い批評性を持っています。

アート作品だそうです

お前らは安易にオレオレ言語作るんじゃないぞ、作るにしてもAIに聞きなよ？

聞く時は忖度させるんじゃないぞ？

この作者もAIに乗せられたのかもしれんし

＿＿＿＿＿＿

プロンプト

以下が「LLM用プログラミング言語」としてメリットがありそうか、感想を教えて下さい。
https://forest.watch.impress.co.jp/docs/serial/yajiuma/2069573.html
https://github.com/TakatoHonda/sui-lang
　
・忖度、配慮はせず冷静にお願いします
・思想的に正しいと思う所、正しくないと思う所を理由込みでまとめてください
・「5つの設計原則」の考え方は正しい？
・最近のLLM用プログラミング言語についてもまとめてください
・そもそもLLM用プログラミング言語という目標自体の評価をしてください
　
なお、以下はSNSでの作者の投稿です
（省略）

Permalink |記事への反応(0) | 14:27

ツイートシェア

2025-11-18

■anond:20251118195706

エアプだろお前？

今はコンパイラが進化してるからCでもC++でも普通に書いたほうがアセンブリ言語を直に書くよりもよっぽど高速なんだよ

Permalink |記事への反応(0) | 20:00

ツイートシェア

2025-11-06

■勉強になった

生成AIにソフトウェア開発を支援してもらう場合、ソースコードの作成を依頼する形式が多いと思いますが、実行ファイルを直接出力してもらうことも技術的には可能なのでしょうか？

生成AIによる実行ファイルの直接出力は、技術的には極めて困難です。現在のLLM（大規模言語モデル）ベースの生成AIは、ソースコードの生成には向いていますが、実行可能なバイナリファイルを直接出力することには根本的な制約があります。

技術的な制約
LLMはテキストベースのトークン処理を基本とする設計であり、バイナリデータを直接扱うことができません。実行ファイルは0と1の連続したバイナリコードですが、LLMはこの形式でデータを生成するようには訓練されていないため、バイナリファイルを直接出力することは現在のアーキテクチャでは実現が困難です。
従来のソフトウェア開発では、ソースコード→コンパイル→アセンブル→リンクという複数段階のプロセスを経て実行ファイルが生成されます。各段階で最適化や機械語への変換が行われるため、この過程を完全に省略してAIが直接バイナリを生成することは技術的に非常に複雑です。

理論的な可能性
研究レベルでは、バイナリデータを扱う試みも存在します。例えば、LLM4Decompileのような研究プロジェクトでは、バイナリコードを逆コンパイルする際にバイナリを一度アセンブリ言語に変換してからLLMで処理しています。逆に言えば、生成時も同様の変換プロセスが必要になると考えられます。

現実的なアプローチ
実務では、生成AIにソースコードを作成してもらい、それを従来のコンパイラやビルドツールで実行ファイルに変換する方式が標準的です。この方法であれば、デバッグやテストも容易で、生成されたコードの品質を確認しながら開発を進められます。
なお、フォントファイルのようなバイナリ形式でもオープンソースとして扱われる例はありますが、これはフォントという特定用途の場合であり、汎用的な実行ファイル生成とは異なります。

画像生成もバイナリを生成しているわけで、同じようなことができるのではと思ったのですが、そこはぜんぜん違うのですね

おっしゃる通り、画像生成AIもバイナリを出力しているという点では共通していますが、実は根本的に異なる仕組みで動作しています。

アーキテクチャの違い
画像生成AIは拡散モデル（DiffusionModel）やGANなど、視覚データに最適化された専用のアーキテクチャを使用しています。一方、LLMはTransformerベースのテキスト処理に特化した構造を持っています。画像生成では、ノイズから段階的に画像を生成するプロセスを経て、最終的にピクセル値という数値データ（バイナリ）を出力します。

データ表現の性質
画像ファイルのバイナリは連続的な数値（ピクセル値）の集合であり、各ピクセルが色情報を持つという規則的な構造です。最近の研究では、画像をビットプレーン（bit-plane）として扱い、XOR 演算でノイズを加えるBinary Diffusion ProbabilisticModel（BDPM）のような手法も開発されています。
対して、実行ファイルのバイナリは機械語命令の複雑な配列であり、CPUが直接実行できる命令コード、データセクション、リンク情報などが厳密な形式で配置されています。わずかなビット誤りでもプログラムが動作しなくなるため、画像のような連続値とは性質が大きく異なります。

学習データの違い
画像生成AIは、ImageNetやLAIONなどの大量の画像データセットで訓練されており、ピクセルパターンを学習します。一方、実行ファイルを生成するには、コンパイルプロセス全体（構文解析、最適化、機械語変換、リンク）を学習する必要がありますが、これは単純なパターン学習では実現できません。
したがって、画像生成AIが成功しているのは、画像という特定のドメインに特化した設計と、規則的なデータ構造があるためであり、同じ手法を実行ファイル生成に適用することは技術的に非常に困難です。

Permalink |記事への反応(0) | 15:50

ツイートシェア

2025-10-13

■

アセンブリ言語使ってた時、C言語なんて遅くて使えねーと思っていた。

その後、C言語使い始めた時には、アセンブリ言語で消耗してるのは時間のムダだと思うようになった。

今、各種プログラミング言語から AIを使う時代になり、AIが出力するコードなど信頼できねえと思う頃から、

その後、AIを使わずにプログラミングするのは時間のムダだと思うようになるのだろう。

Permalink |記事への反応(0) | 06:45

ツイートシェア

2025-10-07

■anond:20251007210900

自動プログラミングという言葉は1960年代あたりに流行ったらしいね。中田育男さんの本で読んだことがある。そう、FORTRAN コンパイラとかが出てきた頃の話かな。「もうマシン語（アセンブリ言語）でプログラミングしなくてもいい」とか

Permalink |記事への反応(0) | 21:14

ツイートシェア

2025-06-28

■LLMはエンジニアの仕事を奪うのか？否、仕事の抽象度を「Why」の次元へ

序文：コードが蒸発する時代と、それでも残る「Why」という名の問い

2025年、私たちはソフトウェア開発の歴史的な転換点に立っている。大規模言語モデル（LLM）の進化は、GitHub Copilotのようなコード補完ツールに始まり、今や「何を作りたいか」を自然言語で伝えるだけで、アプリケーションの雛形が数分で生成される時代を現実のものとしつつある。この光景を目の当たりにした多くのプログラマが、漠然とした、しかし確かな不安を抱いているだろう。「私たちの仕事は、いずれAIに奪われるのではないか」と。

この問いに対する私の答えは、半分はYesであり、もう半分はNoだ。より正確に言えば、プログラマの仕事の本質が、歴史上かつてないレベルで抽象化され、その役割が再定義されるのだ。私たちは、コードを「書く」作業から解放される一方で、これまで以上に高度な思考を要求されることになる。

本稿では、プログラミングの歴史を「How（いかに作るか）」から「What（何を作るか）」への移行として捉え直し、LLMがこの流れをいかに加速させるかを論じる。そして、その先にある、AIには決して代替できない、人間ならではの競争優位性、すなわち「Why（なぜ作るのか）」を定義し、記述する能力の重要性について深く考察していく。これは、単なる未来予測ではない。今を生きるすべてのソフトウェアエンジニアにとっての、生存戦略の提示である。

第1章：プログラミングの歴史的変遷 ― HowからWhatへの長い道のり

LLMの登場を特異点として捉える前に、我々が立っている場所を正確に知る必要がある。ソフトウェア開発の歴史は、常に「抽象化」との戦いであった。そしてその歴史は、プログラマの関心が「How」から「What」へと徐々に移り変わっていくプロセスとして描くことができる。

1-1.手続きの時代：Howを記述することに終始した黎明期

コンピュータの黎明期、プログラミングとは、計算機が理解できる命令（How）を、一行一行、丹念に記述する作業そのものであった。アセンブリ言語や初期のFORTRAN、COBOLといった言語は、ハードウェアの制約を強く受けており、プログラマはメモリ管理やプロセッサの動作といった、極めて物理層に近いレベルでの「How」を意識する必要があった。

この時代のテストもまた、「How」に強く束縛されていた。書かれた手続きが、意図した通りに順番に実行されるか、特定の入力に対して期待された計算結果を返すか。テストの関心事は、あくまで「手続きの正しさ」の検証にあった。ビジネスロジックと実装の詳細が密結合し、コードは特定の処理手順を記述した、硬直的な塊となっていた。

1-2.テストが駆動した振る舞いへの注目：Whatへの小さな一歩

風向きが変わり始めたのは、ソフトウェアの規模が拡大し、その複雑性が人間の認知能力を超え始めた頃だ。1990年代後半から 2000年代にかけて提唱されたエクストリーム・プログラミング（XP）の中で、テスト駆動開発（TDD）という考え方が登場する。

TDDの本質は、単なるテスト手法の改善ではない。それは、プログラミングのパラダイムを根底から覆す思想だった。TDDは、「まずテストを書く」ことを強制することで、プログラマの意識を「これから実装するコード（How）」から「そのコードが満たすべき振る舞い（What）」へと強制的に転換させたのだ。

テストはもはや、書かれたコードの後追いで正しさを検証する作業ではない。それは、これから作られるべきソフトウェアの「仕様書」であり、「振る舞いの宣言」となった。例えば、「ユーザーがログインボタンをクリックしたら、ダッシュボード画面に遷移する」というテストコードは、具体的な実装方法（`onClick`イベントハンドラの中で`window.location.href`を書き換える、など）には一切言及しない。それはただ、達成されるべき「What」を記述しているだけだ。

この思想は、ビヘイビア駆動開発（BDD）へと発展し、`Given-When-Then`といった、より自然言語に近い形式でソフトウェアの振る舞いを記述するスタイルを生み出した。プログラマだけでなく、プロダクトマネージャーやビジネスアナリストといった非技術者をも巻き込み、「What」を共通言語として定義する試みが本格化したのである。

1-3.宣言的プログラミングの台頭とフレームワークの役割

TDD/BDDによってプログラマの意識が「What」に向かい始めると、コードそのものもまた、宣言的なスタイルへと進化していく。この変化を劇的に加速させたのが、モダンなフレームワークの存在だ。

Reactを例に考えてみよう。Reactが登場する前、フロントエンド開発はjQueryに代表されるように、DOMを直接操作する命令的なコード（How）の連続だった。「このボタンがクリックされたら、この要素のテキストを書き換え、あちらの要素を非表示にする」といった具合だ。

しかし、Reactは「UIとは、ある状態（state）に対する純粋な写像である」という宣言的なモデルを提示した。プログラマがやるべきことは、UIの状態（`state`）と、その状態がどのように見えるか（JSXによるコンポーネント）を宣言することだけだ。状態が変更された際に、DOMをどのように効率的に更新するかという面倒な「How」の部分は、Reactの仮想 DOMと差分検出アルゴリズムがすべて隠蔽してくれる。プログラマは「What（UIのあるべき姿）」を記述するだけでよくなったのだ。

この「WhatからHowへの変換」は、様々な領域で見られる。

GraphQL:クライアントが必要なデータの形（What）をスキーマとして宣言すれば、サーバーがどのようにデータを取得し、整形するか（How）はGraphQLエンジンが解決してくれる。
Terraform:インフラのあるべき構成（What）をHCLという言語で宣言すれば、各クラウドプロバイダーのAPIをどのように呼び出してリソースを作成・更新・削除するか（How）はTerraformが担う。
BaaS (e.g., Supabase, Firebase):データベースのテーブルスキーマ（What）を定義すれば、それに対応するRESTful APIやGraphQLAPI（How）が自動的に生成される。

これらのフレームワークやツールは、いわば「特定の制約下における、WhatからHowへの高性能な変換器」として機能してきた。プログラマは、フレームワークが課す「お作法」や「制約」を受け入れることで、退屈で間違いの多い「How」の記述から解放され、より本質的な「What」の定義に集中できるようになった。我々が「生産性が高い」と感じる開発体験は、この優れた変換器の恩恵に他ならない。

現状は、この歴史的変遷の延長線上にある。プログラマの仕事は、手続きを記述する職人から、振る舞いを定義し、それを実現するための最適な「変換器（フレームワーク）」を選択・設定するアーキテクトへと、その重心を移してきたのだ。

第2章：LLMがもたらす究極のパラダイム シフト ― 汎用変換器の誕生

フレームワークがもたらした「WhatからHowへ」の潮流は、LLMの登場によって、未曾有のスケールで加速されようとしている。フレームワークが「特定の領域に特化した変換器」であったのに対し、LLMは「あらゆる領域に対応可能な、究極の汎用変換器」としてのポテンシャルを秘めているからだ。

2-1.フレームワークの制約を超えて

前章で述べたように、ReactやTerraformといったフレームワークは、その恩恵と引き換えに、私たちに特定の「制約」を課してきた。Reactを使うならコンポーネントベースで思考し、状態管理の作法に従う必要がある。Terraformを使うなら、そのエコシステムとHCLの流儀を受け入れなければならない。これらの制約は、WhatからHowへの変換を自動化するための「レール」であり、私たちはそのレールの上を走ることで効率を得てきた。

しかし、LLMはこの前提を覆す。LLMは、特定のフレームワークや言語の知識を事前に学習しているが、その利用において絶対的な制約を課すわけではない。私たちは、より自由な形式で「What」を伝えることができる。

例えば、こうだ。

ユーザー認証機能付きのシンプルなブログアプリを作ってほしい。フロントエンドはReactとTypeScript、UI コンポーネントはMUIを使う。バックエンドはNode.jsとExpressで、データベースはPostgreSQL。ユーザーはGoogle アカウントでログインでき、新しい記事を作成、編集、削除できる。記事にはマークダウン記法が使えて、画像もアップロードできるようにしてほしい。

この要求（What）は、特定のフレームワークの流儀に則ったものではない。複数の技術スタックを横断し、機能要求を自然言語で並べただけのものである。しかし、現在のLLM、特に GPT-4oやそれに類するモデルは、このレベルの要求から、ディレクトリ構造、設定ファイル、APIエンドポイント、フロントエンドコンポーネントに至るまで、驚くほど具体的なコード（How）を生成することができる。

これは、フレームワークが担ってきた「WhatからHowへの変換」が、特定のレールから解き放たれ、より広範で柔軟な領域へと拡張されたことを意味する。これまで自動化が難しかった、あるいは特定のフレームワークが存在しなかったニッチな領域や、複数の技術を組み合わせる複雑なシステム構築においても、AIによる宣言的プログラミングの恩恵を受けられる時代が始まろうとしているのだ。

2-2. 「What」の解像度がすべてを決める世界

LLMという汎用変換器の登場により、プログラマの生産性は、「いかに質の高いWhatをLLMに伝えられるか」に直結するようになる。これは、俗に「プロンプトエンジニアリング」と呼ばれるスキルだが、その本質は、ソフトウェア開発における「要求定義」そのものである。

質の高い「What」とは何か。それは、曖昧性がなく、網羅的で、矛盾のない要求である。

曖昧性の排除: 「ユーザーがいい感じに使えるようにして」ではなく、「ユーザーは記事一覧を、作成日時の降順、または更新日時の降順でソートできる」と具体的に記述する。
網羅性: 正常系のシナリオだけでなく、異常系（例：ログイン失敗時、データベース接続エラー時）の振る舞いも定義する。エッジケースを考慮する。
矛盾のなさ: 「すべてのユーザーは記事を削除できる」という要求と、「管理者ユーザーのみが他人の記事を削除できる」という要求が両立しないことを指摘し、解決策を提示する。

これらは、優秀なソフトウェアエンジニアが、プロダクトマネージャーやデザイナーとの対話を通じて、日常的に行ってきた思考プロセスそのものではないだろうか。LLMの登場は、この思考プロセスを、より明確に、よりテキストベースで「記述」する能力を求める。私たちの頭の中にあった暗黙的な仕様が、LLMへの入力（プロンプト）という形で、明示的に言語化されることを要求するのだ。

やがて、ほとんどのプログラミング作業は、この「Whatの記述」に収束していくだろう。TDDがテストコードという形式で「What」を記述したように、私たちは自然言語や、より構造化された要求記述言語を用いて、AIに対して「What」を宣言することになる。コード（How）は、その宣言から自動生成される中間生成物に過ぎなくなる。まさに、コードが蒸発していく未来である。

第3章：それでもAIには決められない ― 「Why」の不在という致命的な欠陥

「What」を伝えれば「How」が手に入る。この魔法のような世界の到来を前に、私たちは一つの重大な問いに直面する。それは、「そのWhatからHowへの変換は、本当に一意に決まるのか？」という問いだ。

答えは、明確にNoである。

ある「What（要求）」を実現するための「How（実装）」は、無数に存在する。そして、どの「How」を選択すべきかを決定するためには、単純な機能要求（What）だけでは情報が全く足りない。そこには、必ず「Why（なぜそう作るのか）」という、背景、文脈、そしてトレードオフの考慮が必要不可欠となる。

3-1.トレードオフの海に溺れるLLM

簡単な例を考えてみよう。「1億件のユーザーデータを格納し、ユーザー IDで高速に検索できるシステム」という「What」をLLMに与えたとする。LLMは、どのような「How」を提案するだろうか。

案A:シンプルな構成を重視し、PostgreSQLのようなRDBを使い、`user_id`にB-Treeインデックスを張る。
案B: スケーラビリティを最優先し、Amazon DynamoDBやCassandraのようなNoSQL データベースを使う。
案C:検索速度を極限まで高めるために、Elasticsearchのような全文検索エンジンを併用する。
案D:コストを最優先に考え、データをオブジェクトストレージに保存し、Athenaのようなサービスで都度クエリする。

これらの選択肢は、どれも「What」を満たしている。しかし、その特性は全く異なる。案Aは多くのエンジニアにとって馴染み深く開発が容易だが、10億、100億件へのスケールは難しいかもしれない。案Bはスケール性に優れるが、厳密なトランザクション管理は苦手だ。案Cは高速だが、運用コストとシステムの複雑性が増す。案Dは安価だが、検索速度は他に劣る。

LLMは、これらの選択肢をリストアップすることはできるだろう。しかし、このプロジェクトにとって最適な選択肢はどれかを、自信を持って決定することはできない。なぜなら、その決定には、LLMが与えられていない「Why」の情報が必要だからだ。

Why -ビジネスの文脈: このシステムは、立ち上げ直後のスタートアップのMVP（Minimum Viable Product）なのか？それとも、数千万人のアクティブユーザーを抱える既存サービスの新機能なのか？前者であれば開発速度とシンプルさが優先される（案A）だろうし、後者であればスケーラビリティが死活問題になる（案B or C）。
Why -品質特性の優先順位: このシステムにとって最も重要な品質は何か？パフォーマンスか？可用性か？保守性か？それともセキュリティか？金融システムであれば一貫性と堅牢性が求められるだろうし、SNSの「いいね」機能であれば、多少のデータの不整合は許容してでも可用性が重視されるかもしれない。
Why - チームのスキルセット: 開発チームはRDBの運用経験は豊富だが、NoSQLの経験は浅いのではないか？新しい技術を学ぶ時間的余裕はあるのか？
Why -予算と時間: このプロジェクトにかけられる予算と、リリースまでの時間はどれくらいか？

これらの「Why」こそが、無数に存在する「How」の中から、ただ一つの「正解」を選び出すための羅針盤なのである。そしてこの「Why」は、ビジネスの目標、組織の文化、ユーザーの期待、技術的な制約といった、極めて人間的で、文脈依存的な情報の中にしか存在しない。

3-2.エンジニアが暗黙的に行ってきた「Why」に基づく意思決定

ここで重要なのは、これまでもエンジニアは、この「Why」に基づく意思決定を、意識的あるいは無意識的に行ってきたという事実だ。

私たちが技術選定を行うとき、単に「流行っているから」という理由だけでReactを選ぶわけではない。「SPA（Single PageApplication）にすることでユーザー体験を向上させたい（Why）」、「コンポーネント指向の開発によって長期的な保守性を確保したい（Why）」、「Reactエンジニアの採用市場が活発だから（Why）」といった、様々な「Permalink |記事への反応(0) | 17:09

ツイートシェア

■LLMはエンジニアの仕事を奪うのか？否、仕事の抽象度を「Why」の次元へ

序文：コードが蒸発する時代と、それでも残る「Why」という名の問い

第1章：プログラミングの歴史的変遷 ― HowからWhatへの長い道のり

1-1.手続きの時代：Howを記述することに終始した黎明期

1-2.テストが駆動した振る舞いへの注目：Whatへの小さな一歩

1-3.宣言的プログラミングの台頭とフレームワークの役割

この「WhatからHowへの変換」は、様々な領域で見られる。

GraphQL:クライアントが必要なデータの形（What）をスキーマとして宣言すれば、サーバーがどのようにデータを取得し、整形するか（How）はGraphQLエンジンが解決してくれる。
Terraform:インフラのあるべき構成（What）をHCLという言語で宣言すれば、各クラウドプロバイダーのAPIをどのように呼び出してリソースを作成・更新・削除するか（How）はTerraformが担う。
BaaS (e.g., Supabase, Firebase):データベースのテーブルスキーマ（What）を定義すれば、それに対応するRESTful APIやGraphQLAPI（How）が自動的に生成される。

第2章：LLMがもたらす究極のパラダイム シフト ― 汎用変換器の誕生

2-1.フレームワークの制約を超えて

例えば、こうだ。

ユーザー認証機能付きのシンプルなブログアプリを作ってほしい。フロントエンドはReactとTypeScript、UI コンポーネントはMUIを使う。バックエンドはNode.jsとExpressで、データベースはPostgreSQL。ユーザーはGoogle アカウントでログインでき、新しい記事を作成、編集、削除できる。記事にはマークダウン記法が使えて、画像もアップロードできるようにしてほしい。

2-2. 「What」の解像度がすべてを決める世界

質の高い「What」とは何か。それは、曖昧性がなく、網羅的で、矛盾のない要求である。

曖昧性の排除: 「ユーザーがいい感じに使えるようにして」ではなく、「ユーザーは記事一覧を、作成日時の降順、または更新日時の降順でソートできる」と具体的に記述する。
網羅性: 正常系のシナリオだけでなく、異常系（例：ログイン失敗時、データベース接続エラー時）の振る舞いも定義する。エッジケースを考慮する。
矛盾のなさ: 「すべてのユーザーは記事を削除できる」という要求と、「管理者ユーザーのみが他人の記事を削除できる」という要求が両立しないことを指摘し、解決策を提示する。

第3章：それでもAIには決められない ― 「Why」の不在という致命的な欠陥

答えは、明確にNoである。

3-1.トレードオフの海に溺れるLLM

案A:シンプルな構成を重視し、PostgreSQLのようなRDBを使い、`user_id`にB-Treeインデックスを張る。
案B: スケーラビリティを最優先し、Amazon DynamoDBやCassandraのようなNoSQL データベースを使う。
案C:検索速度を極限まで高めるために、Elasticsearchのような全文検索エンジンを併用する。
案D:コストを最優先に考え、データをオブジェクトストレージに保存し、Athenaのようなサービスで都度クエリする。

Why -ビジネスの文脈: このシステムは、立ち上げ直後のスタートアップのMVP（Minimum Viable Product）なのか？それとも、数千万人のアクティブユーザーを抱える既存サービスの新機能なのか？前者であれば開発速度とシンプルさが優先される（案A）だろうし、後者であればスケーラビリティが死活問題になる（案B or C）。
Why -品質特性の優先順位: このシステムにとって最も重要な品質は何か？パフォーマンスか？可用性か？保守性か？それともセキュリティか？金融システムであれば一貫性と堅牢性が求められるだろうし、SNSの「いいね」機能であれば、多少のデータの不整合は許容してでも可用性が重視されるかもしれない。
Why - チームのスキルセット: 開発チームはRDBの運用経験は豊富だが、NoSQLの経験は浅いのではないか？新しい技術を学ぶ時間的余裕はあるのか？
Why -予算と時間: このプロジェクトにかけられる予算と、リリースまでの時間はどれくらいか？

3-2.エンジニアが暗黙的に行ってきた「Why」に基づく意思決定

ここで重要なのは、これまでもエンジニアは、この「Why」に基づく意思決定を、意識的あるいは無意識的に行ってきたという事実だ。

ツイートシェア

2025-06-14

■

FC（ファミコン）時代の大作RPG、特にドラゴンクエストIV（DQ4）のようなタイトルは、当時のハードウェア制約下でも非常に大規模なプログラムとなっています。

一般的に、FC カートリッジの容量は数十KB から512KB程度が上限で、DQ4は最大クラスの1メガビット ROM（128KB）を採用しています。

この容量にはプログラムコードだけでなく、グラフィック、サウンド、マップデータなども含まれるため、純粋なプログラム（アセンブリコード）のみの行数や文字数は公表されていませんが、推定することは可能です。

参考：FC大作RPGのコード規模

アセンブリ言語で記述されるFC ソフトのソースコードは、1行あたり平均20〜40文字程度
DQ4 クラスの大作では、数万行規模（例：2〜5万行以上）のアセンブリコードになると考えられています
文字数換算では、数十万文字以上に相当します
参考事例
海外の有志によるFC版DQ3の逆アセンブルプロジェクトでは、約3万行超のアセンブリコードが抽出されています
DQ4はさらに規模が大きいため、**3万〜5万行以上**と推測されます

まとめ

DQ4のソースコード（アセンブリ）は、数万行（3〜5万行以上）、文字数で数十万文字以上と推定されます
これは現代の高級言語のソフトと比べても、構造化されていない分だけ解析・管理が非常に困難です

この規模感が、全挙動の解析や文書化が膨大な労力となる理由の一つです。

仮に1日300行のアセンブリコードを書いたとしても、数万行規模のFC大作RPGでは何ヶ月、場合によっては1年以上の開発期間が必要になります。

しかも、実際の現場では「書く」だけでなく、バグ修正・デバッグ・仕様変更への対応・最適化など、膨大な「やり直し」や「手直し」も日常茶飯事でした。

先人たちのエピソード

たとえば『オホーツクに消ゆ（ファミコン版）』の開発者は、発売直前の数ヶ月は会社に泊まり込み、眠くなれば床で寝て、起きたらすぐ作業に戻るという過酷な状況だったと回想しています。
デバッグや仕様追加のたびに、全体の流れやバグを一から確認し直す精神的な負担も非常に大きかったと語られています。

「会社に泊まりこみで作業し、眠くなれば床に転がって寝て、起きたらそのままパソコンの前に座るという状況だった。...自分たちが仕込んだストーリー（プログラムとデータ）が、『そのとおりになっているか』を延々と繰り返して確認するというデバッグ作業は、一定の期間を超えるとほんとうに精神的に拷問化するほどキツいのだ。」