「構文解析」を含む日記

「Parser」とはどういう意味ですか？

パーサ【parser】パーザ

パーサとは、コンピュータプログラムのソースコードやXML 文書など、何らかの言語で記述された構造的な文字データを解析し、プログラムで扱えるようなデータ構造の集合体に変換するプログラムのこと。そのような処理のことを「構文解析」「パース」（parse）という。2025/08/29

パーサ（パーザ）とは -IT用語辞典 e-Words

IT用語辞典 e-Words

https://e-words.jp › パーサ

「Purser」とはどういう意味ですか？

なお、かつては女性の「客室乗務員」のことを「スチュワーデス」、男性の「客室乗務員」のことを「スチュワード」や「パーサー」と呼んでいたが、今では旅客機に限らず鉄道や客船の中で、乗客に接客サービスをする「客室乗務員」を統率する立場にある者を「パーサー」や「チーフパーサー」と呼んでいる。

Permalink |記事への反応(1) | 13:18

ツイートシェア

2025-11-06

■勉強になった

生成AIにソフトウェア開発を支援してもらう場合、ソースコードの作成を依頼する形式が多いと思いますが、実行ファイルを直接出力してもらうことも技術的には可能なのでしょうか？

生成AIによる実行ファイルの直接出力は、技術的には極めて困難です。現在のLLM（大規模言語モデル）ベースの生成AIは、ソースコードの生成には向いていますが、実行可能なバイナリファイルを直接出力することには根本的な制約があります。

技術的な制約
LLMはテキストベースのトークン処理を基本とする設計であり、バイナリデータを直接扱うことができません。実行ファイルは0と1の連続したバイナリコードですが、LLMはこの形式でデータを生成するようには訓練されていないため、バイナリファイルを直接出力することは現在のアーキテクチャでは実現が困難です。
従来のソフトウェア開発では、ソースコード→コンパイル→アセンブル→リンクという複数段階のプロセスを経て実行ファイルが生成されます。各段階で最適化や機械語への変換が行われるため、この過程を完全に省略してAIが直接バイナリを生成することは技術的に非常に複雑です。

理論的な可能性
研究レベルでは、バイナリデータを扱う試みも存在します。例えば、LLM4Decompileのような研究プロジェクトでは、バイナリコードを逆コンパイルする際にバイナリを一度アセンブリ言語に変換してからLLMで処理しています。逆に言えば、生成時も同様の変換プロセスが必要になると考えられます。

現実的なアプローチ
実務では、生成AIにソースコードを作成してもらい、それを従来のコンパイラやビルドツールで実行ファイルに変換する方式が標準的です。この方法であれば、デバッグやテストも容易で、生成されたコードの品質を確認しながら開発を進められます。
なお、フォントファイルのようなバイナリ形式でもオープンソースとして扱われる例はありますが、これはフォントという特定用途の場合であり、汎用的な実行ファイル生成とは異なります。

画像生成もバイナリを生成しているわけで、同じようなことができるのではと思ったのですが、そこはぜんぜん違うのですね

おっしゃる通り、画像生成AIもバイナリを出力しているという点では共通していますが、実は根本的に異なる仕組みで動作しています。

アーキテクチャの違い
画像生成AIは拡散モデル（DiffusionModel）やGANなど、視覚データに最適化された専用のアーキテクチャを使用しています。一方、LLMはTransformerベースのテキスト処理に特化した構造を持っています。画像生成では、ノイズから段階的に画像を生成するプロセスを経て、最終的にピクセル値という数値データ（バイナリ）を出力します。

データ表現の性質
画像ファイルのバイナリは連続的な数値（ピクセル値）の集合であり、各ピクセルが色情報を持つという規則的な構造です。最近の研究では、画像をビットプレーン（bit-plane）として扱い、XOR 演算でノイズを加えるBinary Diffusion ProbabilisticModel（BDPM）のような手法も開発されています。
対して、実行ファイルのバイナリは機械語命令の複雑な配列であり、CPUが直接実行できる命令コード、データセクション、リンク情報などが厳密な形式で配置されています。わずかなビット誤りでもプログラムが動作しなくなるため、画像のような連続値とは性質が大きく異なります。

学習データの違い
画像生成AIは、ImageNetやLAIONなどの大量の画像データセットで訓練されており、ピクセルパターンを学習します。一方、実行ファイルを生成するには、コンパイルプロセス全体（構文解析、最適化、機械語変換、リンク）を学習する必要がありますが、これは単純なパターン学習では実現できません。
したがって、画像生成AIが成功しているのは、画像という特定のドメインに特化した設計と、規則的なデータ構造があるためであり、同じ手法を実行ファイル生成に適用することは技術的に非常に困難です。

Permalink |記事への反応(0) | 15:50

ツイートシェア

2025-10-07

■anond:20251007100832

未だにAIとお話しするの苦手

どうしても「AIにとって構文解析しやすい日本語」とかを考えちゃうから自然体で雑談とかできないし、あくまで指示出し用って感じ

お前らと話してる時の方がよっぽど自然

Permalink |記事への反応(0) | 10:15

ツイートシェア

2025-10-05

■anond:20251005191534

もう何書いてもバイリンガル以外から反応無いの分かってるでしょ?日本人は日本語非母語話者の発言をデコードできないんだよ差別意識どころか構文解析が成功しない

認知を言語表現に落とし込む段階から日本語の認知モデルを採用しない限り、解釈可能な正しい現実認識として承認されない。逆にお前みたいな母語が英語の奴はこういう風に英語を翻訳した日本語で言わないと分からないだろ。

Permalink |記事への反応(1) | 19:39

ツイートシェア

2025-06-17

■dorawii

読点を明示しないと理解できない残念なやつ。

どのミチ(副詞)ガイジ(名詞)という構文解析が正しい解釈なｗ

-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20250617182322 -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaFE0CwAKCRBwMdsubs4+SAX7AP91H8W5YkxfcYJNyKVnDTLMFpRpM2jD6U5ibKZX699r3QEA5W3dCMLwSaWIn9Tn+GGw62EDLAooPYG9jVMexEBFmQQ==Lt/V-----ENDPGP SIGNATURE-----

Permalink |記事への反応(2) | 18:23

ツイートシェア

2025-02-27

■

AIが出力したコードは信用ならん、ディレクションとレビューする能力が必要、って言われてるけど、それも今だけで、あっという間に超人級のエンジニアを凌駕したクオリティのコードが素人でも意図通りに出力できるようになるだろうな

いちいち構文解析の結果を疑ったり、コンパイラが吐いたバイナリを慎重に精査することはほとんどないけど、それと同じレイヤーの話になってく

Permalink |記事への反応(0) | 08:08

ツイートシェア

2024-03-01

■anond:20240301000020

ならないが？

そもそも既には「粗探し」にかかってるし。構文解析力もないのか

お前が他責するという表現について粗探し的に批判する

↓

俺弁解する

↓

横増田がそれを粗探しという

↓

俺の弁解が粗探しならお前も既に粗探し的なことしてるぞ

こうだぞ

Permalink |記事への反応(0) | 12:28

ツイートシェア

2024-02-25

■自分で調べろは回答になってないぞ知恵カスが

javascriptの結合性について
a=b=1;のような場合、この文に使われている演算子はどちらも同じ=という種類であり、優先順位に差が無いので、左側から解析し、もう一つ同じ演算子があるので演算子の実行を保留し、右側の=を見つけて、右から代入するというのはわかります。
では()すなわちグループ化のような場合はどうなのでしょうか？さいわいこれには結合性はないようですが、あったとしたらどう考えればいいのでしょうか？
=のように右と左をオペランドに挟まれた形ではないので、左側とか右側とかいってもよくわかりませんし、(...)+2の)+のように演算子同士が隣接する場合も考えるとますますどういうアルゴリズムなのかよくわかりません。
それともだからこそ、()には結合性を設けないとしたのでしょうか？

dot dot dotさん
2024/2/25 15:38
a = b = 1
は
a = (b = 1)
と解釈されます。
分かってないのは字句解析しか理解してないからです。構文解析について調べましょう。

調べましょうでもいいんですが、知ってるならそのあなたが同じ疑問にあたったときに調べて解決につながった情報だけを一通り書いてくれるのが一番ありがたいのですが。
「構文解析」なんて漠然とした範囲を調べていたら、たとえ疑問のカギになる情報が目に入っても素通りしちゃいそうですし…

Permalink |記事への反応(1) | 15:48

ツイートシェア

2023-12-02

■anond:20231130133508

俺増田は手帳付きのアドハドアスペマンだけど、「俺は読めるし書けるけど構文解析能力の低い一般人が見ると読みにくいだろうなーと思う文章」にはカッコを付けてあげてる

簡潔な短文で完結(ここ気の利いたシャレね)させることもできるけど、最近のネットはすーぐ曲解・拡大解釈して噛み付いてくるキ○ガイばっかりゆえ自己防衛のためにも修飾注釈但し書きモリモリにしとかないと俺が悪いように言われてしまうからね

全ては定型発達健常厨が悪いっ

Permalink |記事への反応(1) | 00:48

ツイートシェア

2023-07-01

■anond:20230701095838

・母国語が英語ではないのでネット上の情報量が少ない。

・日本語は構文解析との相性が悪すぎて、それがあらゆるシステムに影響を及ぼしてる（主に検索エンジン）

・解雇規制が原因で組織が腐敗し、新規事業の為に人を雇えないのでSIerが勢力を得た。

あたりやろなあ。

Permalink |記事への反応(1) | 10:14

ツイートシェア

2023-03-10

■AI音声合成齧ってたので私見を述べる

論旨

法律によって制限を設けることは個人的には賛成だが、実際に可能なのか疑問に思う（法律に関する知識がないので詳しい言及は避ける）
AI音声合成がAIイラストと同じ轍を踏むとは現時点では考えにくい（以下に述べる）
- 学習手法が十分に成熟していない
- アニメ声優のデータセットが整備されていない
- AI イラストに見られるような対立構造を持たない