Movatterモバイル変換


[0]ホーム

URL:


はてラボはてな匿名ダイアリー
ようこそ ゲスト さんログインユーザー登録

「構文解析」を含む日記RSS

はてなキーワード:構文解析とは

次の25件>

2025-12-05

Parser」とはどういう意味ですか?

パーサ【parser】パーザ

パーサとは、コンピュータプログラムソースコードXML文書など、何らかの言語記述された構造的な文字データを解析し、プログラムで扱えるようなデータ構造集合体に変換するプログラムのこと。 そのような処理のことを「構文解析」「パース」(parse)という。2025/08/29

パーサ(パーザ)とは -IT用語辞典e-Words

IT用語辞典e-Words

https://e-words.jp › パーサ

「Purser」とはどういう意味ですか?

なお、かつては女性の「客室乗務員」のことを「スチュワーデス」、男性の「客室乗務員」のことを「スチュワード」や「パーサー」と呼んでいたが、今では旅客機に限らず鉄道客船の中で、乗客接客サービスをする「客室乗務員」を統率する立場にある者を「パーサー」や「チーフパーサー」と呼んでいる。

Permalink |記事への反応(1) | 13:18

このエントリーをはてなブックマークに追加ツイートシェア

2025-11-06

勉強になった

Q.

生成AIソフトウェア開発を支援してもらう場合ソースコード作成を依頼する形式が多いと思いますが、実行ファイルを直接出力してもらうことも技術的には可能なのでしょうか?

A.

生成AIによる実行ファイルの直接出力は、技術的には極めて困難です。現在のLLM(大規模言語モデルベースの生成AIは、ソースコードの生成には向いていますが、実行可能バイナリファイルを直接出力することには根本的な制約があります。​

技術的な制約

LLMはテキストベーストークン処理を基本とする設計であり、バイナリデータを直接扱うことができません。実行ファイルは0と1の連続したバイナリコードですが、LLMはこの形式データを生成するようには訓練されていないため、バイナリファイルを直接出力することは現在アーキテクチャでは実現が困難です。​

従来のソフトウェア開発では、ソースコードコンパイルアセンブルリンクという複数段階のプロセスを経て実行ファイルが生成されます。各段階で最適化機械語への変換が行われるため、この過程を完全に省略してAIが直接バイナリを生成することは技術的に非常に複雑です。​

理論的な可能

研究レベルでは、バイナリデータを扱う試みも存在します。例えば、LLM4Decompileのような研究プロジェクトでは、バイナリコードを逆コンパイルする際にバイナリを一度アセンブリ言語に変換してからLLMで処理しています。逆に言えば、生成時も同様の変換プロセス必要になると考えられます。​

現実的アプローチ

実務では、生成AIソースコード作成してもらい、それを従来のコンパイラビルドツールで実行ファイルに変換する方式標準的です。この方法であれば、デバッグテストも容易で、生成されたコード品質確認しながら開発を進められます。​

なお、フォントファイルのようなバイナリ形式でもオープンソースとして扱われる例はありますが、これはフォントという特定用途場合であり、汎用的な実行ファイル生成とは異なります

Q.

画像生成もバイナリを生成しているわけで、同じようなことができるのではと思ったのですが、そこはぜんぜん違うのですね

A.

おっしゃる通り、画像生成AIバイナリを出力しているという点では共通していますが、実は根本的に異なる仕組みで動作しています。​

アーキテクチャの違い

画像生成AI拡散モデル(DiffusionModel)やGANなど、視覚データ最適化された専用のアーキテクチャ使用しています。一方、LLMはTransformerベーステキスト処理に特化した構造を持っています画像生成では、ノイズから段階的に画像を生成するプロセスを経て、最終的にピクセル値という数値データバイナリ)を出力します。​

データ表現性質

画像ファイルバイナリ連続的な数値(ピクセル値)の集合であり、各ピクセル色情報を持つという規則的な構造です。最近研究では、画像ビットプレーンbit-plane)として扱い、XOR演算ノイズを加えるBinary Diffusion ProbabilisticModel(BDPM)のような手法も開発されています。​

対して、実行ファイルバイナリ機械語命令の複雑な配列であり、CPUが直接実行できる命令コードデータセクション、リンク情報などが厳密な形式で配置されていますわずかなビット誤りでもプログラム動作しなくなるため、画像のような連続値とは性質が大きく異なります。​

学習データの違い

画像生成AIは、ImageNetやLAIONなどの大量の画像データセットで訓練されており、ピクセルパターン学習します。一方、実行ファイルを生成するには、コンパイルプロセス全体(構文解析最適化機械語変換、リンク)を学習する必要がありますが、これは単純なパターン学習では実現できません。​

したがって、画像生成AI成功しているのは、画像という特定ドメインに特化した設計と、規則的なデータ構造があるためであり、同じ手法を実行ファイル生成に適用することは技術的に非常に困難です。

Permalink |記事への反応(0) | 15:50

このエントリーをはてなブックマークに追加ツイートシェア

2025-10-07

anond:20251007100832

未だにAIお話しするの苦手

どうしても「AIにとって構文解析やす日本語」とかを考えちゃうから自然体で雑談とかできないし、あくまで指示出し用って感じ

お前らと話してる時の方がよっぽど自然

Permalink |記事への反応(0) | 10:15

このエントリーをはてなブックマークに追加ツイートシェア

2025-10-05

anond:20251005191534

もう何書いてもバイリンガル以外から反応無いの分かってるでしょ?日本人日本語母語話者発言デコードできないんだよ差別意識どころか構文解析成功しない

認知言語表現に落とし込む段階から日本語認知モデル採用しない限り、解釈可能な正しい現実認識として承認されない。逆にお前みたいな母語英語の奴はこういう風に英語翻訳した日本語で言わないと分からないだろ。

Permalink |記事への反応(1) | 19:39

このエントリーをはてなブックマークに追加ツイートシェア

2025-06-17

dorawii

読点を明示しないと理解できない残念なやつ。

どのミチ(副詞)ガイジ(名詞)という構文解析が正しい解釈なw

-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20250617182322 -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaFE0CwAKCRBwMdsubs4+SAX7AP91H8W5YkxfcYJNyKVnDTLMFpRpM2jD6U5ibKZX699r3QEA5W3dCMLwSaWIn9Tn+GGw62EDLAooPYG9jVMexEBFmQQ==Lt/V-----ENDPGP SIGNATURE-----

Permalink |記事への反応(2) | 18:23

このエントリーをはてなブックマークに追加ツイートシェア

2025-02-27

AIが出力したコードは信用ならん、ディレクションレビューする能力必要、って言われてるけど、それも今だけで、あっという間に超人級のエンジニア凌駕したクオリティコード素人でも意図通りに出力できるようになるだろうな

いちいち構文解析の結果を疑ったり、コンパイラが吐いたバイナリを慎重に精査することはほとんどないけど、それと同じレイヤーの話になってく

Permalink |記事への反応(0) | 08:08

このエントリーをはてなブックマークに追加ツイートシェア

2024-03-01

anond:20240301000020

ならないが?

そもそも既には「粗探し」にかかってるし。構文解析力もないのか

お前が他責するという表現について粗探し的に批判する

俺弁解する

増田がそれを粗探しという

俺の弁解が粗探しならお前も既に粗探し的なことしてるぞ

こうだぞ

Permalink |記事への反応(0) | 12:28

このエントリーをはてなブックマークに追加ツイートシェア

2024-02-25

自分で調べろは回答になってないぞ知恵カス

javascriptの結合性について

a=b=1;のような場合、この文に使われている演算子はどちらも同じ=という種類であり、優先順位に差が無いので、左側から解析し、もう一つ同じ演算子があるので演算子の実行を保留し、右側の=を見つけて、右から代入するというのはわかります

では()すなわちグループ化のような場合はどうなのでしょうか?さいわいこれには結合性はないようですが、あったとしたらどう考えればいいのでしょうか?

=のように右と左をオペランドに挟まれた形ではないので、左側とか右側とかいってもよくわかりませんし、(...)+2の)+のように演算子同士が隣接する場合も考えるとますますどういうアルゴリズムなのかよくわかりません。

それともだからこそ、()には結合性を設けないとしたのでしょうか?

dot dot dotさん

2024/2/25 15:38

a = b = 1

a = (b = 1)

解釈されます

分かってないのは字句解析しか理解してないからです。構文解析について調べましょう。

調べましょうでもいいんですが、知ってるならそのあなたが同じ疑問にあたったときに調べて解決につながった情報だけを一通り書いてくれるのが一番ありがたいのですが。

構文解析」なんて漠然とした範囲を調べていたら、たとえ疑問のカギになる情報が目に入っても素通りしちゃいそうですし…

Permalink |記事への反応(1) | 15:48

このエントリーをはてなブックマークに追加ツイートシェア

2023-12-02

anond:20231130133508

増田手帳付きのアドハドアスペマンだけど、「俺は読めるし書けるけど構文解析能力の低い一般人が見ると読みにくいだろうなーと思う文章」にはカッコを付けてあげてる

簡潔な短文で完結(ここ気の利いたシャレね)させることもできるけど、最近ネットはすーぐ曲解拡大解釈して噛み付いてくるキ○ガイばっかりゆえ自己防衛のためにも修飾注釈但し書きモリモリにしとかないと俺が悪いように言われてしまうから

全ては定型発達健常厨が悪いっ

Permalink |記事への反応(1) | 00:48

このエントリーをはてなブックマークに追加ツイートシェア

2023-07-01

anond:20230701095838

母国語英語ではないのでネット上の情報量が少ない。

日本語構文解析との相性が悪すぎて、それがあらゆるシステムに影響を及ぼしてる(主に検索エンジン

解雇規制が原因で組織が腐敗し、新規事業の為に人を雇えないのでSIer勢力を得た。

あたりやろなあ。

Permalink |記事への反応(1) | 10:14

このエントリーをはてなブックマークに追加ツイートシェア

2023-03-10

AI音声合成齧ってたので私見を述べる

論旨


演技音声の学習

無断で数千人の声優学習したというのは、恐らくMoeGoeのことを指していると思われますが、アクセント不安定で「演技泥棒」には程遠いです。

最新のモデルをもってしてもアニメの演技のような抑揚の大きい音声を学習させることは難しいことであって、実用レベルに押し上げるようなブレイクスルーもまだ起きていないのが現状です。


音声合成学習には、データセットとして音声とそれに対応する文章を合わせた音声コーパスと呼ばれるものを用います

演技というもの台本でいうところのト書きであって、文章に直接的に含まれている情報ではないことからも、文章から生成する音声に演技を付与させることの難しさが理解できると思います


データセットの問題

文章と音声があれば、即座にデータセットとして使えるかと言えばそうではありません。

文章で想定している(文章構文解析することによって得られる)読み方と、音声における実際の発音が異なる場合があります

音声合成は結局のところ文章の音素と音声を対応付けているだけなので、音声コーパス文章と実際の音声に乖離がある場合には学習の精度が下がる恐れがあります

加えて、現在音声合成ではアクセントなどの情報を用いることが多いですが、アクセント辞書から得られた情報と実際のアクセントが異なる場合も演技音声では散見されるでしょう。

上に述べた抑揚の問題や、音声にBGMなどのノイズが混ざっている場合など、音声自体データに適さな場合もあるため、それらの選別も必要です。

音声合成用に収録された音声コーパスであれば、読み方やアクセントノイズ等に細心の注意を払って録音されていますが、一般の音声は必ずしもそうではないのです。


このような読み方やアクセント等の修正は、残念ながら人力に頼らざるを得ません。そもそも台本がない場合は一から書き起こす必要があります

AIイラスト成功には、イラストへの人力でのタグけが寄与していることはよく知られていますが、果たしてAI音声という分野において人力による音声コーパスの整備が進むでしょうか?


声優との関係

AI音声合成ソフトの代表例とも言えるVOICEVOXはいまや多くの人気を集めており、多くのキャラクターが参加しています

また、COEIROINKのように音声コーパスを用意することで自らの声を学習させた機械学習モデルを共有できるような音声合成ソフトも登場しています

AIイラスト界隈における絵師との軋轢が援用されていますが、音声合成の分野においては多くの場合データ提供者たる声優相互理解のある関係を保ちつつ発展してきたことを強調しておきます


その他

動機付け

もともとナレーションの分野においては、既に十分な品質音声合成ソフトが存在します。

AIイラストと異なり、倫理的問題のある音声合成に手を出す動機付けが乏しいことが現時点において関心が集まらない要因となっています


ASMRにおける課題

そもそもASMRには、バイノーラルという特色があるわけで、AIが生成したモノラル音声がAIイラストほどの脚光を浴びるとは考えづらいです。


Permalink |記事への反応(0) | 17:57

このエントリーをはてなブックマークに追加ツイートシェア

2022-11-30

anond:20221130155638

構文解析勉強したことないとまずわからないよね。でも趣味でやる人たちもいるくらいだから、ひと通り学べばどうってことはないんだけど。(コンパイラを作るとかなら話は別だけど)

Permalink |記事への反応(0) | 17:41

このエントリーをはてなブックマークに追加ツイートシェア

anond:20221129085814

とあるメーカーが出してるソフトの設定ファルを読み込んで色々やろうぜっていう案件やった時にコンパイラ作った経験が役に立ったか

構文解析とか知らない人たちが書いてたバグらだらけのコードを綺麗に書き直した

元の担当者たちからは訳がわからないとか言われたけど

Permalink |記事への反応(1) | 15:56

このエントリーをはてなブックマークに追加ツイートシェア

2021-06-18

anond:20210617145029

設定ファイル読み込み処理がバグだらけで検収通らないのを構文解析手法導入してまともに動くようにしたとか

Permalink |記事への反応(0) | 10:16

このエントリーをはてなブックマークに追加ツイートシェア

2021-05-11

anond:20210511112018

そもそも構文解析までしちゃってる時点で、VSCodeテキストエディタの域を超えてIDE一種になってると思うので

別に重くても構わんのでは。

あとVSCode日本語の扱いが馬鹿すぎるので、日本で開発されたタフな状況でもマルチバイトをうまく

処理してくれるテキストエディタは手放せないわ。

Permalink |記事への反応(1) | 11:27

このエントリーをはてなブックマークに追加ツイートシェア

2021-01-04

anond:20181206153403

VSCodeとかの構文解析までやるエディタエディタの域を超えてると思うのであんまりきじゃないんだよなあ。

Permalink |記事への反応(0) | 13:09

このエントリーをはてなブックマークに追加ツイートシェア

2020-10-14

anond:20201013213028

から言えるのは、とりあえず現代社会とか公民勉強してナショナリズム論かじっとこうぜということです

圏論とか関数型プログラミング構文解析よりもそっちのほうが大事なんじゃないかな?

Permalink |記事への反応(2) | 09:22

このエントリーをはてなブックマークに追加ツイートシェア

2020-08-24

anond:20200824171428

Ruby構文解析器にはbisonを使っているとかそういう話か

Permalink |記事への反応(0) | 17:23

このエントリーをはてなブックマークに追加ツイートシェア

2020-05-20

anond:20200520161501

しろうんち側が構文解析Botだったりしないのかな

解析特性をハックして1増田に15うんちとかレスちゃうバグを突いて一時的クラウド請求額が爆上がりみたいなことをしてみたい

Permalink |記事への反応(1) | 16:18

このエントリーをはてなブックマークに追加ツイートシェア

2019-10-22

Blawn

中学生プログラミング言語を作ったというのは素晴らしいと思うが、その言葉が一人歩きしてるようにも思える

字句解析やら構文解析やらのライブラリもあるから、いまやオレオレ文言語の開発自体の敷居はそこまで高くない

Blawnもふつうに有名どころのライブラリ使ってるしな

あとサンプル見ても可読性が高いようには思えない

なんでインデントブロックなの?

コンストラクタオーバーロードどうするの?

クラス内メンバの宣言でいちいち@つけなきゃいけないの?

なぜmain()ないの?

などなど…

この程度だったらおれなんて中学生の頃は毎日さくらたんのエロ同人でシコっていたぞ!

Permalink |記事への反応(1) | 20:27

このエントリーをはてなブックマークに追加ツイートシェア

2019-01-13

anond:20190113201203

そのメリット日本でどこにあるんですかって聞かれてるのわからないのは童貞から?キーワードさらってるだけで構文解析できない人工無脳から?

Permalink |記事への反応(2) | 23:09

このエントリーをはてなブックマークに追加ツイートシェア

2018-09-22

anond:20180922130419

プログラムやってる人には、vary じゃなくて validate の方が意味わかるなあ

プログラムデータバリデートするって言ったら、そのデータが適格かチェックするという意味

文章バリデートするというのは、コンパイラで言えば、字句解析構文解析意味解析を行うということ

端的に言えば、文章文法的に適格かチェックし、また、意味的に矛盾してる部分がないか確認すること

エラーが見つかれば、コンパイラは処理を停止してエラーメッセージを吐く

まり、やってることがコンパイラ程度のことで、そこに自分意見はない、ということを言いたかったんじゃね?

Permalink |記事への反応(3) | 13:43

このエントリーをはてなブックマークに追加ツイートシェア

2018-06-10

anond:20180610194444

有名なので言うと「黒い瞳の大きな女の子」文かな。

あなたの文は解釈が定まるけど、こっちは読解力の問題とかではなく、むしろ読解力がある方が構文解析に手こずる。さら意味微妙に違うだけなのでコンテキストから判断するのも難しいだろう。

Permalink |記事への反応(1) | 19:54

このエントリーをはてなブックマークに追加ツイートシェア

2018-04-08

後で読むサービスを切り替えてみた

いわゆる”後で読む”系のサービスPocketを愛用してたんだけど、

Instapaperに本格的に切り替えることにした。

①いちいちウェブ画面に切り替えがいらない

PocketではデイリーポータルZとか某2chまとめブログとかはいちいち、

ウェブ画面にして読まないといけなくて、圏外中結構ストレスになってたけど、

Instapaperだと構文解析があってるらしく全ページ記事ビューで読めるのがいい。

これで圏外中でも読めないストレスがかなり減った。

Tumblrとの連携

IFTTTを使って、pocketでFAVしたの→Tumblrポストして記録をしてたんだけど、

タイトルリンクとれてなくて、せっかくのがともやもやしてたんだけど、

Instapaperを使ってみたら、アプリ上でお気に入りTumblr でできようになって、

記事内容がそのまま飛ぶようになっている。

ーーー

いまのところpocket でできて Instapaperが不便な所は見当たらないので、そのまま本格移行するつもり。

次はTumblrのFAV(文章画像両方意識することなく)をバックアップする方法を考えねば…。

Permalink |記事への反応(0) | 22:07

このエントリーをはてなブックマークに追加ツイートシェア

2017-06-27

学校の授業でプログラミングを教えるとしたら言語は何が良いのだろう

自分情報系の大学生

弊学では、2年生の時に必修のプログラミングの授業でC言語を習う。

中学生の頃からパソコン大先生スクリプト言語を軽く触ってた自分としては、わざわざ面倒な書き方で面倒なコンパイルをして動かす事に疑問を感じていた。

ちなみに、試験は紙ベースで、手書きプログラミングをさせられる。つらい。

スクリプト言語で良いと思ってた自分は、C言語を覚えることに疑問を感じていた。

結局、授業以外で全く勉強せずに試験結果は散々だったが、なんとか単位が取れたので良しとしよう。

プログラミング学者である人は苦労して書き方を覚えていたように思う。

脱落していった人を何人も見たが、人間やれば出来ないと思っていたことが出来るのである

本来プログラミングは誰でも出来るはずである

今学期、PHPを書く授業とPythonを書く授業を履修してみた。

PHPは、某テキストをもくもくと写経して動かしてみる授業で、独学でテキストコードを動かす気力のない自分にとっては最高の授業だ。

Pythonは、MeCabなどで形態素解析構文解析をする授業で、サンプルコード自分で考えてカスタマイズして毎回レポートで提出する。

Pythonの書き方に慣れないからか、かなりハードであるが、やりがいがあっていい感じだ。

やはり、スクリプト言語楽しい

書いたらすぐに目に見える成果が出るところが大きい。

自分は、プログラミングを授業で教えるのならスクリプト言語に限るはずだと思う。

そう思っていた矢先に事件が起こった。

最近研究室に入ったところ先生が手当たり次第Javaを教え始めたのである

せめてJavaScriptでいいかスクリプト言語を教えてほしいところなのに、なんでJavaなんだと発狂した。

それでも、30億のデバイスで動くハイブリッドさとオブジェクト指向理解する上での分かりやすさという面ではJavaが手軽なのかもしれない。

コンパイル言語も悪くはないと思い始めた。

ところで、最近になってプログラミング教育義務化とか叫ばれてるが、Scratchでパーツを並べてプログラミングをするなんてただの積み木に過ぎないと思う。

絶対にツマラナイだろう。

自分は、プログラミングの授業で数字を足し算して黒い画面に表示させるとかツマラナイと感じてしまった。

こんな複雑なことをしても、これしか成果が出ないならやってられないと思うのは自分だけなのだろうか。

お願いだからプログラミングを教えるのならツマラナイ授業をしないで欲しい。

生徒に分かるように、生徒は楽しんでプログラミングをするべきだ。

別にどんな言語でもいいと思うが、プログラミング言語は人それぞれ好き嫌いが激しいだろう。

自分は、分かりやすくて直感的なRubyというプログラミング言語学校の授業で採用されるべき言語に間違いないと思う。

別にRubyにこだわる必要はなくて、スクリプト言語であればなんでも良いと思う。

CやJavaなどのコンパイル言語は複雑で分かりにくいし、教えにくいはずだ。

スクリプト言語を教えた後に、コンパイル言語オブジェクト指向概念を教えていくのがいいのではないだろうか。

これは、あくまでもたった1人の大学生意見しか過ぎない。

みんなの意見を知りたい。

Permalink |記事への反応(7) | 15:58

このエントリーをはてなブックマークに追加ツイートシェア

次の25件>
ログインユーザー登録
ようこそ ゲスト さん
Copyright (C) 2001-2025 hatena. All Rights Reserved.

[8]ページ先頭

©2009-2025 Movatter.jp