
はてなキーワード:辞書とは
チャンネルが変わっているとはいうが、チャンネルが回っているとは言わない。
こういうことは辞書にも載っていない。
dorawiiより
-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20251025162826# -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaPx8GgAKCRBwMdsubs4+SJqIAQCMJpWXiM6+Gu7/96Vvvydu2JWXRWkbERoF9u4nVbM8SwEA3Ruv+Ev/8GdCNOXQBStwDXYogwUkFE4LQEDOVlqIEwA==qcr9-----ENDPGP SIGNATURE-----
チャンネルが変わっているとはいうが、チャンネルが回っているとは言わない。
こういうことは辞書にも載っていない。
ある一つの言語に対してネイティブに擬態することの難しさってものはこういうところにある。
dorawiiより
-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20251025140338# -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaPxaKwAKCRBwMdsubs4+SNFkAQCdSjFHBMIf4rcJTO9pFVOmOkt9IpTI73U9KHhavyGBqgEA+cWItx7YC3cIO+YcXSTsOMiYNqTa4sjrmN26bR8ZBQU==8a3O-----ENDPGP SIGNATURE-----
わからなければ辞書を引くなんて愚直に守ってるのは典型的な優等生だろう。
全ての地域の全ての児童がお前みたいな生き方してきたと思うなよ世間知らず
-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20251015182449# -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaO9oYwAKCRBwMdsubs4+SEWjAQCwmy5/9nc90I926yCmtmwpMFnUghe+PMgiYhtxSWB+GgD+IxveZs+KfzJZPDToXiz6cXpS/VlQYkdXYu+dv4eHwgM==eLbD-----ENDPGP SIGNATURE-----
意味がわからない言葉=辞書を引いてない言葉なんだから、そっちはわかるだろ
あやふやな言葉も同じで、辞書を引いたかどうかは関係無しにあやふやならもう一回辞書を引け
わからないなら調べる
お前は学校に入る前は全部なんとなくで言葉使ってたのか?それとも入学前から辞書引く習慣があった神童かなにかで?
-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20251015182159# -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaO9nuQAKCRBwMdsubs4+SDneAQDf+mTNN33zTSj0dWssxe3hEDlCnXaYD7il2OSc9BbpbAD/YaqydvPVu+NEzoOVAQq9XNZJqw+Xzh7VPbWNRlMUuAs==dByc-----ENDPGP SIGNATURE-----
知らない言葉は知らない言葉なので、辞書引かないと意味がなんとなくしかわからないだろ
おまえはそうやって「なんとなく」で言葉を使ってるから、壊れた日本語しか使えないんだよ
答えでてるじゃねーか
何が知らない=一度も意味を調べたことが無い言葉かなんかいちいち覚えてないだろ普通。
言葉なんて覚えても無いうちにいつの間にか耳にしたものが頭に入ってるもので、それは自分で辞書で引いた言葉と混ざることによって、何が自分が辞書を引いた言葉なのかはわからなくなるだろう
つまり頭に入ってる言葉なら意味を知ってると思ってしまう理由は十分にある。
知らない可能性を疑い始めたら使おうとするたびに辞書を引かなければならない。
-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20251015181919# -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaO9nGQAKCRBwMdsubs4+SCCKAQCHiJhMjdU+Snev0uNc986DB/4CNt+g3AjTmv597AP24AD9ENBGCgqzVPl2CeuNbLVcb84khljedtvRVMTG7+MPOgg==nJFf-----ENDPGP SIGNATURE-----
2、3歳で話し始めるとしてまだそのタイミングでは自分の言葉の使い方に対して無批判で使ってるはずだろ?
どっかで一度自分が使う可能性のある言葉の意味総ざらいしようとかって思うのか?
-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20251015180901# -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaO9krwAKCRBwMdsubs4+SL1tAQDTM3iXndGVTsPZQkAx7TOd1hFnDhDHfHVI3JI6JooExwEAylVhQ7z+9UuL6hagX6DqYtuUsUxqlvezCjvP1zjbRQc==edv4-----ENDPGP SIGNATURE-----
意味不明すぎ。使ってる言葉は全て一度は辞書引いて正確な意味を暗記して置いてる言葉ってことか?
-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20251015180329# -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaO9jZwAKCRBwMdsubs4+SM2PAQCsdkpsgQeO++9H28+w4NuQWk1ZT2lkV+yHCzCPueNw6wD9H7kp2ckiVRdjPbS1fnuHRSyRs9prtdUAw3wNo28G6Ac==AopC-----ENDPGP SIGNATURE-----
お前は「普通」「は」「調べる」「よ」に対して今辞書引いたのか?
-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20251015170405# -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaO9VdwAKCRBwMdsubs4+SLAfAP4s9YgOJUxQQxlcqzMEA1kLBQRt+fBqK/X36DryQRhvBgD/b4W6Y8hQ+k+FCRexOi08gFYG8sDgk1A8Q3W4felKUwg==lRZQ-----ENDPGP SIGNATURE-----
でも大半の人は言葉の意味はわかってると思い込んで使ってるよね?
わかってないかもしれないと思わない限り辞書引くなんてしないでしょ。
究極的な懐疑論的な立場に立てば一個一個の単語で立ち止まって辞書で調べるのが確実だけど
ふつうそんなことはしないよね。
俺は運が悪いだけだよな。
-----BEGINPGP SIGNEDMESSAGE-----Hash: SHA512https://anond.hatelabo.jp/20251015170013# -----BEGINPGP SIGNATURE-----iHUEARYKAB0WIQTEe8eLwpVRSViDKR5wMdsubs4+SAUCaO9UkQAKCRBwMdsubs4+SCobAQC5PP6mfiG2WiUz8VnETSd3R2KZUprX19SbA8d18R1s5QEAlzlpTkM4DYxwWhTv68dnKB4FJ1FxPdtjIdr1xZ7Kngc==8gaO-----ENDPGP SIGNATURE-----
きっかけは、学生時代にちょっとしたレポートでテキストの単語出現頻度を数えようとしたとき、「あれ、そもそも日本語ってどうやって単語に分けんの?」って疑問が出たところからだ。
英語ならスペースで切れるけど、日本語はそうはいかない。で、いろいろ調べて「形態素解析」って言葉にたどり着いた。
その瞬間にちょっとハマったんだよね。
辞書をもとに文を機械的に切り刻んで、品詞をラベル付けして、統計を取って、構文を推定する。まるで人間の頭の中を数理的に覗いているようで。
そこからMeCabとかJumanとかKyTeaとか、いろんなツールを触った。
Pythonでテキスト処理のパイプラインを組んだり、mecab-ipadic-NEologdを突っ込んで新語に対応させたり。
「言葉を数理で扱える」って発見が、ちょっとした中毒になった。
その頃はMosesとかGIZA++とか、ああいう統計翻訳系のツールも触ってたね。
単語アラインメントの確率モデルをいじって、「確率的に対訳辞書を作る」みたいな遊びをしてた。
とにかく、NLPの世界には「人間の言葉を数学で再現できるかもしれない」という変な魅力があった。
深層学習がまだ主流じゃなかったから、n-gramやHMM、CRFなんかが主戦場で、論文読むたびに確率式の展開を手で追ってた。
最初はPoC(Proof of Concept)しかやらせてもらえなかった。
感情分析とか、Stance Detectionとか、「この文は文法的に典型か非典型か」を判別するための言語モデルの構築とか、エンティティリンキング、質問応答(Question Answering)。とにかくNLPの典型的なタスクを一通り。
学術的には面白かったけど、現場で求められてたのは「論文再現じゃなくて、実用的な精度と速度」だった。
PoCで終わって、実装には至らない案件が山のように積み上がっていった。
あの時期、NLP業界全体が「技術的にはすごいけどビジネスには落とし込めてない」って空気だった。
でもさ、LLM(大規模言語モデル)が出てきてから、世界がひっくり返った。
正直、最初は「Transformerの延長だろ」と思ってたけど、数ヶ月で実感が変わった。
それまでチマチマ特徴量を設計して、分類器を学習して、F値を0.02上げるために夜中までパラメータをいじってたのが、全部一瞬で過去になった。
ChatGPTが出て、蒸留やファインチューニングでほとんどのNLPタスクが置き換えられるようになったとき、「あれ、今までの俺の知識、ほとんど無駄だったんじゃね?」って一瞬マジで虚無になった。
でも、そこで終わらなかった。プロダクション環境を任せてもらえるようになって、推薦システムとかパーソナライゼーションの設計をやるようになって、ようやく「ユーザーベクトルを使う」という文脈でNLPが再接続した。
単なるテキスト処理から、「テキストを媒介にして人間の行動を理解する」方向に進んだ。
埋め込み表現をベースにユーザーの嗜好を推定して、レコメンドやメルマガのパーソナライズをやる。
自然言語はもう目的じゃなくて、インターフェイスになった。そうやって初めて、「NLPがビジネスに食い込む瞬間」ってのを肌で感じた。
PoCなんてやってても金にはならん。動くシステム、回る仕組み、再現性のある成果、それを出せないと、どんなに学問的に立派でも意味がない。
でも、PoCの積み重ねがなかったら、今の設計思想もなかったと思う。無駄に見える実験が、実は土台になってる。
自然言語処理って、そういう「積層的な知識と挫折の積み上げ」が一番の資産なんだよな。
Permalink |記事への反応(15) | 06:37
「それなりに読書家だが、英語力はそこそこの日本人」は、英語で何を読むか。何を読むべきなのか。それが問題である。
中学高校の6年間英語を学び(英検2級、センター試験180点)、大学に入ってからはあまり勉強せず、現在の生活で英語を用いることはほとんどない。
大学でフランス哲学を専攻していたので、フランス語は今でもたまに読む。
何か読みたいという気持ちはある。だけど、そう思っていながら、読めていない。
何を読むべきなのか。それが知りたい。
学生の頃に課題でジョージ・オーウェルの『動物農場』を原書で読んだ(あと、哲学の講読でマーサ・ヌスバウムの論文を読んだ)。
映画版にハマり、アーサー・C・クラークの『2001年宇宙の旅』を読んだ。
大学卒業後は、高畑勲のアニメにハマり、『赤毛のアン』を読んだ。
私が読んだことのある英語の本はこの4冊だけだ。
それも、グレタの演説集以外は、日本語の訳書と英和辞典を横に置きながら読んだのである。
また、関心のある国際ニュースで日本語の報道が少ない場合は、ガーディアンやアルジャジーラなどの記事を検索して読む。
しかし、これも一ヶ月に一度くらいの頻度にすぎない。
私のような「それなりに読書家だが、英語力はそこそこの日本人」は、はたして英語で何を読むのか。
何を読むべきなのか。それが知りたい。
よほど面白いとあらかじめ期待できるなら別だが、そうでないなら辞書に首っ引きで洋書を読むのはつらい。
その一方で、日本語訳のある洋書は、邦訳を読めば大概はそれで満足してしまう。
『シャーロック・ホームズ』を読んだ友人もいるし、ラヴクラフトを読んでいる友人もいる。
しかし私は『ハリー・ポッター』にせよ『シャーロック・ホームズ』にせよラヴクラフトにせよ……あるいはシェイクスピアにせよメルヴィルにせよフォークナーにせよ……邦訳で読んだら、それで満足してしまった。
邦訳を読んで、原書「も」読みたくなるような英米文学にはほとんど出会わない。
私のような「それなりに読書家だが、英語力はそこそこの日本人」は、はたして英語で何を読むのか。
何を読むべきなのか。それが知りたい。
本当に知的な知的産業の生成物は、もはや知的労働者何億人分にもなる時代。(バカなチャットボット信者を皮肉ってる。バカには分からないだろうから、ここに明言しておく。)エーアイを買い占めてエーアイに労働させれば自国民は必要ない。自国民の放棄という画期的な、しかし現在進行系で行われている肌馴染みのある手法によって、ハイパーインフレーションの主な症状である自国民の自国通貨での決済に困難が生じるという問題を解決する。
この案に必要なのが、国民に蔓延る諦観、国民の武装を妨げる法理、高い信用を持つ自国通貨である。
そして何よりも保身と根回しとやらしか能のない政治主体(この語は本邦においては、過半数をギリギリ超える投票率によって成り立つボンクラの集団を指すのみである)はこの無鉄砲な艦砲射撃を加速させる。
エーアイ時代の国民に必要なのは辞書か、あるいはまったく逆に、竹槍である。
第三次世界大戦中である、は戦争の恐怖を煽っている。しかし、先進国においては戦争は起こらず、武力衝突なしに平和的に解決する、というのも平和の無警戒を煽っている。