序文 しばらく前から、プログラマーを対象とした圏論に関する本を書こうと考えていた。計算機科学者ではなくプログラマー、科学者ではなくエンジニア向けだということに注目してほしい。正気の沙汰ではないし、本当に恐ろしい。科学と工学の間に大きなギャップがあるのは否定できないと思う。自分自身がその分断の両側で仕事をしてきたからだ。それでも、物事を説明したいという強い衝動をいつも感じていた。簡潔な説明の達人だったリチャード・ファインマン1を心から尊敬している。自分がファインマンではないことは分かっているが、最善を尽くしたい。まずは、この序文――読者に圏論を学ぶ気を起こさせることを想定したもの――を公開することから始めようと思う。それによって議論を開始しフィードバックを募れることを願っている2。 ここからの数段落をかけて、この本はあなたのために書かれたものであり、数学のうちでも特に抽象的な分野を学ぶために
2000字を超えた記事なので結論を先に書く。 パラオ語の25%が日本語由来という話の信頼できる情報源は見つからず,辞書の単語をいろいろな方法で数えても4〜10%程度だよ 日経新聞(2025年8月16日)に次の記事があった。 記事には「パラオ語の4分の1は日本語由来」と書かれているが,記事全文を読んでも根拠だとはっきり分かることはひとつも書いてなかった。関連することで書いてあるのは「現地の辞書に日本語由来のパラオ語が1000語ほどある」ことで,パラオ語全体が4000語なはずもないので,おそらく違うだろう。ちなみにこの「現地の辞書」もこれだけでは分からない。例えば今村圭介さんが作成した「パラオ語における日本語借用語辞典」にはパラオ語にある日本語からの借用語が1000語ほど入っているが,「現地の辞書」ではないだろうからこの話とは合わせられない。 そもそも「ある言語の単語が全部で何語あるか」は思っ

言語化することの弊害「感情を言語化する習慣を通じて、物事を受け入れられるようになってきた」というメリットについても、逆の作用を感じはじめました。 たしかにあいまいな感情は言語化することで、固定され、整理できます。しかし、逆にいうと感情は言語化した途端、自分のなかでそういうものとして固定されてしまいます。 「こんな気がする」を言葉にしていくうちに、いつしか「自分はこう感じている」「自分の感じている感情はこうだ」と、最初は漠然と感じていたニュアンスもいつの間にか確信に変わっているのです。 ポジティブな感情であれば良いかもしれませんが、それが悩み相談のようなネガティブな感情であったらどうでしょう? 私は言語化を続けるうちに、ふと負のロジックが強化され、加速していることに気づきました。 これがただメモ帳に考えを書きつけているだけであれば、すぐに飽きて終わるものなのですが、AIに相談しているとレスポ

記事とは無関係な眠るパンダの様子AI・機械学習チームの髙橋です。このブログはAI・機械学習チームブログリレー6日目の記事です。 ここ半年ほどでCopilot→Cline→Claude CodeとAIコーディングツールを乗り換えています。Claude Codeは工夫せずとも高い実装力を発揮してくれますが、特にCustom Slash Commandが非常に便利で、どこまでコーディングを自動化できるのか試行錯誤しています。 さて、Claude Codeの根幹には大規模言語モデル(LLM)があり、その基礎となる事前学習のアイデアは、それまでの文脈に基づいて次の文字(トークン)が何であるかモデルに推測させることです。この推測を通じてモデルは言語の文法的な構造や知識を獲得し、更にRLHF等を通じた学習をすることで、人が求める応答が生成できるようになります。 実はこうした、次の文字を予測する枠組みが

以前は「吊るす」の「吊」という字は「とむらう」とも読めたはずだが、今の辞書には載っていない。実際に「とむらう」と読めることが確認できる辞書が見たい。 (資料1)配架中の資料『大漢和辞典』(諸橋 轍次/著 大修館書店 813.2/モ/2 資料ID:0012311999)で「吊」を調べる。 P811…「吊」 テウ 弔の俗字。 俗字として「弔」はあったが、「吊」を「とむらう」と読めることは確認できなかった。 (資料2)「俗字」とは何かを検索。大修館書店が情報提供する漢字文化資料館より、 ーーーーーーーーーーーーーーーーーーーーー以下、引用 始まりーーーーーーーーーーーーーーーーーーーーー 主に世間一般で用いられてきたとされる異体字のことを「俗字」と言います。 つまり、俗字とは、その字体が用いられる場面によって異体字を分類した場合のカテゴリーだといえます。 ーーーーーーーーーーーーーーーーーーーー

えどきた @higonohirokun 今月いっぱいで新聞配達のバイト辞めて江戸を発つんだけど、自分の後釜に入ったベトナム人を指導して独り立ちさせようと奮闘している中で気付いたこと書くね。 よく技能実習生とか留学生が途中で 失踪して不法滞在して犯罪に手を染める理由が何となくわかった。 (それは肯定してないんで悪しからず) 2024-10-18 20:38:24 えどきた @higonohirokun ちなみに今俺が指導してるのは N4レベル(N1がトップレベルなんで 英検4級みたいなもんかと)で 翻訳アプリ使わんと小学生低学年か幼稚園年長さんくらいの会話しか出来ないのが現状。 (🇯🇵人の子供は生まれてから ずっと家庭で園で🇯🇵語を見聞きして過ごしてるからむしろこの人よりも全然話が通じる) 2024-10-18 20:38:25 えどきた @higonohirokun 自分に置き換え

大規模言語モデル(LLM)をベースにしたAIは高い能力を発揮できる一方で、ウソにダマされやすいといった特徴があったり、算数の文章題への推論能力が小学生未満という研究結果があったりと、脆弱(ぜいじゃく)さについてもしばしば指摘されます。AIの能力の限界を示す「ストロベリー問題」という脆弱性について、機械学習エンジニアのチンメイ・ジョグ氏が解説しています。 The 'strawberrry' problem: How to overcomeAI's limitations | VentureBeat https://venturebeat.com/ai/the-strawberrry-problem-how-to-overcome-ais-limitations/ChatGPTやStable DiffusionなどのジェネレーティブAIは、高度な文章やコードを書けたり、イラストやリアルな画

生成AIに疑似コードで指示すると自然言語よりも効率的にプログラムが生成できるというアイデアから生まれた、生成AI用の疑似言語「SudoLang」ChatGPTやCopilotなどの生成AIを用いてコードを生成しようとすると、多くの場合プロンプトを自然言語で書くことになるでしょう。 しかし自然言語で的確にプログラムの内容を表現するのは、ときに面倒だったり、あいまいさを排除することが難しかったりします。 一方で、プログラマが自分でコードを書こうとするとき、あるいは他のプログラマとコードの内容を議論するときに、自然言語をプログラミング言語のような構文で書く、いわゆる「擬似コード」を使うことがよくあります。 例えばこんな風に自然言語をコードっぽくホワイトボードに書いたことのあるプログラマの方は多いのではないでしょうか? 入力値を処理するための関数(A、B){ Aは数字かどうか確認する Bは日付か

様々な会社に訪問していると、それなりの頻度で「言語化が苦手な人」に遭遇する。 例えばこんな具合だ。 「プロジェクトの基本要件を一つにまとめてマネジメントしたいんだけど。 例えば、一部のプロジェクトで必要なリソースを最初に一つの大きな枠組みで決めて、それを全部に使う、そんな感じ。」 「言葉にできてるじゃない」と思う方もいるかも知れない。 だが、本当に言語化の苦手な人とは、「言葉にはできているのに、その内容が、他の人にとって難解過ぎる人」なのだ。 「言葉が出てこない」 「説明しにくい」 「なんと言えばいいのか迷う」 というのは、実は「言語の苦手な人」よりもかなりマシである。 なぜならば、「言語化できていない」という認識を自分自身で持てるからだ。 それに対して、真に言語化の苦手な人は、自分自身で「言語化が苦手」と気づいていない可能性が高い。 前職にもこんな人がいたが、 「あの人、あたまが良すぎて

「Python」や「JavaScript」が学ばれるようになるずっと前、米国時間1964年5月1日の夜明け前の暗闇の中で、コンピューター史におけるささやかながら非常に重要な出来事がダートマス大学で幕を開けた。数学者のJohn G. Kemeny氏とThomas E. Kurtz氏がGeneral Electricの「GE-225」メインフレームを操作して、独自に考案した言語の最初のプログラムを実行した。その言語こそ、初心者向け汎用記号命令コード、すなわち「BASIC」だ。 BASICは最初に普及した言語ではない。その栄誉を得たのは、ビジネス分野では「COBOL」、エンジニアリング分野では「FORTRAN」だった。しかし、1960年代半ばから1980年代初頭までは、コンピュータープログラミングの初心者の多くが最初にBASICを学んでいた。 コンピューティングが縁遠く、少々難解な分野だった世代

テーマは「動的型付け言語と大規模開発」まつもとゆきひろ氏:まつもとゆきひろです。Matzチャンネル17回目ということでお送りします。ちょっと前になりますが9月28日に私が技術顧問を始めたクラウドサーカスという会社さんがテックイベントを開催されて、その時のテーマが「動的型付け言語と大規模開発」というテーマでした。 その時に話したこととか、話そうとしたこと、話そうと思っていたんだけど時間の関係で話せなかったことなどを補足する意味も含めて今日はちょっと放送しようかと思います。というか、分量が多いので2回に分けて話そうかなと思っています。 このクラウドサーカスのイベントのテーマは別に私から指定したわけではなくて、先方が「こんなテーマで話したいんだ」とか「聞きたいんですけど」ということで設定されたんですね。 「動的型付け言語と大規模開発」。例えばRubyとか、Ruby onRailsとかで開発をし

インタープリターを書いたことがない方向けに、四則演算といった簡単なものから始め、少しずつ機能を足しながら言語を拡張していくような本です。

今回は、高専5年次から趣味で学習していたRISC-Vを実装した、簡単なCPU作成をしていこうと思います。 完全に知識ゼロの状態から学び始めたので、間違った解釈をしている部分があるかもしれませんが、その時は優しく指摘していただけると嬉しいです 🙏 また、本ブログはディジタル回路設計とコンピュータアーキテクチャ[RISC-V版]を基に書かれています。初心者でも理解しやすいように丁寧に解説されているので、興味があれば是非買ってみてください!RISC-VってなんぞRISC-V公式サイトには以下のように書かれています。RISC-V is an open standard Instruction Set Architecture (ISA) enabling a new era of processor innovation through open collaboration. (RISC-

『Toki Pona Island』は2Dアドベンチャーゲームだ。テレポーテーションに失敗した主人公は、トキポナ語しか話されていない不思議な南国の島で目を覚ます。プレイヤーは主人公を通じてトキポナ語を学び島民と交流しつつ、帰る方法を探すことになる。本作で扱われているトキポナ語は、実在する人工言語だ。2001年にカナダ在住の言語学者・翻訳家のSonja Lang氏が作成し、ネットに公開したことで知られるようになった。シンプルさを追求して作られたとされるトキポナ語は、トキポナ公式サイトによると誕生時点では120の単語のみ存在。現在でも必須単語は137個のみと少なく、比較的習得が容易な言語とされる。世界に数千人の話者がいるといい、しっかり愛好家が存在している。本作ではそんなトキポナ語のみが話されている島を舞台に、冒険を繰り広げる。島民とコミュニケーションをとるためには、プレイヤー自身がトキポ

2014年から先端テクノロジーの研究を論文単位で記事にして紹介しているWebメディアのSeamless(シームレス)を運営し、執筆しています。 1週間分の生成AI関連論文の中から重要なものをピックアップし、解説をする連載です。2024年初っ端の第27回目は、「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など、大規模言語モデルの返答が向上する「プロンプト26の原則」をはじめとする5つの論文をお届けします。 生成AI論文ピックアップ複数の自律AIエージェントが過去の経験を共有して未知のタスクを処理するモデル「Experiential Co-Learning」> 画像から動く3Dシーンを生成する新モデル「DreamGaussian4D」 大規模言語モデルの返答が向上する「プロンプト26の原則」が公開。「礼儀は不要」「モデルに質問させる」「良い解答には報酬」など 220以上の生成タスクが

リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く