Movatterモバイル変換


[0]ホーム

URL:


きしだのHatena

NVIDIAから新しいモデル、Nemotron 3 Nanoが出ていました。30BのMoEでアクティブパラメータは3B。つまり30B-A3Bです。 試してみたら、かなり賢いんだけど、コーディングの長いやりとりをしてたら過去のコードをうろ覚えになってて変な挙動をしてました。 ど…

はてなブックマーク - NVIDIAのLLM、Nemotron 3 Nanoは賢いけどコーディングには向かないかも。Mamba 2の特性が悪く出てる?

LLMにやさしいSui言語が話題だった。 で、「ヤサシクナイヨ」とか書いてたのだけど、それならSui言語にやさしいLLMを作ってみるのはどうか。 LLMにやさしい言語SuiはLLMにやさしくなさそう - きしだのHatena まあ、ファインチューンという金槌を持ってウロウ…

はてなブックマーク - LLMにやさしいSui言語にやさしいLLMを作る

GLM 4.6Vが出てるのでMLXの4bit版を試してみました。 106BのMoEでアクティブパラメータは12B。画像や動画に対応しています。画像エンコーダーもあるので全体では108B。 ライセンスはMIT。 zai-org/GLM-4.6V · Hugging Face GLM-4.6V: Open Source Multimodal…

はてなブックマーク - Z.aiの新しい画像言語モデルGLM 4.6Vよさそう

LLMにやさしい言語という謳い文句の言語、Suiが話題。 けどこれ、LLMにあまりやさしくなんじゃなかろうか。 https://github.com/TakatoHonda/sui-lang 9月にこういうエントリを書いてます。 AI専用のプログラミング言語は現れない - きしだのHatena ここで理…

はてなブックマーク - LLMにやさしい言語SuiはLLMにやさしくなさそう

昨日、Mistral 3シリーズがリリースされました。モデルは675BのMistral 3 Largeと、3B、8B、14Bという手ごろなサイズのMinistral 3です。このMinistral 3でコーディングや画像認識、3Bモデルのファインチューニングを試してみました。 そこそこ使えて画像認…

はてなブックマーク - Ministral 3は性能はもう一歩だけど存在が大切。文字読み取り性能は高い

SB Institutionから日本の情報に特化した画像言語モデル、Sarashina-2.2-Vision-3Bが出ていたので試したところ、性能の高さは感じたものの、VRAM 16GBで動かすのがつらかったのでまとめました。 Sarashina2.2-Vision-3B: コンパクトかつ性能が高いVLMの公開 …

はてなブックマーク - Sarashina-2.2-Vision-3Bの文字読み取りがすごい、けどVRAM 16GBではつらい -> 解決。VRAM12GBで使える

下書きにあったものをとりあえず放出。 2023年8月おわりくらいの下書き。無加工なので、組織名などが当時のものになっています。 ココカラ。 LINEのNLP Foundation Devチームから36億パラメータの日本語言語モデルが公開されています。 https://engineering.…

はてなブックマーク - LINEのベース日本語言語モデルを強化学習で対話できるようにして賢さを評価する(過去下書き放出)

情報を右から左に流すだけのIT土管はAIに作れるので、その情報たちから新たな価値を生むのが、ITエンジニアの仕事になるのではないかなと思います。 2004年に広まったWeb 2.0は、CGM(Consumer Generated Media: ユーザー生成コンテンツ)という言葉を生みまし…

はてなブックマーク - IT土管はAIにまかせて、人間は情報に価値をのせよう

Spring AIからはデフォルトでLM Studioに接続できませんが、reactor-netty-httpへのdependencyを追加することで接続できるようになります。 この解決方法です。 https://github.com/spring-projects/spring-ai/issues/2445#issuecomment-3066995797 まずOpen…

はてなブックマーク - Spring AIでLM Studioに接続するにはreactor-netty-httpが必要

Mac Studioを借りたのでいろいろクソデカ言語モデルを試したところ、GLM-4.5-Airがいいなとなってます。 試したモデルこちら。 モデル パラメータ数 アクティブ thinking 画像 時期 URL GPT-oss 120B 120B 5B o x 2025/8 OpenAI hf link Qwen3 235B-A22B-250…

はてなブックマーク - Qwen3、GLM、GPT-ossなどクソデカ言語モデルを試したところGLM-4.5-Airがお気に入り

DeepSeek-OCRの仕組みが面白いので遊んでしまっている。 最初に試したときは、純粋にOCRさせてますね。きれいな心をしている。 画像でテキストをトークン圧縮するDeepSeek-OCRがいろいろすごい - きしだのHatena そして前回はランダムな文字列を読ませて誤認…

はてなブックマーク - DeepSeek-OCRの弱点をつく

DeepSeek-OCRの精度が高くて驚いたところですが、仕組み的にランダムな文字列での認識率がかなり落ちるんではないかと試してみたところ、やっぱりかなり悪かったです。 DeepSeek-OCRについてはこちら。 画像でテキストをトークン圧縮するDeepSeek-OCRがいろ…

はてなブックマーク - DeepSeek-OCRにはランダム文字列が読めない

おとといくらいにDeepSeek-OCRというのが出てました。 https://github.com/deepseek-ai/DeepSeek-OCR ただのOCRじゃなくて、「テキストを画像にしたほうがトークンサイズを小さくできるのでは?」というのをやっていて、テキストを画像にしてトークン化した…

はてなブックマーク - 画像でテキストをトークン圧縮するDeepSeek-OCRがいろいろすごい

2009年に「計算量を具体的に見てみる」という、処理から計算量を視覚化するブログを書いてた。 計算量を具体的に見てみる - きしだのHatena これJava 6時代なので、Java 25で書き直してみた。 より詳しい解説は元ブログのほうを見てください。 O(1) まず基本…

はてなブックマーク - 計算量を具体的に見てみる 2025年版

Javaで、プラットフォームスレッドだとmainメソッドが終わってもスレッド終了を待ってくれるのに、仮想スレッドだとmainスレッドが終わると仮想スレッドの処理が途中でもプロセスが終わるの何でだろうな、と思った話。 こういうコードを動かします。 void ma…

はてなブックマーク - Javaでプラットフォームスレッドだと終了を待ってくれるのに仮想スレッドだと途中でプロセスが終わる

「Javaのコードから画像生成したいな、ローカルで」と思って、どうやらComfyUIだとAPI呼び出しができるようなので、やってみた。 ついでに、Qwen Imageを試したかったので、ここを参考にインストール。 徹底解説:Comfy UI + GGUF Qwen Image / Edit 2509 を…

はてなブックマーク - ComfyUIでQwen ImageやQwen Image Editを動かしてJavaから呼び出す

AIが読むんだから読みやすくする必要はないんでは、という話が流れてきた。 けど、実際にはAIにも読みやすさは大事だと思う。 データ形式によって、そのデータに関する回答精度がどうかわるかという調査がある。 Which Table Format Do LLMs Understand Best…

はてなブックマーク - AIが読み書きするコードも読みやすいほうがいい(トランスフォーマの特性の考慮やリーダブルコードについて追記)

ということで台湾に行ってきたけど、JCConf以外の部分のまとめ 1日目(9/18) まずは初日 8番出口 ごはんを食べようと、西門まで来てみたら、西門駅にはないはずの8號出口という文字が。 行ってみたら、おっさんいた。 裏からみると、こうなってる。おっさんは…

はてなブックマーク - 台湾でJCConf以外にやったこと(8番出口とか故宮博物館とか本屋とか)

9/19に開催された台湾のJavaイベント、JCConf 2025で登壇してきました。 https://jcconf.tw/2025/ その登壇準備でローカルLLMが役にたったのでまとめ。 イベント以外の話はこちら 台湾でJCConf以外にやったこと(8番出口とか故宮博物館とか本屋とか) - きしだ…

はてなブックマーク - 台湾のJavaイベント、JCConf 2025での登壇準備にローカルLLMを活用した話

Claude Sonnet 4が出たときにいろいろゲームを作ってもらっていたのでまとめてみた。 あと、これって著作権どうなるんかなって考えてみる。 あ、ゲームいっぱい作ってると10個目くらいからアイデア枯渇し始めるので、最初に作ろうと思ってたものを作りきって…

はてなブックマーク - Claude Sonnet 4に17個ほどゲームを作ってもらったけど著作権を主張できるのかな

AIが賢くなると、AIにわかりやすく人間には理解困難なプログラミング言語が出てくるのでは、みたいな話をよく聞きます。 ただ、次の点から、AI専用の言語は現れないだろうなと思います。 意味の記述が必要であることに変わりはない すでにAIは独自の言語を持…

はてなブックマーク - AI専用のプログラミング言語は現れない

子ども向けの説明するモデルに賢さはあまり必要ないという話が流れてきて、ちょっと「あれ?」ってなった。 さらに、答えを直接ださずに考えを導くとあって、それってかなり性能が高いモデル能力を要求するんではと思った。 子ども向けの説明で大事なことは…

はてなブックマーク - 子ども向けの説明するLLMモデルに賢さは必要ない、のか?

JCConf 2025で台湾に行ってて、終わったあと主催者でもある台湾人同僚の人とビールを飲みながら、「中国語はAIが翻訳してくれるから、来年は中国語プレゼンにチャレンジする!」などというと、発音はどうするの?と聞かれたので「なんか出してくれるんでは?…

はてなブックマーク - GPT-ossを使って中国語翻訳しつつピン音で発音をつける

Java 25ではSoundClipで手軽に音声ファイルの再生ができるようになっています。 SoundClip (Java SE 25 & JDK 25) で、ゲームに効果音をつけてみると、なんかそれっぽくなりました。 Java 25のSoundClipで効果音をつけたら、なんかちゃんとしたゲームっぽく…

はてなブックマーク - Java 25のSoundClipでゲームに効果音をつける

Java 25が昨日9/16にリリースされています。新機能まとめはこちらです。 Java 25新機能まとめ #OpenJDK - Qiita その中で、javax.sound.SoundClipというクラスが新設されています。 次のようにしてWAVファイルを再生できます。 var file = new File("sound.w…

はてなブックマーク - Java 25でMP3を再生する

PLaMo翻訳のGGUFをmmngaさんが公開されています。 https://huggingface.co/mmnga/plamo-2-translate-gguf PLaMo翻訳のプロンプトは次のような指定をする必要があります。 <|plamo:op|>dataset translation <|plamo:op|>input lang=English Write the text to…

はてなブックマーク - PLaMo翻訳をLM Studioで翻訳APIサーバーにする

Liquid AIから350Mという軽量な日英翻訳モデルが出ていました。 https://huggingface.co/LiquidAI/LFM2-350M-ENJP-MT GGUFも提供されていたのでLM Studioで試すと、普通に使えた。 めちゃいいというわけではないけど、手元で軽量に動かせることを考えると悪…

はてなブックマーク - Liquid AIの日英翻訳LLMでパワポを自動英訳する

AIとやりとりしてると、こんな感じでさっきのバグを再現してしまって「アホか!」って暴言吐きたくなることありますね。 で、このエントリのときに、こういうチャットは捨てて やりなおしたほうがいいと書きました。 AIに激詰めしてしまうのはAIだからじゃな…

はてなブックマーク - なぜ一度失敗したAIとの会話は打ち切るほうがいいのか

AIコーディングエージェントが100倍速くなるエントリに、10000tok/secとTDDとがあればコーディングはガチャになるというブックマークコメントがありました。 AIコーディングエージェントは100倍速くなる - きしだのHatena LLMはじめとした機械学習は、よりよ…

はてなブックマーク - AIに得意かどうかはユニットテストが書きやすいかどうかで判別できる

AIプログラムの開発、つまり、AIにコードを書かせるのではなくて、LLMを呼び出したりRAGを実装したりエージェントを作ったりといったAIを組み込むプログラミングの演習をしたいときに、参加者のPCに十分なリソースを前提とできないことは多いと思います。 Ja…

はてなブックマーク - AIプログラムの開発演習に使う低消費リソースローカルLLMはQwen3 1.7B Q4がベスト
検索

引用をストックしました

引用するにはまずログインしてください

引用をストックできませんでした。再度お試しください

限定公開記事のため引用できません。

読者です読者をやめる読者になる読者になる

[8]ページ先頭

©2009-2025 Movatter.jp