Movatterモバイル変換


[0]ホーム

URL:


はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマーク
  • テクノロジー
  • GPUメモリ4GBあればGPT-oss 20Bが14tok/secで動く - きしだのHatena
  • Twitterでシェア
  • Facebookでシェア

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されますhttps://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

91usersがブックマークコメント8

    ガイドラインをご確認の上、良識あるコメントにご協力ください

    0/0
    入力したタグを追加

    現在プライベートモードです設定を変更する

    おすすめタグタグについて

      よく使うタグ

        GPUメモリ4GBあればGPT-oss 20Bが14tok/secで動く - きしだのHatena

        ガイドラインをご確認の上、良識あるコメントにご協力ください

        0/0
        入力したタグを追加

        現在プライベートモードです設定を変更する

        おすすめタグタグについて

          よく使うタグ

            はてなブックマーク

            はてなブックマークで
            関心をシェアしよう

            みんなの興味と感想が集まることで
            新しい発見や、深堀りがもっと楽しく

            ユーザー登録

            アカウントをお持ちの方はログインページ

            記事へのコメント8

            • 注目コメント
            • 新着コメント
            Kesin
            自分も試して32GBや64GBあれば最新世代の軽量版モデルを量子化したものが動くことに感動しつつ、結局OpenRouterなどを使った方がそこそこ安く圧倒的に速いので実用性があるかと言われたら趣味だとは思う

            その他
            misshiki
            “llama.cppにMoEに適したCPU/GPUの振り分けのオプションが入って、LM Studioでもそのオプションに対応したことによって、MoEモデルであるGPT-ossが少ないGPUメモリでもそれなりに動くようになりました。”

            その他
            kojikoji75
            “MoEモデルであるGPT-ossが少ないGPUメモリでもそれなりに動くようになりました。”

              その他
              boxshiitake
              GPT-OSS 20BならOpenRouterで無料で使えるんだよな

                その他
                Imamura
                ローカルで動かしたくなった時用にブクマ

                その他
                Kesin
                Kesin自分も試して32GBや64GBあれば最新世代の軽量版モデルを量子化したものが動くことに感動しつつ、結局OpenRouterなどを使った方がそこそこ安く圧倒的に速いので実用性があるかと言われたら趣味だとは思う

                2025/08/14リンク

                その他
                shigekaz00
                “LM Studio”

                その他
                misshiki
                misshiki“llama.cppにMoEに適したCPU/GPUの振り分けのオプションが入って、LM Studioでもそのオプションに対応したことによって、MoEモデルであるGPT-ossが少ないGPUメモリでもそれなりに動くようになりました。”

                2025/08/14リンク

                その他
                osakana110
                “MoEモデルであるGPT-ossが少ないGPUメモリでもそれなりに動くようになりました。拡大するとわかりますが、LM Studioの右下の表示によると、メインメモリは12GBくらい使います。”

                  その他
                  kei_1010
                  試したい

                    その他

                    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

                    リンクを埋め込む

                    以下のコードをコピーしてサイトに埋め込むことができます

                    プレビュー
                    アプリのスクリーンショット
                    いまの話題をアプリでチェック!
                    • バナー広告なし
                    • ミュート機能あり
                    • ダークモード搭載
                    アプリをダウンロード

                    関連記事

                      usersに達しました!

                      さんが1番目にブックマークした記事「GPUメモリ4GBあれ...」が注目されています。

                      気持ちをシェアしよう

                      ツイートする

                      GPUメモリ4GBあればGPT-oss 20Bが14tok/secで動く - きしだのHatena

                      llama.cppにMoEに適したCPU/GPUの振り分けのオプションが入って、LM Studioでもそのオプションに対応し...llama.cppにMoEに適したCPU/GPUの振り分けのオプションが入って、LM Studioでもそのオプションに対応したことによって、MoEモデルであるGPT-ossが少ないGPUメモリでもそれなりに動くようになりました。拡大するとわかりますが、LM Studioの右下の表示によると、メインメモリは12GBくらい使います。 14tok/sec出ています。CPUだけで動かすと10tok/secだったので、5割マシですね。 0.3.23.0に「Force Model Expert weight ontoCPU」というスイッチが入っているので、これをOnにするとExpertのウェイトがすべてCPUに乗るようになります。アテンションはGPUで。 詳しくはリリースノートにありますが、llama.cppの--n-cpu-moeの仕組みを使ってるとのこと。 https://lmstudio.a

                      ブックマークしたユーザー

                      • R2M2025/09/15R2M
                      • naggg2025/09/13naggg
                      • nunkadelic2025/08/25nunkadelic
                      • flying-cat2025/08/22flying-cat
                      • e10kg2025/08/18e10kg
                      • mtr80802025/08/17mtr8080
                      • timetrain2025/08/17timetrain
                      • lugecy2025/08/17lugecy
                      • skton_hate2025/08/16skton_hate
                      • tamasaburou19822025/08/16tamasaburou1982
                      • asa_kaz_x2025/08/15asa_kaz_x
                      • midas365452025/08/15midas36545
                      • kojikoji752025/08/15kojikoji75
                      • jamalen2025/08/15jamalen
                      • Tora20132025/08/15Tora2013
                      • mikage0142025/08/15mikage014
                      • boxshiitake2025/08/15boxshiitake
                      • minamijoyo2025/08/15minamijoyo
                      すべてのユーザーの
                      詳細を表示します

                      ブックマークしたすべてのユーザー

                      同じサイトの新着

                      同じサイトの新着をもっと読む

                      いま人気の記事

                      いま人気の記事をもっと読む

                      いま人気の記事 - テクノロジー

                      いま人気の記事 - テクノロジーをもっと読む

                      新着記事 - テクノロジー

                      新着記事 - テクノロジーをもっと読む

                      同時期にブックマークされた記事

                      いま人気の記事 - 企業メディア

                      企業メディアをもっと読む

                      はてなブックマーク

                      公式Twitter

                      はてなのサービス

                      • App Storeからダウンロード
                      • Google Playで手に入れよう
                      Copyright © 2005-2025Hatena. All Rights Reserved.
                      設定を変更しましたx

                      [8]ページ先頭

                      ©2009-2025 Movatter.jp