Movatterモバイル変換


[0]ホーム

URL:


はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

  • はてなブックマーク
  • テクノロジー
  • CPUが得意なことをCPUにまかせて少ないVRAMでも大きめのLLMを速く動かす - きしだのHatena
  • Twitterでシェア
  • Facebookでシェア

気に入った記事をブックマーク

  • 気に入った記事を保存できます
    保存した記事の一覧は、はてなブックマークで確認・編集ができます
  • 記事を読んだ感想やメモを書き残せます
  • 非公開でブックマークすることもできます
適切な情報に変更

エントリーの編集

loading...

エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。

タイトルガイドライン

このページのオーナーなので以下のアクションを実行できます

タイトル、本文などの情報を
再取得することができます
コメントを非表示にできますコメント表示の設定

ブックマークしました

ここにツイート内容が記載されますhttps://b.hatena.ne.jp/URLはspanで囲んでください

Twitterで共有

ONにすると、次回以降このダイアログを飛ばしてTwitterに遷移します

137usersがブックマークコメント6

    ガイドラインをご確認の上、良識あるコメントにご協力ください

    0/0
    入力したタグを追加

    現在プライベートモードです設定を変更する

    おすすめタグタグについて

      よく使うタグ

        CPUが得意なことをCPUにまかせて少ないVRAMでも大きめのLLMを速く動かす - きしだのHatena

        ガイドラインをご確認の上、良識あるコメントにご協力ください

        0/0
        入力したタグを追加

        現在プライベートモードです設定を変更する

        おすすめタグタグについて

          よく使うタグ

            はてなブックマーク

            はてなブックマークで
            関心をシェアしよう

            みんなの興味と感想が集まることで
            新しい発見や、深堀りがもっと楽しく

            ユーザー登録

            アカウントをお持ちの方はログインページ

            記事へのコメント6

            • 注目コメント
            • 新着コメント
            khtokage
            どの処理部分をどのハードウェアに割り当てるか。3Dなんかでは長年掛けて最適化されてきたことだけど、AIもそういう時代だし、爆速で進むんでしょうね。

              その他
              qpci32siekqd
              CPU-GPU間、CPU-メモリ間、どこも通信帯域足りてないのでハードから変わらん限り厳しい気がする

                その他
                zgmf-x20a
                これは参考になる。ただ、そのレベルのコーディングするかというとしないけどね…その点でも、Apple M4とかevo-x2に望みが行くのか…

                  その他
                  yarumato
                  “12%速くなりましたね。強いCPUならもっと効果が出ると思います。”

                    その他
                    Kukri
                    まだまだ構造的な非効率は残ってるよな

                      その他
                      pascal256
                      良さそう。NPUとかも今後含まれて上手く協調するようになるのかな?

                        その他
                        qpci32siekqd
                        qpci32siekqdCPU-GPU間、CPU-メモリ間、どこも通信帯域足りてないのでハードから変わらん限り厳しい気がする

                          2025/05/13リンク

                          その他
                          khtokage
                          khtokageどの処理部分をどのハードウェアに割り当てるか。3Dなんかでは長年掛けて最適化されてきたことだけど、AIもそういう時代だし、爆速で進むんでしょうね。

                            2025/05/13リンク

                            その他

                            注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

                            リンクを埋め込む

                            以下のコードをコピーしてサイトに埋め込むことができます

                            プレビュー
                            アプリのスクリーンショット
                            いまの話題をアプリでチェック!
                            • バナー広告なし
                            • ミュート機能あり
                            • ダークモード搭載
                            アプリをダウンロード

                            関連記事

                              usersに達しました!

                              さんが1番目にブックマークした記事「CPUが得意なことを...」が注目されています。

                              気持ちをシェアしよう

                              ツイートする

                              CPUが得意なことをCPUにまかせて少ないVRAMでも大きめのLLMを速く動かす - きしだのHatena

                              Redditに「VRAM足りないとき一部のレイヤーをCPUに任せるんではなく、レイヤー全部をGPUに載せてレイヤ...Redditに「VRAM足りないとき一部のレイヤーをCPUに任せるんではなく、レイヤー全部をGPUに載せてレイヤー内部のFFNだけCPUに持っていったら速くなった、なんでこれが標準じゃないんだ」というのがあったので、おうちのRTX 4060 Ti 16GBで試してみたら微妙に速くなりました。 https://www.reddit.com/r/LocalLLaMA/comments/1ki7tg7/dont_offload_gguf_layers_offload_tensors_200_gen/ Qwen3 30B A3Bで試してみる こういった指定がOllamaやLM Studioではできないので、今回はKoboldCPPというので試してます。 https://github.com/LostRuins/koboldcpp KoboldCPPでは実用が厳しいので、llama.cppで試すほう

                              ブックマークしたユーザー

                              • heatman2025/06/12heatman
                              • knj29182025/05/23knj2918
                              • einherjar2025/05/21einherjar
                              • idk2025/05/20idk
                              • quesit2025/05/19quesit
                              • lugecy2025/05/18lugecy
                              • karkwind2025/05/16karkwind
                              • latteru2025/05/15latteru
                              • midas365452025/05/14midas36545
                              • e10kg2025/05/14e10kg
                              • sora05132025/05/14sora0513
                              • peltier2025/05/14peltier
                              • syuu2562025/05/13syuu256
                              • osakana1102025/05/13osakana110
                              • harumomo20062025/05/13harumomo2006
                              • bython-chogo2025/05/13bython-chogo
                              • Tiantian2025/05/13Tiantian
                              • aont2025/05/13aont
                              すべてのユーザーの
                              詳細を表示します

                              ブックマークしたすべてのユーザー

                              同じサイトの新着

                              同じサイトの新着をもっと読む

                              いま人気の記事

                              いま人気の記事をもっと読む

                              いま人気の記事 - テクノロジー

                              いま人気の記事 - テクノロジーをもっと読む

                              新着記事 - テクノロジー

                              新着記事 - テクノロジーをもっと読む

                              同時期にブックマークされた記事

                              いま人気の記事 - 企業メディア

                              企業メディアをもっと読む

                              はてなブックマーク

                              公式Twitter

                              はてなのサービス

                              • App Storeからダウンロード
                              • Google Playで手に入れよう
                              Copyright © 2005-2025Hatena. All Rights Reserved.
                              設定を変更しましたx

                              [8]ページ先頭

                              ©2009-2025 Movatter.jp