8月19日現在、Googleが公式に公開した「Prompt Engineering」と題するホワイトペーパーが、再び大きな注目を集めている。Google公式のホワイトペーパーとは このホワイトペーパーは2024年9月にKaggleを通じて公開されたもので、著者はGoogleのLee Boonstra氏である。内容は、LLMに対する入力(プロンプト)設計を体系的に解説するもので、以下のような要素を含んでいる。 プロンプト設計の基礎 モデルの特性や学習データ、生成パラメータ(例:temperature)、語彙選択、文体やトーン、構造、コンテキストといった要素が出力の質に直結することを解説。 多様なプロンプト技法 Zero-shot、Few-shot、Chain of Thought(CoT)、Self-Consistency、Tree of Thoughts、ReAct、Automatic

アリババの動画生成モデル「Wan2.2 14B」i2vを使い、明日来子さん(この連載によく登場する作例キャラクター)に銃を構えさせた動画の一部(筆者作成) 7月28日に公開された中国・アリババの動画生成AIモデル「Wan2.2」がすさまじい性能を発揮しています。ローカルPC環境で利用できるオープンモデルとして公開されましたが、ヘタな商用AIクラウドサービスを超えていると感じさせるほど、高品質なAI動画が生成可能です。2月リリースの「Wan2.1」でも高い評価を得ていましたが、それを遥かに超えており、業界を席巻しそうな雰囲気を感じました。 ※記事配信先の設定によっては図版や動画等が正しく表示されないことがあります。その場合はASCII.jpをご覧ください 実写もアニメも高性能 Wan2.2の性能の高さは触れば触るほどわかってきます。カップ麺、箸、麺など、複数のオブジェクトが関わるため、画像や

この記事は間違いが含まれている可能性があります。 もともと自社のドキュメントではMeilisearch で日本語全文検索を実現していましたが、ドキュメントに質問できるようしたいと思い、簡単な RAG を作りたい!と思っていました。 とりあえず、ドキュメントを分割し、ベクトル化してベクトルデータベースに突っ込んで、質問をベクトル化して結果を引っ張り、それを LLM に食べさせて解説させる、というのができればよいということがわかりました。 ベクトル化はよく使われているOpenAIEmbeddingsAPI を利用し、ベクトルデータベースは普段からよく使っている DuckDB に VSS (VectorSimilarity Search for DuckDB) という拡張を使うことにしました。 自社のドキュメントをなんとかうまいこと分割して、あとは分割したドキュメントをAPI を叩い

はじめに「DeepSeek-R1」がすごいと評判になっています。 今回は「DeepSeek-R1」を使って蒸留したQwenをさらに8bitに量子化した軽量なものをOllamaを使ってローカル環境で動かしてみました。 実際に使ったのは「deepseek-r1:14b-qwen-distill-q8_0 (15GB)」です。使用したPC プロセッサ Intel(R) Core(TM) i7-12700H 実装 RAM 32.0 GBGPU RTX 3080 Laptop (VRAM 16GB) 質問以下の質問を投げかけてみました。過去に自分が悩まされた問題です。 「9 9 9 9」という4桁の数字があります。数字と数字の間に四則演算の記号を追加して計算結果が10になるようにして下さい。 数字と数字の間に少数点を追加することは禁止されています。 隣あう数字をまとめて2桁以上の数字とみなすことは
タイトルについてだが、これは「R1は米国の輸出規制が無ければ開発しえなかった。つまり輸出規制は逆効果だ!」という事をアメリカに(そして全世界に)喧伝する為だったのでは?という考察。 なぜなら米国の輸出規制のおかげでdeepseekは安くて性能の低いチップを使うしかなく、結果的に中間命令セットであるPTXを使用するしか無くなって、その方向で学習効率を上げようと努力したからだ。そして低コストでo1に匹敵するモデルを開発するに至った。 OSSとして発表する事でこの事実に説得力が生まれるし、また世界の注目も集めやすいと思える。(もちろん世界中でこの方向性で研究開発が進んでその成果を自分達も利用したい、という事も大きいとは思うがそれはOSSでは当たり前なので割愛) ただしPTX(Parallel Thread Execution)はNVIDIA用のチップ向けに開発されたものなので依然としてNVIDI
sponsored SAISONTechnology Days 2025で「ERPのモダン化」をテーマにしたパネル開催 ERPの課題、解決できる 国産ベンダー5社が語る「オフロード」は絵に描いた餅じゃない sponsored 「be quiet!」はブランド名というだけじゃない、哲学そのものだ! ゲーミング生活を静かに充実させる製品を確かめてくれ sponsored ビデオ会議や動画再生、画像生成も! 高性能・長時間駆動によって変わる、Snapdragon X搭載のビジネスノートPC新常識 sponsored 10月11日(土)13時から、秋葉原の「LIFORK AKIHABARA II」で開催! 高性能と安心を兼ね備えるインバースネットの新ブランド「FREX∀R」登場! 最新ゲーミングPCの実力を体験すべし sponsored Backlogの機能をフル活用して、短時間で効率的な会議を

OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」って思っちゃったわけです。 ということで、今回はChatGPT-4oを使ってOCRを使うとどんなもんなのかやってみたいと思います。 やりたいこと やってみる とりあえずやってみる 請求書 名刺 参考文献 感想 やりたいこと 今回やりたいことはOCRです。早い話が画像ファイルを突っ込んでテキストを読み取りたいって感じです。 ただ、当たり前のようにOCRって言葉を使用していますがOCRって結構奥が深いです。 mediadrive.jp 単純に画像から文字を見つけて対応するテ

回答 (5件中の1件目) ディープラーニングは昔ニューラルネット(神経回路網)と言われていました。 モデルとなった神経回路網において、神経の結合、処理状態がわかれば考えていることがわかるのか?と言われればそれは無理ですね。これはブラックボックスです。 じゃ、考えていることがわかるようなニューラルネットは作れるかと問われれば、できないと断言はできない。 ちなみに三十年くらい前のAIの主要トピックスは。 エキスパートシステム これは専門家の知識を記述するもので内容はわかります。 ファジーシステム どこ行ったんでしょうね? ニューラルネット でした。

富士通は7月8日、AI(人工知能)を使って新聞などの記事本文を要約するシステムを開発し、企業向けにWebサイト上で試験公開したと発表した。要約したい文章を入力すると、180文字以内と54文字以内の2通りで要約文を作れる。AIを使った自動記事要約システム。開発したのは、入力した記事全文から重要度の高い文章を抽出して文体を変えずに180字以内の要約を作る「重要文抽出システム」と、重要な文章を抽出した上で、言葉の表現を変えて54文字以内の要約を作る「生成型要約機能」の2つ。 重要文抽出システムは、従来のシステムに比べて人手と同等の精度で要約文章を作れるようになったという。生成型要約機能は、約8万件の記事と要約のデータから単語の削除、語順の変更、言い換えを学習したAIが、文中の単語や接続詞などをつなぎ合わせて要約文を作る。 同社は、新聞記事を人力で要約して他のメディアに配信する新聞社やオウンドメ

本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 こんにちは、AI開発部の伊藤です。 今回のブログは、「深層学習はいったい画像のどこを見て判断しているのか」という素朴な疑問に答えてくれる技術として、昨年提唱された「Grad-CAM」という技術を紹介します。 目次 目次 1. はじめに 2. Grad-CAMの紹介 Grad-CAMの仕組み: 3. 適用例 3-1. 画像キャプション生成(Image Captioning) 3-2. VQA(Visual Question Answering) 3-3. 学習用データのバイアス 4. 実施例(お好み焼きとピザを分類) 4-1. 画像データについて: 4-2.CNNの構築: 4-3. Grad-CAMの実装: 4-4. 実施結果の評価お好み焼き画像でCNNの判定が当たっているケース: ピザ

******************************************************* 【お得なマガジンもあります】 セット割で、3000円ほどお得になります。現在、3本のチュートリアルが利用できます。LINE Botの作成を学べるコースです。以下のチュートリアル3点が、セット割で購入することができます。 ・【AIプログラミング】LINEに画像を送ったら自動で文字起こししてくれる機械学習アプリを作ろう ・スケベAI「スケベ博士」をPythonとGoogle Apps Scriptで作るスケベ・チュートリアルを公開します ・JavaScriptだけで書ける!LINEからDMMのサンプル動画が見れる、「変態コンシェルジュ」を作ろう! ******************************************************* #未経験からスケベエンジ

1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く