ということで作った。 サイトPodcast URL ソースコード Overcastでも普通に聴けてて便利。 動機 最近の情報収集方法はもっぱら、はてブのお気に入りフィードとXのおすすめフィードだ。特にXのおすすめフィードはうまく調教出来ていると日英問わず興味深い記事ばかり大量に流れてくる。 今まではそれらの記事をはてブしてとりあえず"あとで読む"に入れておくという運用にしていた。ところがご存じの通りほとんどの人間は"あとで読む"に入れてしまうとあとで読まないことがわかっており、ご多分に漏れず自分も"あとで読む記事"がどんどん溜まっていき消化できなくなっていた。 最近NotebookLMを使っていて、WebページでもPDFでもとにかくコンテンツはなんでも突っ込んでおけば、いい感じにPodcastが作成されるという体験がうらやまし〜と思っていたところだったので、じゃあこれの自分のはてブ版作る
こんにちは、AI FREAKです。 久しぶりにヤバいAIツールが出てきました。 「何がそんなにヤバいの?」かというと、例えばこちらの正面向きの画像をAIで生成してます横にしたり または後ろ姿にしたり または服装を変えたり これらを簡単にできるようになってしまいました。 服装や髪型の変換などは、マスクをかけて他のAIツールで変更する術などはありましたが、多少面倒でした。 また、横顔や後ろ姿を生成してくれる機能に関しては、かなり革命的だと思います。 これらはどのように編集しているかというと、GoogleAI Studioで新たに実装されたモデル「Gemini 2.0 Flash Experimental」を使用しています。 『GoogleAI Studio』の新機能が噂通りヤバかったので共有です。 添付1枚目の【正面画像】から【横顔】【後ろ姿】などが簡単に生成できちゃいました。 手順 =
こちらの記事でGoogleAI Studioの連続画面構成機能を紹介した後に、いろいろ試してみて、日本語でもストーリーと画像を出力できたので、プロンプト等を共有させてください。 ポイントは、プロンプトを英語にすることです。 以下のプロンプトの例では、プレミス(物語のあらすじのようなもの)部分を日本語にしても出力されましたが、メインは英語にしないとダメそうです。 以下はGeminiの出力画面のスクリーンショットです。一貫性も結構ありますね。 現在は、出てくる文章や画像にところどころ粗はありますが、この技術の延長線上に未来はあるわけです。 ここまでできていれば、質の向上の問題はすぐにクリアされるはず。 今すぐ遊んでみましょう!
はじめに:ボタン1つでGoogleの進化がわかる以下の手順に沿って、すぐにGoogleのAIの進化の現在地を感じていただけますので、ぜひお試しください! 1分で簡単に試す方法を図解で解説まずはGoogleAI Studioに行きます。 次に、左の列からモデルを選びます。 下の画像のようにGemini 2.0 Flash(Image Generation) Experimentalを選びます。 次にアウトプットフォーマットを選びます。イメージ&テキストにしてください。最後に真ん中のエリアにある「ビジュアルストーリー」というボタンを押します。 プロンプトを入力する必要ありません。ボタンを押せば文章と画像の生成が始まります。 出力される内容は以下の様になります。 少し長いですが、スクロールしてご覧ください。 8枚程度の画像とそれに紐付いたストーリー文書が生成されます。 後半に英語の文章を日本語
今回は一気に「MCPなにもわからない」から「MCP完全に理解した」に一気にレベルアップすることを目的に書いています。 そのために以下をモリモリに解説していきます。 ModelContextProtocol(MCP)とは? MCPがあることでできること MCPを実装するライブラリmodelcontextprotocolを使ってチュートリアル 実装のためのネゴシエーションや通信プロトコルの説明も踏まえてのチュートリアルです。 CursorへのMCPサーバーの登録方法 MCPがどのように動作してツールが使われるのか? FunctionCallingとの違い MCPって単語聞きすげてわからないままに嫌になっている人はこれを読むことで解放されてください。 ModelContextProtocol(MCP)とは? まずはイメージを見てもらうとわかりやすいと思います。 (https://modelcon
Cursor を使い始めた時に知っておきたかった 10 個の Tips を紹介します。これらの Tips を活用して Cursor を最大限に活用してください。 1.VSCode のキーバインドを設定する Cursor のセットアップ時にVSCode のプリセットを選択しても、キーバインドが完全に同じではないことに気付くかもしれません。特に、⌘K関連のキーバインドが⌘Rにリマップされていて、簡単には変更できません。例えば⌘+K Uで未保存ファイルを閉じたり、⌘+shift+Kで行を削除したりするのに慣れている場合は、キーバインドを変更したいと思うでしょう。 ⌘R関連のキーバインドを元の⌘Kに戻すには、まずworkbench.action.keychord.leaderを⌘Kに変更する必要があります。その後、元のキーバインドを設定できるようになります。 また、VSCode Keybind
はじめに 最近、あるプロジェクトでGitHubリポジトリの内容をAIに分析させたくて、「どうやってClaudeとGitHubを連携させればいいんだろう...」と頭を抱えていたんです。何時間もネットで調べた末に出会ったのがMCPサーバーでした。これが本当に目から鱗だったんですよ!😲 「石の上にも三年」というように、私は根気強く数週間かけて様々なMCPサーバーを試してきました。そして今日は、私の開発ワークフローを劇的に変えた10個の素晴らしいMCPサーバーを、4つの主要カテゴリーに分けて紹介したいと思います! そもそもMCPサーバーって何?🤔 リストに入る前に、MCPサーバーについて簡単に説明しますね。MCPは「Model Context Protocol」の略で、AIモデルが外部ツールやデータソースと安全かつシームレスに連携するためのオープンスタンダードなんです。 簡単に言えば、お気に入
3.7 sonnet → drawioが今のところベストな図の作成方法。特にdrawioにすることで修正ができることが従来との違い。パワポ作成やブログなどの際に図を多用できる。これはわかりやすくビジネスマン全員が使える組み合わせ。 https://t.co/GzZRYhgt1V pic.twitter.com/xmWryTqnk6 — 遠藤巧巳 -AIエージェント受託開発 (@ai_agent_dev) March 1, 2025 図の作成のベストは2025年3月時点ではClaude3.7 sonnetです。ChatGPT,Geminiでもできますが、クオリティが低いと人の修正時間が増えます。この図の作成クオリティのためだけにClaudeを契約しても良いと思います。 何が違う?これまでは図の作成はsvgで行うことが普通でした。しかしsvgだと人の修正ができないため、ほんの少しの違和感でも
こんにちは、エムスリーエンジニアリンググループ、コンシューマチームの園田です。本記事では、外部サービスとAIエージェントの連携を可能にするMCPプロトコルについて、技術検証の実装例を交えてお話しします。 1. MCPとは(ざっくり) MCP(Model Context Protocol)とは、Anthropic社によって策定されたAIエージェントが外部サービスから情報を参照したり連携することを目的としたプロトコルです。 「MCPサーバー」は、GitHubやPostgreSQLといったリソースをMCPで喋れるように変換してあげるプロキシのようなサーバーです。 Claude DesktopやCursorなどはMCPクライアントの機能があり、GitHubなどのMCPサーバーを利用してナレッジとして利用したり、プルリクエストの作成なども行えます。 Introduction - Model Cont
本記事は「AI技術を駆使した仕事術」の解説ではありません。逆であり、AI技術の進展に左右されない「仕事の本質」を意識した仕事方式の解説となります。弊社の公式内容ではなく、執筆者が心掛けている内容です。 はじめに 第一に、「AI技術が将来的にどこまで仕事に良いインパクトを与えるのか」、「どのような仕事(タスク)レベルまでAIによって自動化されるのか」は想像が難しいです(とくに実現タイミングの予測も含め、少なくとも私には)。 第二に、AI技術の進展の早さを考えると、現時点(2025年3月末)の「AI技術を駆使した仕事術」を解説しても、おそらく1年後の「2026年3月末」には、その記事内容は陳腐化している可能性が高いでしょう。 (※とはいえ短期的には、「(現時点での)AI技術を駆使した最強の仕事術」の紹介記事にはとても価値があると思います。)本記事では、AI技術に取り組む弊社にて、私(および私
初期段階のAIエージェントがいくつか登場してきています。 こういったツールを使えば、コードを書いたり、数学の問題を解いたりするだけではなく、あなたの代わりにアクションを実行してもらうことも可能です。 Operaも初のブラウザ対応AIエージェントをBrowser Operatorという文字通りの名称で発表しました。 Browser Operatorは、時間を無駄にしたり、何度もクリックをしたりしないでもいいように、面倒なオンライン上のタスクを代行するというコンセプトでつくられています。 次回の食料品の注文を手配したり、訪問予定の場所にあるホテルの料金をチェックしたりもできるんです。 OperaのKrystian Kolondra氏はこのように述べています。 30年以上もの間、ブラウザはウェブにアクセスするためだけに使われていて、あなたに代わって何かの用事を片付けるようなことはできませんでした
連載:その悩み、生成AIが解決 アイデアが浮かばない、こんな無駄な作業なくしたい――。ビジネスパーソンを悩ませる日々のさまざまな困りごと、ChatGPTに聞いてみませんか? ITジャーナリストの酒井麻里子氏がプロンプトの書き方を伝授する。 Q.業務に必要な情報収集を効率化したいと考えています。AIを使って、条件を細かく指定してニュースを集めることはできますか? ビジネスパーソンにとって、自身の業務領域に関する情報収集はマスト。とはいえ、日々Web上で複数のサイトを横断し、情報を集めるのは地味に時間と手間がかかる。 1月からChatGPTの有料ユーザー向けにベータ版が提供されている「タスク」は、あらかじめ設定したタイミングで指定した指示を実行できる機能だ。Web上の情報を定期的に集めるといったことも可能なので、柔軟性の高い情報収集ツールとして活用できる。
最近は業務でChat GPTやClaudeなどのAIとのチャットに加え、コーディングで使うCline, Cursorなどでもチャット量が増えています。 チャットが増えたことでタイピング量も増えてきていて、なんだか疲れるなあという日も増えてきました。 そんな中、新たなアプローチとして取り入れたのが最近話題になっている音声入力ツール「superwhisper」でした。最初は半信半疑でしたが、実際に使ってみると、キーボードの打鍵数が大幅に減ったことでタイピングの負担が軽減され、作業の快適さが増したことを実感しました。 コーディングの指示をAIに出す時に不安になるのはメソッド名や変数名、ファイル名などの英語がきちんと出力されるのかという点がありますが、superwhisperのカスタムモードを使うと結構いい感じにアウトプットしてくれます(詳しくは後述)。 音声入力でClineに指示を出した実際の例
こんにちは、ニケです。 皆さん、Cursor 使っていますでしょうか? 私はそろそろ使用歴1年半くらいになります。 5ヶ月前にこんな記事を書いたのですが、AI時代のコーディングアシスタントの進化は早く、今はもうこの時とは全く異なる使い方をしているので改めて紹介したいと思います(一部被っている内容もあります)。 なお、AIコーディングアシスタントにはその他にも、Github CopilotやCline、Windsurfなどがありますが、これらのコーディングツールはCursorほど使ったことがないため、今回の記事では紹介・比較はしません。 XのTLでもいろんな宗派を見かけるので、「どれを使ったら一番楽できるんだ?」とは考えずに、取り敢えず一つのエディタ・ツールを使い倒すことをオススメします。 ⚠ 以降で紹介する方法は個人的にハマっている方法なので、これがベストではないです。1つの参考として見て
CursorとはCursorは、AI機能を統合した高機能なコードエディタです。主にコーディング目的で使用されますが、CursorのAgent機能を使うことで、複数ファイルの内容を理解し、タグ付けや要約、まとめノートの作成を効率的に行うことができます。 実際に使用しているCursorの画面ZettelkastenとはZettelkastenは、ドイツの社会学者ニクラス・ルーマンが考案したノート管理の方法論です。個々のアイデアを独立したノートに記録し、それらを相互にリンクさせることで知識のネットワークを構築することができます。PermanentNote、LiteratureNote、FleetingNoteなどの種類があり、階層的に知識を整理することが可能です。Zettelkastenは強力な知識管理システムです。もちろんデメリットもありますが知的生産性を高める上で是非取り入れていただきた
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く