Movatterモバイル変換


[0]ホーム

URL:


はてなブックマークアプリ

サクサク読めて、
アプリ限定の機能も多数!

アプリで開く

はてなブックマーク

タグ

関連タグで絞り込む (9)

タグの絞り込みを解除

o1に関するmisshikiのブックマーク (25)

  • OpenAIの新LLM「o3」は「o1」と何が違う? なぜ「o2」は存在しない?

    関連キーワード人工知能AI人工知能)チャットbot「ChatGPT」の開発元であるOpenAIは、2024年12月に大規模言語モデル(LLM)「OpenAI o1」シリーズの一般提供を開始した。これは同社にとって初の推論特化モデルであり、推論能力を強化している点が特徴だった。 同じタイミングでOpenAIが主催したイベント「12 Days ofOpenAI」では、OpenAIのサム・アルトマンCEOOpenAI o1の後継となる「OpenAI o3」シリーズのプレビュー版を発表。2025年1月には「o3-mini」の一般提供を開始した。OpenAI o3は、OpenAI o1や、従来の「GPT-4o」と何が違うのか。OpenAI o3の特徴やバージョンごとの違い、利用方法までを詳しく解説する。 「OpenAI o3」は「o1」と何が違う? なぜ「o2」は存在しない? 併せて読み

    OpenAIの新LLM「o3」は「o1」と何が違う? なぜ「o2」は存在しない?
    misshiki
    misshiki2025/04/07非公開
    “この理由の一つとして、「O2」が英国の通信事業者Telefonica UKの登録商標であることが挙げられる。OpenAIは商標権への配慮から、「OpenAI o2」という名称を避け、代わりにOpenAI o3と命名した”
    • 「既に大学教授クラス」大塚篤司医師が驚愕したChatGPTの進化 人間の医師に残される役割とは?|医師のキャリア情報サイト【エピロギ】

      市川衛が聞く 「既に大学教授クラス」大塚篤司医師が驚愕したChatGPTの進化 人間の医師に残される役割とは? 大塚 篤司(皮膚科医/近畿大学医学部皮膚科学教室主任教授) 2025.02.06 大塚篤司さん(筆者撮影) 生成AIであるChatGPTを開発する米企業OpenAIはこの2月、新モデル「o3」シリーズの一つ「o3-mini」の提供を開始した。また中国のスタートアップ企業DeepSeekは独自の新モデル「R1」を公開、従来より大幅に低いコストで高性能なAIの開発に成功したと発表し大きな話題になっている。 加速度的な成長を見せる生成AI。AGI(汎用人工知能)、すなわち人間以上の能力で人間と同じような汎用的な作業を行えるAIの登場が現実的と言われる中で、医師など医療職の仕事は今後どのように変わるのだろうか。 2024年に2冊の著書を発表するなど「医師による生成AIの活用」で最先端を行

      「既に大学教授クラス」大塚篤司医師が驚愕したChatGPTの進化 人間の医師に残される役割とは?|医師のキャリア情報サイト【エピロギ】
      misshiki
      misshiki2025/02/13非公開
      “いま私が使っているo1 pro(オーワンプロ:※)の場合、もう大学准教授、教授クラスと言っていいと思います。”
      • 研究者にとってo1Proは3万円課金する価値があるか?|genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請

        研究者が論文執筆や助成金の申請書を書く際、近年は大規模言語モデル(LLM)を活用するケースが増えています。確かにo1proの書く文章はAI臭さが無いですし、その知識や発想力に驚かさせる事は多いです。ただo1proをアカデミック関連の業務に試してきましたが、その経験から言えば、3万円を払ってo1Proを使う必要性は低い、というのが私の現在のところの正直な結論です。以下に理由を述べます。 1. o1モデルにおけるプロンプトのコツo1モデルは「シンプルなプロンプトがベスト」とされており、複雑なコンテキストや指示を加えすぎると性能を発揮しづらいと言われています。一部のプロンプトエンジニアリング(few-shot learning や「think step by step」など)は、性能を向上させない場合もあります。以下がベストプラクティスです: シンプルで直接的に:簡潔な指示が最も効果的です。 連

        研究者にとってo1Proは3万円課金する価値があるか?|genkAIjokyo|ChatGPT/Claudeで論文作成と科研費申請
        misshiki
        misshiki2025/01/06非公開
        “現状の感想としては「研究者が論文・申請書のためにo1Proに課金する必要は薄い」という結論”
        • ChatGPT o1とGemini 2.0の性能を比較してみた|IT navi

          2024年12月5日、OpenAIが高度な推論能力を持つo1の正式版を公開しました。現在、有料のChatGPT Plusなどのユーザーがo1を利用できます。同年9月からプレビュー版のo1-previewが使えるようになっていたのですが、それよりもかなり性能が上がっています。 また、Googleは、2024年12月6日にGemini-Exp-1206(Gemini 2.0 Experimental Advanced)、同月11日にGemini 2.0 Flash Experimental、同月19日にo1のような推論モデルのGemini 2.0 Flash Thinking Experimentalを公開しました。AIモデルの性能が著しく向上し、平均的な人間の能力を超えてきたため、筆者が性能を評価するのも難しくなってきていますが、今回も、現在、最高峰と言えるこれらのAIモデル(o1とGem

          ChatGPT o1とGemini 2.0の性能を比較してみた|IT navi
          misshiki
          misshiki2025/01/06非公開
          “Chatbot Arenaでの性能評価では、Geminiのスコアがo1のスコアを上回っているようでしたが、実際にテストしてみると、ほとんどの分野でo1の性能がGemini 2.0を圧倒していました。”
          • OpenAIの「o1」モデルが「GitHub Copilot」と「GitHub Models」で利用可能に どのプランで使える?

            GitHubは2024年12月20日(米国時間)、AI人工知能)コードアシスタント「GitHub Copilot」とAIアプリ開発支援サービス「GitHub Models」で、OpenAIの最新AIモデル「o1」を利用できるようにしたと発表した。OpenAIはo1を12月17日にリリースした。コーディング、科学、数学のような高度なタスクに最適化された「o1-preview」および「o1-mini」モデルを2024年9月に発表しており、o1はo1-previewをアップデートし、複雑なタスクでのパフォーマンスを向上させたものだ。GitHubはo1-previewとo1-miniも、GitHub CopilotとGitHub Modelsで利用できるようにしていた。 o1は、GitHub Copilotの「Copilot Chat」機能とGitHub Modelsで利用できる。Copil

            OpenAIの「o1」モデルが「GitHub Copilot」と「GitHub Models」で利用可能に どのプランで使える?
            misshiki
            misshiki2024/12/25非公開
            “GitHubは、AIコードアシスタント「GitHub Copilot」とAIアプリ開発支援サービス「GitHub Models」で、OpenAIの最新AIモデル「o1」を利用できるようにした。”
            • OpenAI o1 APIの使い方|npaka

              以下の記事が面白かったので、簡単にまとめました。 ・Reasoning models 1.OpenAI o1「OpenAI o1」シリーズは、複雑な推論を行うために強化学習を用いて学習された新しい大規模言語モデルです。回答する前に考える特性があり、ユーザーに応答する前に長い内部思考の過程を生み出すことができます。これにより、科学的な推論に優れ、競技プログラミングの問題 (Codeforces) では89パーセンタイルにランクインし、米国数学オリンピック (AIME) の予選で全米の上位500人の学生に入る成績を収めています。また、物理学、生物学、化学の問題に関するベンチマーク (GPQA) では、人間の博士レベルの精度を上回る成績を達成しています。APIでは、次の2つのモデルが提供されています。 ・o1 世界に関する幅広い一般知識を使用して難しい問題を推論できるように設計されている。

              OpenAI o1 APIの使い方|npaka
              • misshiki
                misshiki2024/12/18非公開
                “開発者向けに OpenAI o1、Realtime API の改善、新しい微調整方法などを紹介します。”
                • 【OpenAI】o1が"意図的にユーザーを騙す"ことがあるという報告について - Qiita

                  Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? ("o1 System Card" Figure 2の意訳) "12 Days ofOpenAI"の第一弾としてリリースされたOpenAIのo1は、特にpro modeの高い性能や月額3万円という破格の料金プランが大いに話題になっていますが 同時に発表された米Apollo ResearchによるAI安全性に関する調査報告が、いよいよSFの世界と見紛うような驚きの結果であったため、内容をまとめました。 サマリ はじめに「目標」を強く指示されたLLMが、その目標にそぐわないような状況に陥った場合、目標を遂行するためにユーザーを欺くような"

                  【OpenAI】o1が"意図的にユーザーを騙す"ことがあるという報告について - Qiita
                  misshiki
                  misshiki2024/12/11非公開
                  “Chain-of-Thoughtを活用した推論スケーリングによってLLMは今後も大いに発展することが期待されていますが、モデルの高度化はセキュリティ対策の複雑化とも表裏一体であることが今回の調査でより浮き彫りに”
                  • OpenAIとApollo Research、「o1」は自分の目的のために嘘をつくと報告

                    OpenAIAI安全性の研究組織である米Apollo Researchは12月5日(現地時間)、OpenAIが同日公式版をリリースしたLLMの「o1」についての考察を発表した。いずれも、o1に関して幾つかの懸念事項を指摘している。 o1は、OpenAIが9月に発表したLLM。回答を生成する前に思考の連鎖を生み出すことで、複雑な推論タスクを実行できるというものだ。さまざまな戦略を試したり、間違いを認識したり、思考プロセスを洗練したりすることで、従来のモデルと比較して、より有用な回答を提供できるようになったとOpenAIは説明している。 だがApollo Researchは、o1が「scheming」(策略。開発者やユーザーの意図と異なる目的を密かに追求する能力)について評価したところ、o1が以下のような行動を示すことが明らかになったとしている。 開発者やユーザーではなく、o1自身の目標に

                    OpenAIとApollo Research、「o1」は自分の目的のために嘘をつくと報告
                    misshiki
                    misshiki2024/12/09非公開
                    “Apollo Researchは、米Metaや米Anthropicのモデルでもテストし、同様の策略を企てることを確認したが、o1の行動が最も欺瞞的だったとしている。”
                    • GPT-4oとo1とo1 proの翻訳の違いと物語生成性能を試す|shi3z

                      GPT-4oとo1($30/月)とo1 pro($200/月)で翻訳を比較しました。 翻訳の元にしたのは以下のツイートです。 The (true) story of development and inspiration behind the "attention" operator, the one in "Attention is All you Need" that introduced the Transformer. From personalemail correspondence with the author @DBahdanau ~2 years ago, published here and now (with permission) following… pic.twitter.com/hKD7gDcexS — Andrej Karpathy (@karpathy)

                      GPT-4oとo1とo1 proの翻訳の違いと物語生成性能を試す|shi3z
                      misshiki
                      misshiki2024/12/09非公開
                      “やはり従前通り、OpenAI系のLLMは情緒表現が苦手で、面白いものを作ることを苦手としている。...いずれにせよ物語生成という文脈で見たときにo1 proにお金を払う価値はなさそうだ。”
                      • 月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた

                        OpenAIが12月5日(現地時間)に発表した、ChatGPTの新プラン「ChatGPT Pro」。目玉は、最高性能のAIモデル「OpenAI o1」でより高度な思考を行って難問に対して優れた回答を提供するという「o1 Pro mode」だ。一方、月額200ドル(1ドル150円換算で約3万円)という価格体系も話題に。果たしてその値段に見合う価値はあるのか──試しに、過去のGPTシリーズや他の大規模言語モデルが引っ掛かりがちだった問題を出して、確かめてみた。 解けるか、“おっぱお問題” GPT-4でもたまに間違えていた「いっぱいの“い”を“お”に変えて」という問題。o1 Pro modeは引っ掛からず回答できた。 「9.11」と「9.9」、大きいのは? 「9.11」と「9.9」どちらが大きいか、というのも、過去のモデルがよく間違えた問題だ。Pro modeでない「o1」も、以下のように正し

                        月額3万円のチャットAI「o1 Pro mode」に引っ掛け問題を出しまくってみた
                        misshiki
                        misshiki2024/12/09非公開
                        “引っ掛け問題に引っ掛からないことや、数学の難問を解けるかだけがコストに見合う価値ではないだろうが、ひとまずは「...ある程度物事を理解しているような回答ができているのでは?」と思える結果だった。”
                        • OpenAI 推論モデルの正式版「o1 pro mode」がリリース! 早速、人類の未来について話し合ってみた|遠藤太一郎

                          ㈱カナメプロジェクト/東京学芸大学教育AI研究プログラムの遠藤太一郎です。教育現場でのAI活用に関して、色々な試みをしています。最近、こんな記事も書きました。 今朝3時頃、OpenAIがo1 pro modeを出したので早速試してみました。ある意味電卓の超拡張版とも言える論理推論マシンに留まるものなのか、もう一歩踏み込んで、人類を次の地平に導くようなものなのか。 そこで今回は、o1 pro modeとの対話を通じて、人類が「次のステージ」に移行するためには何が必要なのか、そのヒントを得ようと試みました。AIとの対話を重ねる中で導かれたキーワードが、「脱固定化」(だつこていか) という発想です。 従来、人類は固定された価値観や前提条件、社会制度、認知フレームに頼って生きてきました。それらが「不変」「絶対」と見なされることで、想像力や発想力にバイアスをかけていた面も否定できません。しかし、

                          OpenAI 推論モデルの正式版「o1 pro mode」がリリース! 早速、人類の未来について話し合ってみた|遠藤太一郎
                          misshiki
                          misshiki2024/12/06非公開
                          “o1 pro modeと対話してみて初期的な感想。「発想」レベルのものを渡し、一緒に議論するこで、ものすごく整理される。視界が開ける感覚。点が面になる。まさにResoning(論理推論)といった感覚です。”
                          • OpenAI o1(ChatGPT o1)とは何かをやさしく解説、従来と何が違う? 特徴や使い方とは

                            OpenAIの最新AIモデル「o1(オーワン)」は「推論トークン」という新しい仕組みを活用した、従来のGPTとは一線を画す言語モデルだ。特にコーディングや数学で高い精度を実現し、あるベンチマークテストでは博士課程の学生を上回る成績を記録したとされる。この最新モデルo1とは、どのような特徴を持つモデルなのか、どんな場面で利用すると有効なのか、その実力や使い方をわかりやすく解説する。 バークリー音大提携校で2年間ジャズ/音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15年頃テックメディアの立ち上げにあたり、ドローンの可能性を模索。ドローンレース・ドバイ世界大会に選手として出場。現在、音楽制作

                            OpenAI o1(ChatGPT o1)とは何かをやさしく解説、従来と何が違う? 特徴や使い方とは
                            misshiki
                            misshiki2024/11/26非公開
                            “o1とは、どのような特徴を持つモデルなのか、どんな場面で利用すると有効なのか、その実力や使い方をわかりやすく解説”
                            • misshiki
                              misshiki2024/11/08非公開
                              “OpenAI の o1-preview が医師国家試験で正答率 98.2% を記録しました 日本語の問題を翻訳せず、そのまま読ませた結果です”
                              • OpenAI、大規模言語モデル「OpenAI o1-preview」シリーズを発表 他モデルとの違いは?

                                OpenAIは2024年9月12日(米国時間)、大規模言語モデル(LLM)「OpenAI o1-preview」と「OpenAI o1-mini」をリリースした。OpenAIは以下のように説明している。OpenAI o1シリーズとは、他モデルとの違いは?OpenAIが開発したOpenAI o1シリーズは、複雑なタスクを推論でき、これまでのモデルよりも科学、コーディング、数学などで難しい問題を解決できるという。 仕組みとパフォーマンスOpenAIのテストでは、物理学、化学、生物学の難易度の高いベンチマークタスクにおいて、o1シリーズは博士課程の学生と同様のパフォーマンスを示した。また、数学とコーディングにおいても優れていることが分かった。 国際数学オリンピック(IMO)の予選試験では、GPT-4oは問題の13%しか正しく解けなかったのに対し、o1シリーズは83%のスコアを出した。また、

                                OpenAI、大規模言語モデル「OpenAI o1-preview」シリーズを発表 他モデルとの違いは?
                                misshiki
                                misshiki2024/10/07非公開
                                “OpenAIが開発したOpenAI o1シリーズは、複雑なタスクを推論でき、これまでのモデルよりも科学、コーディング、数学などで難しい問題を解決できるという。”
                                • 最新の ChatGPT モデル OpenAI o1 は数理最適化問題のモデリングが(ちょっと)できる - Insight Edge Tech Blog

                                  Insight Edgeのデータサイエンティストのki_ieです。数理最適化の専門家として、これまでさまざまな課題を数理最適化問題としてモデリングしてきました。 モデリングはアルゴリズム設計と比べて注目を集めることが少ないようですが、 実際には技術的な知見・調査を要求する骨の折れるタスクです。 このタスクを簡単にしたいとは日々思っていたところですが、最近OpenAI o1 というモデルの論理的推論能力が高いらしいという聞きました。この賢いLLMがモデリングのお手伝いをしてくれたら嬉しいですね! 今日は数理最適化問題(混合整数計画問題)のモデリングをどれだけLLMに任せられるのか、簡単な実験結果をご紹介します。数理最適化問題とは数理最適化問題と混合整数計画問題の基礎知識がある方はこの節はスキップしましょう(面白いことは一つも書いてありません)!数理最適化問題とその実行可能解・最適解

                                  最新の ChatGPT モデル OpenAI o1 は数理最適化問題のモデリングが(ちょっと)できる - Insight Edge Tech Blog
                                  misshiki
                                  misshiki2024/10/07非公開
                                  “数理最適化問題(混合整数計画問題)のモデリングをどれだけLLMに任せられるのか、簡単な実験結果をご紹介します。”
                                  • OpenAI o1モデルの勉強会 - 個人的な感想と備忘録 - Qiita

                                    Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 2024年9月18日に開催された勉強会「ついに出た!OpenAIの最新モデル『o1』って何がすごいの?みんなで勉強しよう」に参加しました。記事では、勉強会で学んだ内容、そこから得た個人的な気づき、そして今後の展望についてまとめています。まず、貴重な学びの機会を提供してくださった主催者と登壇者の皆様に心からお礼申し上げます。記事はあくまで筆者の個人的な理解と解釈に基づいています。まだ勉強会の内容をチェックされていない方は、ぜひconnpassの資料、動画アーカイブのリンクをご覧ください。 勉強会のまとめ o1モデルの特徴

                                    OpenAI o1モデルの勉強会 - 個人的な感想と備忘録 - Qiita
                                    misshiki
                                    misshiki2024/09/24非公開
                                    “現時点でのo1モデルには以下のような制限がある: 利用制限: 週単位または日単位でのメッセージ数に制限があります。 |機能制限: メモリ、カスタム指示、データ分析、ファイルアップロード、ウェブ閲覧、画像処理”
                                    • ついに出た!OpenAIの最新モデル「o1」って何がすごいの?

                                      ついに出た!OpenAIの最新モデル「o1」って何がすごいの?みんなで勉強しよう https://minorun365.connpass.com/event/331247/

                                      ついに出た!OpenAIの最新モデル「o1」って何がすごいの?
                                      misshiki
                                      misshiki2024/09/24非公開
                                      全48ページのスライド資料。
                                      • GPT-4oを圧倒、オープンAI新モデル「o1」に注目すべき理由

                                        これまでの大規模言語モデルの進歩の大部分は言語主導だった。オープンAIが新たに発表したモデル「o1」は多段階の推論に焦点が当てられており、創薬や物理学、材料科学などの分野において役立つかもしれない。 by James O'Donnell2024.09.19 30 この記事の3つのポイント オープンAIが高度な数学やコーディングに優れた新モデル「o1」をリリース o1は博士号レベルの問題に平均78%の正解率を示した 創薬や材料科学などの分野で人間の研究者の役に立つ可能性 summarized by Claude 3 この記事は米国版ニュースレターを一部再編集したものです。 先週末、私はサマーキャンプで結婚式を挙げた。私と現在のは、テレビ番組『サバイバー(Survivor )』から発想を得た一連のゲームを企画し、当日、招待客たちがそれらのゲームで競い合った。8月にゲームの計画を立てていたとき

                                        GPT-4oを圧倒、オープンAI新モデル「o1」に注目すべき理由
                                        misshiki
                                        misshiki2024/09/20非公開
                                        “オープンAIが先週リリースした新たなモデル「o1」(以前は「ストロベリー(Strawberry)」というコードネームで呼ばれており、その前はQ*だった)”
                                        • Try out OpenAI o1 in GitHub Copilot and Models

                                          AI & MLLearn about artificial intelligence andmachine learning across theGitHub ecosystem and the wider industry. GenerativeAILearn how tobuild with generativeAI.GitHub CopilotChange how you work withGitHub Copilot. LLMsEverything developers need to know about LLMs.Machine learningMachine learning tips, tricks, and best practices. HowAI code generation worksExplore the capabilities and be

                                          Try out OpenAI o1 in GitHub Copilot and Models
                                          misshiki
                                          misshiki2024/09/20非公開
                                          “Azure でホストされている OpenAI o1-preview と o1-mini を GitHub Copilot と Models の両方でテストする機会を開発者に提供するプレビューを開始します。”

                                          お知らせ

                                          公式Twitter

                                          • @HatenaBookmark

                                            リリース、障害情報などのサービスのお知らせ

                                          • @hatebu

                                            最新の人気エントリーの配信

                                          処理を実行中です

                                          キーボードショートカット一覧

                                          j次のブックマーク

                                          k前のブックマーク

                                          lあとで読む

                                          eコメント一覧を開く

                                          oページを開く

                                          はてなブックマーク

                                          公式Twitter

                                          はてなのサービス

                                          • App Storeからダウンロード
                                          • Google Playで手に入れよう
                                          Copyright © 2005-2025Hatena. All Rights Reserved.
                                          設定を変更しましたx

                                          [8]ページ先頭

                                          ©2009-2025 Movatter.jp