関連キーワード人工知能AI(人工知能)チャットbot「ChatGPT」の開発元であるOpenAIは、2024年12月に大規模言語モデル(LLM)「OpenAI o1」シリーズの一般提供を開始した。これは同社にとって初の推論特化モデルであり、推論能力を強化している点が特徴だった。 同じタイミングでOpenAIが主催したイベント「12 Days ofOpenAI」では、OpenAIのサム・アルトマンCEOがOpenAI o1の後継となる「OpenAI o3」シリーズのプレビュー版を発表。2025年1月には「o3-mini」の一般提供を開始した。OpenAI o3は、OpenAI o1や、従来の「GPT-4o」と何が違うのか。OpenAI o3の特徴やバージョンごとの違い、利用方法までを詳しく解説する。 「OpenAI o3」は「o1」と何が違う? なぜ「o2」は存在しない? 併せて読み

市川衛が聞く 「既に大学教授クラス」大塚篤司医師が驚愕したChatGPTの進化 人間の医師に残される役割とは? 大塚 篤司(皮膚科医/近畿大学医学部皮膚科学教室主任教授) 2025.02.06 大塚篤司さん(筆者撮影) 生成AIであるChatGPTを開発する米企業OpenAIはこの2月、新モデル「o3」シリーズの一つ「o3-mini」の提供を開始した。また中国のスタートアップ企業DeepSeekは独自の新モデル「R1」を公開、従来より大幅に低いコストで高性能なAIの開発に成功したと発表し大きな話題になっている。 加速度的な成長を見せる生成AI。AGI(汎用人工知能)、すなわち人間以上の能力で人間と同じような汎用的な作業を行えるAIの登場が現実的と言われる中で、医師など医療職の仕事は今後どのように変わるのだろうか。 2024年に2冊の著書を発表するなど「医師による生成AIの活用」で最先端を行

研究者が論文執筆や助成金の申請書を書く際、近年は大規模言語モデル(LLM)を活用するケースが増えています。確かにo1proの書く文章はAI臭さが無いですし、その知識や発想力に驚かさせる事は多いです。ただo1proをアカデミック関連の業務に試してきましたが、その経験から言えば、3万円を払ってo1Proを使う必要性は低い、というのが私の現在のところの正直な結論です。以下に理由を述べます。 1. o1モデルにおけるプロンプトのコツo1モデルは「シンプルなプロンプトがベスト」とされており、複雑なコンテキストや指示を加えすぎると性能を発揮しづらいと言われています。一部のプロンプトエンジニアリング(few-shot learning や「think step by step」など)は、性能を向上させない場合もあります。以下がベストプラクティスです: シンプルで直接的に:簡潔な指示が最も効果的です。 連

2024年12月5日、OpenAIが高度な推論能力を持つo1の正式版を公開しました。現在、有料のChatGPT Plusなどのユーザーがo1を利用できます。同年9月からプレビュー版のo1-previewが使えるようになっていたのですが、それよりもかなり性能が上がっています。 また、Googleは、2024年12月6日にGemini-Exp-1206(Gemini 2.0 Experimental Advanced)、同月11日にGemini 2.0 Flash Experimental、同月19日にo1のような推論モデルのGemini 2.0 Flash Thinking Experimentalを公開しました。AIモデルの性能が著しく向上し、平均的な人間の能力を超えてきたため、筆者が性能を評価するのも難しくなってきていますが、今回も、現在、最高峰と言えるこれらのAIモデル(o1とGem

GitHubは2024年12月20日(米国時間)、AI(人工知能)コードアシスタント「GitHub Copilot」とAIアプリ開発支援サービス「GitHub Models」で、OpenAIの最新AIモデル「o1」を利用できるようにしたと発表した。OpenAIはo1を12月17日にリリースした。コーディング、科学、数学のような高度なタスクに最適化された「o1-preview」および「o1-mini」モデルを2024年9月に発表しており、o1はo1-previewをアップデートし、複雑なタスクでのパフォーマンスを向上させたものだ。GitHubはo1-previewとo1-miniも、GitHub CopilotとGitHub Modelsで利用できるようにしていた。 o1は、GitHub Copilotの「Copilot Chat」機能とGitHub Modelsで利用できる。Copil

以下の記事が面白かったので、簡単にまとめました。 ・Reasoning models 1.OpenAI o1「OpenAI o1」シリーズは、複雑な推論を行うために強化学習を用いて学習された新しい大規模言語モデルです。回答する前に考える特性があり、ユーザーに応答する前に長い内部思考の過程を生み出すことができます。これにより、科学的な推論に優れ、競技プログラミングの問題 (Codeforces) では89パーセンタイルにランクインし、米国数学オリンピック (AIME) の予選で全米の上位500人の学生に入る成績を収めています。また、物理学、生物学、化学の問題に関するベンチマーク (GPQA) では、人間の博士レベルの精度を上回る成績を達成しています。APIでは、次の2つのモデルが提供されています。 ・o1 世界に関する幅広い一般知識を使用して難しい問題を推論できるように設計されている。

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? ("o1 System Card" Figure 2の意訳) "12 Days ofOpenAI"の第一弾としてリリースされたOpenAIのo1は、特にpro modeの高い性能や月額3万円という破格の料金プランが大いに話題になっていますが 同時に発表された米Apollo ResearchによるAI安全性に関する調査報告が、いよいよSFの世界と見紛うような驚きの結果であったため、内容をまとめました。 サマリ はじめに「目標」を強く指示されたLLMが、その目標にそぐわないような状況に陥った場合、目標を遂行するためにユーザーを欺くような"

米OpenAIとAI安全性の研究組織である米Apollo Researchは12月5日(現地時間)、OpenAIが同日公式版をリリースしたLLMの「o1」についての考察を発表した。いずれも、o1に関して幾つかの懸念事項を指摘している。 o1は、OpenAIが9月に発表したLLM。回答を生成する前に思考の連鎖を生み出すことで、複雑な推論タスクを実行できるというものだ。さまざまな戦略を試したり、間違いを認識したり、思考プロセスを洗練したりすることで、従来のモデルと比較して、より有用な回答を提供できるようになったとOpenAIは説明している。 だがApollo Researchは、o1が「scheming」(策略。開発者やユーザーの意図と異なる目的を密かに追求する能力)について評価したところ、o1が以下のような行動を示すことが明らかになったとしている。 開発者やユーザーではなく、o1自身の目標に

GPT-4oとo1($30/月)とo1 pro($200/月)で翻訳を比較しました。 翻訳の元にしたのは以下のツイートです。 The (true) story of development and inspiration behind the "attention" operator, the one in "Attention is All you Need" that introduced the Transformer. From personalemail correspondence with the author @DBahdanau ~2 years ago, published here and now (with permission) following… pic.twitter.com/hKD7gDcexS — Andrej Karpathy (@karpathy)

米OpenAIが12月5日(現地時間)に発表した、ChatGPTの新プラン「ChatGPT Pro」。目玉は、最高性能のAIモデル「OpenAI o1」でより高度な思考を行って難問に対して優れた回答を提供するという「o1 Pro mode」だ。一方、月額200ドル(1ドル150円換算で約3万円)という価格体系も話題に。果たしてその値段に見合う価値はあるのか──試しに、過去のGPTシリーズや他の大規模言語モデルが引っ掛かりがちだった問題を出して、確かめてみた。 解けるか、“おっぱお問題” GPT-4でもたまに間違えていた「いっぱいの“い”を“お”に変えて」という問題。o1 Pro modeは引っ掛からず回答できた。 「9.11」と「9.9」、大きいのは? 「9.11」と「9.9」どちらが大きいか、というのも、過去のモデルがよく間違えた問題だ。Pro modeでない「o1」も、以下のように正し

㈱カナメプロジェクト/東京学芸大学教育AI研究プログラムの遠藤太一郎です。教育現場でのAI活用に関して、色々な試みをしています。最近、こんな記事も書きました。 今朝3時頃、OpenAIがo1 pro modeを出したので早速試してみました。ある意味電卓の超拡張版とも言える論理推論マシンに留まるものなのか、もう一歩踏み込んで、人類を次の地平に導くようなものなのか。 そこで今回は、o1 pro modeとの対話を通じて、人類が「次のステージ」に移行するためには何が必要なのか、そのヒントを得ようと試みました。AIとの対話を重ねる中で導かれたキーワードが、「脱固定化」(だつこていか) という発想です。 従来、人類は固定された価値観や前提条件、社会制度、認知フレームに頼って生きてきました。それらが「不変」「絶対」と見なされることで、想像力や発想力にバイアスをかけていた面も否定できません。しかし、

OpenAIの最新AIモデル「o1(オーワン)」は「推論トークン」という新しい仕組みを活用した、従来のGPTとは一線を画す言語モデルだ。特にコーディングや数学で高い精度を実現し、あるベンチマークテストでは博士課程の学生を上回る成績を記録したとされる。この最新モデルo1とは、どのような特徴を持つモデルなのか、どんな場面で利用すると有効なのか、その実力や使い方をわかりやすく解説する。 バークリー音大提携校で2年間ジャズ/音楽理論を学ぶ。その後、通訳・翻訳者を経て24歳で大学入学。学部では国際関係、修士では英大学院で経済・政治・哲学を専攻。国内コンサルティング会社、シンガポールの日系通信社を経てLivit参画。興味分野は、メディアテクノロジーの進化と社会変化。2014〜15年頃テックメディアの立ち上げにあたり、ドローンの可能性を模索。ドローンレース・ドバイ世界大会に選手として出場。現在、音楽制作

OpenAIは2024年9月12日(米国時間)、大規模言語モデル(LLM)「OpenAI o1-preview」と「OpenAI o1-mini」をリリースした。OpenAIは以下のように説明している。OpenAI o1シリーズとは、他モデルとの違いは?OpenAIが開発したOpenAI o1シリーズは、複雑なタスクを推論でき、これまでのモデルよりも科学、コーディング、数学などで難しい問題を解決できるという。 仕組みとパフォーマンスOpenAIのテストでは、物理学、化学、生物学の難易度の高いベンチマークタスクにおいて、o1シリーズは博士課程の学生と同様のパフォーマンスを示した。また、数学とコーディングにおいても優れていることが分かった。 国際数学オリンピック(IMO)の予選試験では、GPT-4oは問題の13%しか正しく解けなかったのに対し、o1シリーズは83%のスコアを出した。また、

Insight Edgeのデータサイエンティストのki_ieです。数理最適化の専門家として、これまでさまざまな課題を数理最適化問題としてモデリングしてきました。 モデリングはアルゴリズム設計と比べて注目を集めることが少ないようですが、 実際には技術的な知見・調査を要求する骨の折れるタスクです。 このタスクを簡単にしたいとは日々思っていたところですが、最近OpenAI o1 というモデルの論理的推論能力が高いらしいという聞きました。この賢いLLMがモデリングのお手伝いをしてくれたら嬉しいですね! 今日は数理最適化問題(混合整数計画問題)のモデリングをどれだけLLMに任せられるのか、簡単な実験結果をご紹介します。数理最適化問題とは数理最適化問題と混合整数計画問題の基礎知識がある方はこの節はスキップしましょう(面白いことは一つも書いてありません)!数理最適化問題とその実行可能解・最適解

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? はじめに 2024年9月18日に開催された勉強会「ついに出た!OpenAIの最新モデル『o1』って何がすごいの?みんなで勉強しよう」に参加しました。本記事では、勉強会で学んだ内容、そこから得た個人的な気づき、そして今後の展望についてまとめています。まず、貴重な学びの機会を提供してくださった主催者と登壇者の皆様に心からお礼申し上げます。本記事はあくまで筆者の個人的な理解と解釈に基づいています。まだ勉強会の内容をチェックされていない方は、ぜひconnpassの資料、動画アーカイブのリンクをご覧ください。 勉強会のまとめ o1モデルの特徴

ついに出た!OpenAIの最新モデル「o1」って何がすごいの?みんなで勉強しよう https://minorun365.connpass.com/event/331247/

これまでの大規模言語モデルの進歩の大部分は言語主導だった。オープンAIが新たに発表したモデル「o1」は多段階の推論に焦点が当てられており、創薬や物理学、材料科学などの分野において役立つかもしれない。 by James O'Donnell2024.09.19 30 この記事の3つのポイント オープンAIが高度な数学やコーディングに優れた新モデル「o1」をリリース o1は博士号レベルの問題に平均78%の正解率を示した 創薬や材料科学などの分野で人間の研究者の役に立つ可能性 summarized by Claude 3 この記事は米国版ニュースレターを一部再編集したものです。 先週末、私はサマーキャンプで結婚式を挙げた。私と現在の妻は、テレビ番組『サバイバー(Survivor )』から発想を得た一連のゲームを企画し、当日、招待客たちがそれらのゲームで競い合った。8月にゲームの計画を立てていたとき

AI & MLLearn about artificial intelligence andmachine learning across theGitHub ecosystem and the wider industry. GenerativeAILearn how tobuild with generativeAI.GitHub CopilotChange how you work withGitHub Copilot. LLMsEverything developers need to know about LLMs.Machine learningMachine learning tips, tricks, and best practices. HowAI code generation worksExplore the capabilities and be

リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く