ご縁があり、講談社から共著で『Kaggle ではじめる大規模言語モデル入門 〜自然言語処理〈実践〉プログラミング〜』を出版します。Amazon ページ や講談社の書籍ページは先日公開され、年明け 2026 年 1 月中旬に出版予定です。 書籍概要 書名の通り、Kaggle と大規模言語モデル (Large Language Models; LLM) を題材とした書籍です。機械学習コンペティション(コンペ)での事例を通じて、LLM をはじめとした自然言語処理に関する実践的な知識やプログラミングを学ぶ内容になっています。本書の大きな特徴は、学習済みのモデルを所与のものとして、どうモデルを活用するかに焦点を当てていることです。 一般的な LLM の解説は、肝となる Transformer などのモデル構造や事前学習の仕組みなどから丁寧に始まることが多いかと思います。 一方で本書では、これら
Kaggleではじめる大規模言語モデル入門 自然言語処理〈実践〉プログラミング カグルデハジメルダイキボゲンゴモデルニュウモン シゼンゲンゴショリジッセンプログラミング 【推薦の言葉】 あなたのLLMスキル、「実戦」で通用しますか? ファインチューニング、RAG、量子化、モデルマージ…… 知識や理論を知っているだけでは、性能を引き出すことはできません。 トップKagglerたちはスコアを削り出すために、 何を試し、何を捨て、なぜその手法を選んだのか。 課題解決のための「本物」の技術を身につけられる一冊です。 ――秋葉拓哉氏(SakanaAI Staff Research Scientist) 従来のKaggle関連書籍では、十分に取り扱うことができずにいたテキストデータを扱うコンペティション(NLPコンペ)に焦点を当てた初の書籍です。注目が集まっている大規模言語モデルに関する内容をふんだ

こんにちは。データ人材戦略部エバンジェリストチームの權です。 私が自然言語処理に関する入門的なKaggleNotebookを作成したときのプロセスや工夫について共有します。 この記事がKaggleを活用した効果的な学習を推進する際のヒントになれば幸いです。 Kaggleとは みなさんはKaggleというものをご存じでしょうか? Kaggleは、機械学習エンジニアやデータサイエンティストが集まって競い合う世界最大のデータサイエンスコンペティションプラットフォームです。初心者からプロフェッショナルまで、さまざまなレベルの参加者が腕を磨く場として広く利用されています。LINEヤフーでは社員のリスキリングをするプロジェクトにKaggleを取り入れています。 高い壁にはチームでぶつかれ! 『ドラゴン桜』三田先生に聞く データがたくさんありますが、それを「精製」するデータサイエンティストの数がまだ

はじめに Kaggle の 5-day 生成AI 集中コースとは 感想 Day1: Foundational Models & Prompt Engineering Day2:Embeddings and Vector Stores/Databases RAG の構築 類似度・分類モデルの作成 Day3: GenerativeAI Agents Gemini で関数呼び出しをする方法 LangGraph を用いたAI エージェントの作り方 Day4:Domain-Specific LLMs Day5: MLOps for GenerativeAI まとめ この記事は CADDi プロダクトチーム Advent Calendar 2024 7 日目の記事です。 adventar.org はじめに こんにちは、CADDi の Analysisチームで図面解析をしている Osujo (

こんにちは、IVRyでPrincipalAI Engineerをやっているべいえりあです。今回はタイトルの通り、Kaggleの生成AI集中コースを見て目に留まったこと、そしてそれらについての個人的なコメントを書いていこうと思います。本記事はIVRy Advent Calendar 2024の白組の初日の記事です。紅組はCEOの奥西が「SaaS+AIの未来予想」という記事を書いています。 2日目は特命係長のサトケンさんがこの一年の特命活動を振り返ります。 タイトルには生成AIとありますが、画像生成AIなどはほぼほぼ登場せず、基本的にはLLMをどう使うのかについての講義となっています。講義は ホワイトペーパー Code lab 講義動画 の3つのパートから成っています。ホワイトペーパーで各トピックの技術的詳細を学び、Code labで実践し、それを元に講義動画で復習したり専門家たちのディス

2024/11/8 関西Kaggler会 2024 #3 / Kaggle Kernel で Gemma 2 × vLLM を動かす。

本記事では、OpenAIが開発した「機械学習タスクにおけるAIエージェントの能力を評価する新しいベンチマーク」MLE-benchを紹介します。実世界で必要とされる複雑で多岐にわたるスキルセットを総合的に評価することを目的としたデータセットです。 研究者らはこのベンチマークをどのように作成したのか、および現在の最先端モデルはどれほどの性能なのかをテストしました。 参照論文情報 タイトル:MLE-bench: EvaluatingMachine Learning Agents onMachine Learning Engineering 著者:Jun Shern Chan, Neil Chowdhury, Oliver Jaffe, James Aung, Dane Sherburn, Evan Mays, Giulio Starace, Kevin Liu, Leon Maksin, T

Deleted articles cannot be recovered. Draft of this article would be also deleted. Are you sure you want to delete this article? この記事は何? kunishou が2022 年 1 月 ~2023 年 3 月の期間に Kaggle のNLP コンペに参加していたときにまとめていたNLP トリックの雑なメモ書きです 。 最近、2023-24年のKaggleコンペから学ぶ、NLPコンペの精度の上げ方 という記事を拝見し、「そういえば、自分もNLP コンペのトリックをメモしてたな...」と思い出しました。 もともとは自分の振り返り目的でメモを取っており、たくさん蓄積してきたらそのうち何らかの形でアウトプットしようと考えていましたが、2023年後半に興味が L

BERTopic は、Transformersを用いて文書のトピックモデリングを行うためのPythonライブラリです。本記事では、自分がKaggleコンペの初手EDAによく使うコードをまとめました。 入出力のイメージ 入力: 文章のリスト (例:["I am sure some bashers of Pens fans ...", "My brother is in the market for a high-performance video card that supports VESA local bus with 1-2MB RAM. Does anyone hav...", ...]) 出力: 各文書の関係性を表した2次元座標図 ソースコード 以下にもありますGithubGooglecolab import pandas as pd from umap import UMA

お久しぶりです、三菱UFJフィナンシャル・グループ(以下MUFG)の戦略子会社であるJapan Digital Design(以下JDD)でMUFGAI Studio(以下M-AIS)に所属する蕭喬仁です。 厨二心をくすぐる名前でadvent calendarに登録していますが、もう直ぐ三十路ということでアカウント名の替え時が最近の悩みです。 さて、今年はOpenAIからリリースされたChatGPTを皮切りに生成AIが世間のトレンドとなっていますが、弊社でも「文章生成AIによる過去相場要約機能」の提供のような生成AIを用いたプロダクト開発やR&Dを進めています。中でも、検索を用いて外部知識を生成AIに埋め込むことでタスクの性能を高めるRetrieval-augmented Generation (以下RAG)は、大量の業務資料やマニュアルを保持するMUFGのような大企業にとっては非常に相

こんにちは、LayerX CTOの@y_matsuwitterです。最近はパン作りにハマっています。無心に小麦と酵母の声を聞くことで精神の安寧を求めています。 この記事は LayerXテックアドカレ2023 19日目の記事です。前回は @shota_tech が「Go のlinter 雰囲気で使っていたから調べ直した #LayerXテックアドカレ」を書いてくれました。次回はEMオフィスの@serimaより「Engineering Officeの話」がポストされる予定なのでご期待ください。 ISUCON13 昨日開催のISUCONに参加してきました。とても楽しい問題ですし、これだけの人数での開催を支えている運営の皆さんには頭が上がりません。個人でもLayerXとしてもスポンサーさせていただきました。ありがとうございます! 10年近く一緒に出場している.datというチームで、私はプロンプトを

リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く