Movatterモバイル変換


[0]ホーム

URL:


Koichi Hamada, profile picture
Uploaded byKoichi Hamada
2,878 views

Mahout JP - #TokyoWebmining 11th #MahoutJP

Mahout JP

第11回データマイニング+WEB@東京      2011/06/12Mahout JP  hamadakoichi    濱田 晃一
2
2011/05/01             3
2011/05/01Mahout JP              4
2011/05/01Mahout JP 始めました              5
AGENDA  ◆主催者紹介  ◆Mahout JP   ◆創設の思い・目的   ◆Mahoutとは   ◆Mahout活用の課題と方策   ◆現状のMahout情報   ◆Mahout JP  ◆最後に
AGENDA  ◆主催者紹介  ◆Mahout JP   ◆創設の思い・目的   ◆Mahoutとは   ◆Mahout活用の課題と方策   ◆現状のMahout情報   ◆Mahout JP  ◆最後に
hamadakoichi         濱田晃一http://iddy.jp/profile/hamadakoichi                                      8
データマイニング+WEB勉強会@東京  データマイニング+WEB勉強会@東京の主催者です          TokyoWebmining  Google Group: http://groups.google.com/group/webmining-tokyo                                                                 9
講師資料   Mahout、R、データマイニング・機械学習、等         各種講師資料を公開しています   http://www.slideshare.net/hamadakoichi                                            10
活動領域: ソーシャルメディアのデータマイニング                           11
活動領域: ソーシャルメディアのデータマイニング               楽しさのマイニング               ユーザー体験へ還元               Data Mining             Machine Learning                  of Fun              PatternMining Clustering    Classification Regression Recommendation       TimeSeriesAnalysis StatisticalAnalysis          NaturalLanguageProcessing ..etc                Social Media                 Experience                   Social Graph                 Detailed Actions                Changes of Status              Social Communications                 Personality ..etc                                                12
活動領域       活動が紹介されました                    13
活動領域       活動が紹介されました          Tech総研                    (※記事から抜粋)   14
活動領域       ソーシャルプラットフォームの大規模データマイニング・機械学習活用によるサービス洗練        Hadoop Conference 2011                                 15
hamadakoichi 濱田晃一                    16
hamadakoichi 濱田晃一                      理論物理 博士(2004.3取得)                        量子統計場の理論Statistical Field Theory                        Spontaneously                                        Time-Reversal Symmetry Breaking                                       Anisotropic Massless Dirac Fermions 博士論文: http://hosi.phys.s.u-tokyo.ac.jp/~koichi/PhD-thesis.pdf                                                                        17
hamadakoichi 濱田晃一             文部大臣に褒められた   元 文部大臣・法務大臣      六法全書著者・元法学政治学研究科長      森山眞弓さん             菅野和夫さん                                    18
hamadakoichi 濱田晃一          毎週末3時間ダンスコーチをしています           ■過去、東京と京都でも            ダンス部を創設。            コーチをしていました                          駒場物理ダンス部   京都大学基礎物理学研究所ダンス部                          部長兼コーチ     部長兼コーチ  現在: 毎週末 3時間ダンスコーチ  Youtube Channel: http://www.youtube.com/hamadakoichi   19
hamadakoichi 濱田晃一         Los Angelesでプロダンサーに褒められた  ・HIP HOP/House ダンス歴14年  ・ダンス開始後 1年半でL.A.でプロダンサーに褒められる  Youtube Channel: http://www.youtube.com/hamadakoichi   20
数理解析手法の実ビジネスへの適用            2004年 博士号取得後       数理解析手法を実ビジネス適用の方法論構築主な領域◆活動の数理モデル化・解析手法◆活動の分析手法・再構築手法◆活動の実行制御・実績解析システム… 内容抜粋 “Decoupling Executions in Navigating Manufacturing          "Unified graph representation of processes Processes for Shortening Lead Time and Its Implementation   for scheduling with flexible resource to an Unmanned Machine Shop”,                               assignment",                                                                                                          21
数理解析手法の実ビジネスへの適用:活動例                  活動の統一グラフモデルを構築・解析                        Unified graphical model of processes and resources                                                                                                 青字:割付モデル属性                                                                                                 [ ] : OptionalNode             ・priority(優先度)                                                       Edge                 ・duration(予定時間)                 [・earliest(再早開始日時) ]                                                      Process EdgeProcess          [・deadline(納期) ]                 [・or(条件集約数) ]                                                                                             前プロセスの終了後に後プロセスがプロセスを表す                                                                                      開始できること表す                 ・attributes(属性)                                                                      preemptable(中断可否),                                                                      successive(引継ぎ可否)                                                                                           Uses Edge                                                                      workload(作業負荷)         Processが使用する                        uses     uses uses         uses   uses        uses                   Assign Region を表すAssign Region                                                                              Assigns from Edge同一Resourceを割付け続ける                                                                            Assign Regionに                                  assigns from assigns from                                  指定Resourceの子Resource集合の範囲を表す               assigns                                           assigns                     中から割付けることを示す                                 企業01                             [process]                                 has         has                  [startDate(開始日時)]                                                                  [endDate(終了日時)]          Assigns Edge                  製品01                    組織A                                                StartDateからEndDateまでの間Resource                                                                     has             Assign RegionにResourceを割付対象要素を表す           has has      has      has   has       has                                割付けることを表す                                                                    ・capacity(容量)                                                                    ・calender(カレンダー)                AAA01    AAB02    …     山田さん 田中さん 鈴木さん              ・attributes(属性)        Has Edge                                                                           東さん               Resourceの所有関係を表す                                                                                                                   22
数理解析手法の実ビジネスへの適用:活動例                                    一品一様の業務プロセスの                                  動的なプロセス制御数理体系を構築  全体生産リードタイム中央値を                                                                                                                       1/2.7に短縮       設計開始~頭だし出荷リードタイム                                      設計開始~頭だし出荷CT対週集計開始日時の箱ひげ図                                                                        体系適用                         500                                                                                                                                                                   適用後   設計開始~頭だし出荷CT                         400                                                                                            360.4h(15.0日)                                                                                                                                                                                          1/2.7                         300                         200                         100                                       0          0          0          0          0          0          0          0          0          0          0                                                                                                                                                                141.6h(5.9日)                                                                                                                                                                0          0          0                                  9: 0       9 :0       9 :0       9 :0       9: 0       9 :0       9 :0       9 :0       9: 0       9 :0       9 :0       9 :0       9: 0       9 :0                                0          7          4          1          8          5          1          8          5          2          9          6          3          0                             /2         /2         /0         /1         /1         /2         /0         /0         /1         /2         /2         /0         /1         /2                          09        09         10          10         10        10         11          11        11         11         11          12        12         12                       4/        4/         4/         4/         4/         4/         4/         4/         4/         4/         4/         4/         4/         4/                  2 00      2 00       2 00       2 00       2 00       2 00       2 00       2 00       2 00       2 00       2 00       2 00       2 00       2 00                                                                                              週集計開始日時                                                                                                                                                                                              23
数理解析手法の実ビジネスへの適用:活動例                                    ビジネスとともに                                    学術分野でも貢献変動性から生じる動的な課題     ・リソースの競合 ・滞留 ・納期遅延                             …一品一様な業務プロセスを含む統計解析・制御数理モデル     ・統計的な有効変数算出     ・統計数理モデル化        -優先順位制御        -実行タイミング制御        -統計フィードバック        -適正リソース量算出     ・予測数理体系論文(体系の一部)M.Nakao, N. Kobayashi, K.Hamada, T.Totsuka, S.Yamada,“Decoupling Executions in Navigating Manufacturing Processes for Shortening Lead Time and Its Implementationto an Unmanned Machine Shop”,CIRP Annals - Manufacturing Technology Volume 56, Issue 1, Pages 171-174 (2007)                          24
活動領域       ソーシャルプラットフォームの大規模データマイニング・機械学習活用によるサービス洗練        Hadoop Conference 2011                                 25
ソーシャルメディアのデータマイニング               楽しさのマイニング               ユーザー体験へ還元               Data Mining             Machine Learning                  of Fun              PatternMining Clustering    Classification Regression Recommendation       TimeSeriesAnalysis StatisticalAnalysis          NaturalLanguageProcessing ..etc                Social Media                 Experience                   Social Graph                 Detailed Actions                Changes of Status              Social Communications                 Personality ..etc                                                26
ソーシャルメディアのデータマイニング        2300万人以上の人々へ各人のつながり・楽しみ・個性にあった適切なサービス配信               Data Mining             Machine Learning                  of Fun              PatternMining Clustering    Classification Regression Recommendation       TimeSeriesAnalysis StatisticalAnalysis          NaturalLanguageProcessing ..etc                Social Media                 Experience                   Social Graph                 Detailed Actions                Changes of Status              Social Communications                 Personality ..etc                                                27
ソーシャルメディアのデータマイニング      ソーシャル・活動情報の活用により より適切な情報・サービス配信される世界を実現したい               Data Mining             Machine Learning                  of Fun              PatternMining Clustering    Classification Regression Recommendation       TimeSeriesAnalysis StatisticalAnalysis          NaturalLanguageProcessing ..etc                Social Media                 Experience                   Social Graph                 Detailed Actions                Changes of Status              Social Communications                 Personality ..etc                                                28
AGENDA  ◆主催者紹介  ◆Mahout JP   ◆創設の思い・目的   ◆Mahoutとは   ◆Mahout活用の課題と方策   ◆現状のMahout情報   ◆Mahout JP  ◆最後に
AGENDA  ◆主催者紹介  ◆Mahout JP   ◆創設の思い・目的   ◆Mahoutとは   ◆Mahout活用の課題と方策   ◆現状のMahout情報   ◆Mahout JP  ◆最後に
Mahout JP            思い                 31
Mahout JP               思い            大規模データを活用し                         32
Mahout JP               思い            大規模データを活用し       継続的に活動進化できる             世界を作りたい                         33
Mahout JP大規模データマイニング・機械学習を   実行・活用したい人が                34
Mahout JP大規模データマイニング・機械学習を   実行・活用したい人が   それを実現できるようにしたい                    35
Mahout JP            Mahout JP            始めました                        36
AGENDA  ◆主催者紹介  ◆Mahout JP   ◆創設の思い・目的   ◆Mahoutとは   ◆Mahout活用の課題と方策   ◆現状のMahout情報   ◆Mahout JP  ◆最後に
Mahout とは            38
Mahoutとは         Open Sourceでスケーラブルな       機械学習・データマイニングのライブラリ     ・Apache プロジェクト     ・機械学習・データマイニングのライブラリ     ・Java オープンソース     ・Hadoop(大規模 分散処理基盤)上で動作      (Hadoop:象, Mahout: 象使い)             http://mahout.apache.org                                        39
Mahoutとは         Open Sourceでスケーラブルな       機械学習・データマイニングのライブラリ     ・Apache プロジェクト     ・機械学習・データマイニングのライブラリ     ・Java オープンソース     ・Hadoop(大規模 分散処理基盤)上で動作      (Hadoop:象, Mahout: 象使い)             http://mahout.apache.org                                        40
Mahoutとは         Open Sourceでスケーラブルな       機械学習・データマイニングのライブラリ     ・Apache プロジェクト     ・機械学習・データマイニングのライブラリ     ・Java オープンソース     ・Hadoop(大規模 分散処理基盤)上で動作      (Hadoop:象, Mahout: 象使い)             http://mahout.apache.org                                        41
Mahoutとは         Open Sourceでスケーラブルな       機械学習・データマイニングのライブラリ     ・Apache プロジェクト     ・機械学習・データマイニングのライブラリ     ・Java オープンソース     ・Hadoop(大規模 分散処理基盤)上で動作      (Hadoop:象, Mahout: 象使い)             http://mahout.apache.org                                        42
Mahoutとは         Open Sourceでスケーラブルな       機械学習・データマイニングのライブラリ     ・Apache プロジェクト     ・機械学習・データマイニングのライブラリ     ・Java オープンソース     ・Hadoop(大規模 分散処理基盤)上で動作      (Hadoop:象, Mahout: 象使い)             http://mahout.apache.org                                        43
Mahoutとは         Open Sourceでスケーラブルな       機械学習・データマイニングのライブラリ     ・Apache プロジェクト     ・機械学習・データマイニングのライブラリ     ・Java オープンソース     ・Hadoop(大規模 分散処理基盤)上で動作     ・Hadoop:象, Mahout: 象使い           http://mahout.apache.org                                      44
Mahoutとは         Open Sourceでスケーラブルな       機械学習・データマイニングのライブラリ     ・Apache プロジェクト     ・機械学習・データマイニングのライブラリ     ・Java オープンソース     ・Hadoop(大規模 分散処理基盤)上で動作     ・Hadoop:象, Mahout: 象使い           http://mahout.apache.org                                      45
Mahoutとは           Open Sourceでスケーラブルな         機械学習・データマイニングのライブラリ                               Applications                                                           Examples                Freq.    Genetic     Pattern     Classification    Clustering    Recommenders                Mining                            Math     Utilities                                     Collections    Apache                            Vectors/Matrices/     Lucene/Vectorizer                             (primitives)   Hadoop                            SVD      http://cwiki.apache.org/confluence/display/MAHOUT/Algorithms      http://www.slideshare.net/gsingers/intro-to-apache-mahout                                                                           46
AGENDA  ◆主催者紹介  ◆Mahout JP   ◆創設の思い・目的   ◆Mahoutとは   ◆Mahout活用の課題と方策   ◆現状のMahout情報   ◆Mahout JP  ◆最後に
Mahout 活用の課題と方策     ドキュメント未整備・対象方法論の知識取得で             敷居が高い課題   ・ドキュメント未整備でソースコードから読み解く必要                                 48
Mahout 活用の課題と方策     ドキュメント未整備・対象方法論の知識取得で             敷居が高い課題   ・ドキュメント未整備でソースコードから読み解く必要     ・対象データマイニング・機械学習手法の基礎知識が必要     (唯一ある本 Mahout in Action も Mahoutのごく一部しかカバーされていない)                                                     49
Mahout 活用の課題と方策実行ノウハウ提供・方法論の導入内容の提供による解決課題   ・ドキュメント未整備でソースコードから読み解く必要     ・対象データマイニング・機械学習手法の基礎知識が必要     (唯一ある本 Mahout in Action も Mahoutのごく一部しかカバーされていない)方策   ・Mahout 実行方法のノウハウ提供     ・対象データマイニング・機械学習手法の導入的内容の提供                                                     50
Mahout 活用の課題と方策実行ノウハウ提供・方法論の導入内容の提供による解決 大規模データマイニング・機械学習活用の裾野の拡大課題   ・ドキュメント未整備でソースコードから読み解く必要     ・対象データマイニング・機械学習手法の基礎知識が必要     (唯一ある本 Mahout in Action も Mahoutのごく一部しかカバーされていない)方策   ・Mahout 実行方法のノウハウ提供     ・対象データマイニング・機械学習手法の導入的内容の提供     大規模データマイニング・機械学習の活用による          サービス洗練の裾野拡大                                                     51
AGENDA  ◆主催者紹介  ◆Mahout JP   ◆創設の思い・目的   ◆Mahoutとは   ◆Mahout活用の課題と方策   ◆現状のMahout情報   ◆Mahout JP  ◆最後に
現状のMahout情報 方法論導入~Mahout実行方法までの内容提供が重要   それらを提供しているコンテンツを調べてみた                              53
現状のMahout情報 方法論導入~Mahout実行方法までの内容提供が重要   それらを提供しているコンテンツを調べてみた  活用に必要な知識   各方法に対し   「データマイニング/機械学習手法の導入的内容」   ~「Mahout での実行方法」まで含まれた内容                              54
現状のMahout情報 方法論導入~Mahout実行方法までの内容提供が重要   それらを提供しているコンテンツを調べてみた  活用に必要な知識   各方法に対し   「データマイニング/機械学習手法の導入的内容」   ~「Mahout での実行方法」まで含まれた内容   ・そもそも情報がないものが多い   ・情報があっても大部分が部分的な内容しか含まれていない                                 55
現状のMahout情報  方法論導入~Mahout実行方法まで    含まれている内容を発見                       56
現状のMahout情報方法論導入~Mahout実行方法まで含まれている内容を発見                     「手法の導入的内容」                     「Mahoutでの実行」  http://www.slideshare.net/hamadakoichi/apache-mahout-04-random-forests                                                                           57
現状のMahout情報方法論導入~Mahout実行方法まで含まれている内容を発見    データマイニング+WEB@東京 の各トーク                     「手法の導入的内容」                     「Mahoutでの実行」  http://www.slideshare.net/hamadakoichi/apache-mahout-04-random-forests                                                                           58
現状のMahout情報方法論導入~Mahout実行方法まで含まれている内容を発見    データマイニング+WEB@東京 の各トーク                           59
現状のMahout情報方法論導入~Mahout実行方法まで含まれている内容を発見    データマイニング+WEB@東京 の各トーク 「方法論導入」から「実行方法」まで含まれた内容              =   データマイニング+WEB@東京 のポリシー                           60
現状のMahout情報方法論導入~Mahout実行方法まで含まれている内容を発見    データマイニング+WEB@東京 の各トーク 「方法論導入」から「実行方法」まで含まれた内容              =   データマイニング+WEB@東京 のポリシー          Mahout JP継続                           61
AGENDA  ◆主催者紹介  ◆Mahout JP   ◆創設の思い・目的   ◆Mahoutとは   ◆Mahout活用の課題と方策   ◆現状のMahout情報   ◆Mahout JP  ◆最後に
Mahout JP                Mahout JP https://sites.google.com/site/mahoutjp/            大規模分散データマイニング・機械学習ライブラリ                 Mahout 活用コミュニティ                  Mahout に関する  「方法論導入」から「Mahout実行方法」までの情報内容 発信・共有・議論し               活用の裾野を広げていく                                           63
Mahout JP 内容構成Contents              内容Seminars              Mahout の各機械学習・データマイニングの方法論、Mahout                      での実行法の講師資料まとめです。初めての方はまずここか                      ら見ると分かりやすいと思います。Applications          Mahoutのサービス活用Clustering            クラスタリング:似ているものをグループ化するClassification        分類:分類・判別を行うPattern Mining        パターンマイニング: 頻出パターンを抽出するRecommender           推薦: 興味に合うものを推薦するRegression            回帰: 数値予測を行うDimension Reduction   次元縮約: 説明変数を重要な変数へ縮約Installation          開発環境の構築法members               情報発信メンバー                                                      64
AGENDA  ◆主催者紹介  ◆Mahout JP   ◆創設の思い・目的   ◆Mahoutとは   ◆Mahout活用の課題と方策   ◆現状のMahout情報   ◆Mahout JP  ◆最後に
最後に  一緒に情報発信するメンバーを募集しています大規模データマイニング活用の裾野を広げていきましょう 1.手法~Mahout実行まで   Mahout情報発信・共有したいコンテンツをお送り下さい。 2.アカウントを発行します。                                   66
AGENDA  ◆主催者紹介  ◆Mahout JP   ◆創設の思い・目的   ◆Mahoutとは   ◆Mahout活用の課題と方策   ◆現状のMahout情報   ◆Mahout JP  ◆最後に

Recommended

PDF
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
PDF
Introduction to Mahout Clustering - #TokyoWebmining #6
PDF
ベイジアンネットとレコメンデーション -第5回データマイニング+WEB勉強会@東京
PDF
"Mahout Recommendation" - #TokyoWebmining 14th
PDF
Mahout Canopy Clustering - #TokyoWebmining 9
PDF
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
PDF
ソーシャルデザインパターン -評判と情報収集-
PDF
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
PDF
『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011
PDF
ソーシャルウェブ と レコメンデーション -第4回データマイニング+WEB勉強会@東京
PDF
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
PDF
[データマイニング+WEB勉強会][R勉強会] R言語によるクラスター分析 - 活用編
PDF
[R勉強会][データマイニング] プロセス・リソース・グラフと数理統計解析
PDF
夏サミ2012 [A-2]ソーシャルプラットフォームを使った業務アプリ開発の現場(ソーシャル機能を取り入れたエンタープライズアプリケーション)
PDF
データサイエンティスト協会 木曜勉強会 #09 『意志の力が拓くシステム~最適化の適用事例から見たデータ活用システムの現在と未来~』
PDF
エントリー層向けセミナー#04『はじめての最適化』
PPTX
Jubatus Casual Talks #2: 大量映像・画像のための異常値検知とクラス分類
PDF
10回開催記念 「データマイニング+WEB ~データマイニング・機械学習活用による継続進化~」ー第10回データマイニング+WEB勉強会@東京ー #Toky...
PDF
データマイニングCROSS 第2部-機械学習・大規模分散処理
PDF
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
PDF
『MobageのAnalytics活用したサービス開発』 - データマイニングCROSS2014 #CROSS2014
PDF
Apache Mahout - Random Forests - #TokyoWebmining #8
PDF
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
PDF
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
PDF
DeNAの機械学習・深層学習活用した 体験提供の挑戦
PDF
NIPS 2016 Overview and Deep Learning Topics
PDF
DeNAの大規模データマイニング活用したサービス開発
PDF
Using Mind Maping And UML Effectively in Software Development
PDF
Agile 459 | 11/17 資料
PDF
Modeling in the Agile Age and casual astah models

More Related Content

PDF
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
PDF
Introduction to Mahout Clustering - #TokyoWebmining #6
PDF
ベイジアンネットとレコメンデーション -第5回データマイニング+WEB勉強会@東京
PDF
"Mahout Recommendation" - #TokyoWebmining 14th
PDF
Mahout Canopy Clustering - #TokyoWebmining 9
PDF
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
PDF
ソーシャルデザインパターン -評判と情報収集-
PDF
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop
「R言語による Random Forest 徹底入門 -集団学習による分類・予測-」 - #TokyoR #11
Introduction to Mahout Clustering - #TokyoWebmining #6
ベイジアンネットとレコメンデーション -第5回データマイニング+WEB勉強会@東京
"Mahout Recommendation" - #TokyoWebmining 14th
Mahout Canopy Clustering - #TokyoWebmining 9
R言語による アソシエーション分析-組合せ・事象の規則を解明する-(第5回R勉強会@東京)
ソーシャルデザインパターン -評判と情報収集-
Large Scale Data Mining of the Mobage Service - #PRMU 2011 #Mahout #Hadoop

What's hot

PDF
『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011
PDF
ソーシャルウェブ と レコメンデーション -第4回データマイニング+WEB勉強会@東京
PDF
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
PDF
[データマイニング+WEB勉強会][R勉強会] R言語によるクラスター分析 - 活用編
PDF
[R勉強会][データマイニング] プロセス・リソース・グラフと数理統計解析
PDF
夏サミ2012 [A-2]ソーシャルプラットフォームを使った業務アプリ開発の現場(ソーシャル機能を取り入れたエンタープライズアプリケーション)
PDF
データサイエンティスト協会 木曜勉強会 #09 『意志の力が拓くシステム~最適化の適用事例から見たデータ活用システムの現在と未来~』
PDF
エントリー層向けセミナー#04『はじめての最適化』
PPTX
Jubatus Casual Talks #2: 大量映像・画像のための異常値検知とクラス分類
『モバゲーの大規模データマイニング基盤におけるHadoop活用』-Hadoop Conference Japan 2011- #hcj2011
ソーシャルウェブ と レコメンデーション -第4回データマイニング+WEB勉強会@東京
「はじめてでもわかる RandomForest 入門-集団学習による分類・予測 -」 -第7回データマイニング+WEB勉強会@東京
[データマイニング+WEB勉強会][R勉強会] R言語によるクラスター分析 - 活用編
[R勉強会][データマイニング] プロセス・リソース・グラフと数理統計解析
夏サミ2012 [A-2]ソーシャルプラットフォームを使った業務アプリ開発の現場(ソーシャル機能を取り入れたエンタープライズアプリケーション)
データサイエンティスト協会 木曜勉強会 #09 『意志の力が拓くシステム~最適化の適用事例から見たデータ活用システムの現在と未来~』
エントリー層向けセミナー#04『はじめての最適化』
Jubatus Casual Talks #2: 大量映像・画像のための異常値検知とクラス分類

Viewers also liked

PDF
10回開催記念 「データマイニング+WEB ~データマイニング・機械学習活用による継続進化~」ー第10回データマイニング+WEB勉強会@東京ー #Toky...
PDF
データマイニングCROSS 第2部-機械学習・大規模分散処理
PDF
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
PDF
『MobageのAnalytics活用したサービス開発』 - データマイニングCROSS2014 #CROSS2014
PDF
Apache Mahout - Random Forests - #TokyoWebmining #8
PDF
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
PDF
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
PDF
DeNAの機械学習・深層学習活用した 体験提供の挑戦
PDF
NIPS 2016 Overview and Deep Learning Topics
PDF
DeNAの大規模データマイニング活用したサービス開発
10回開催記念 「データマイニング+WEB ~データマイニング・機械学習活用による継続進化~」ー第10回データマイニング+WEB勉強会@東京ー #Toky...
データマイニングCROSS 第2部-機械学習・大規模分散処理
データマイニングCROSS 2012 Opening Talk - データマイニングの実サービス・ビジネス適用と展望
『MobageのAnalytics活用したサービス開発』 - データマイニングCROSS2014 #CROSS2014
Apache Mahout - Random Forests - #TokyoWebmining #8
『Mobageの大規模データマイニング活用と 意思決定』- #IBIS 2012 -ビジネスと機械学習の接点-
Laplacian Pyramid of Generative Adversarial Networks (LAPGAN) - NIPS2015読み会 #...
DeNAの機械学習・深層学習活用した 体験提供の挑戦
NIPS 2016 Overview and Deep Learning Topics
DeNAの大規模データマイニング活用したサービス開発

Similar to Mahout JP - #TokyoWebmining 11th #MahoutJP

PDF
Using Mind Maping And UML Effectively in Software Development
PDF
Agile 459 | 11/17 資料
PDF
Modeling in the Agile Age and casual astah models
PDF
MapReduce解説
PDF
[ESM_CM セミナー]小さく作って大いに役立つスマートフォンアプリ(CYCLONE)公開用
PDF
DSL駆動によるクラウド・アプリケーション開発
PDF
Object-Functional Analysis and Design : 次世代モデリングパラダイムへの道標
PDF
アジャイル開発の始め方
PDF
開発プロセス 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第2回】 
PDF
Project Facilitation at Kanazawa.rb
PDF
イノベーションスプリント2011 infragisticsにおける世界分散アジャイル開発事例~ communication matters ~
PDF
リッチなドメインモデル 名前探し
PPTX
モデリングの神髄
PPTX
Relationship betweenddd and mvc
PDF
Why Agile Now ? - leanstartup and ARC
PDF
プログラムの大海に溺れないために
PPT
Visualizing Software Development
PDF
SEA-KANSAI #43
PDF
ソフトウェア開発の現場風景
PDF
Process Framework「CYCLONE for Mobile Apps」(20120118)
Using Mind Maping And UML Effectively in Software Development
Agile 459 | 11/17 資料
Modeling in the Agile Age and casual astah models
MapReduce解説
[ESM_CM セミナー]小さく作って大いに役立つスマートフォンアプリ(CYCLONE)公開用
DSL駆動によるクラウド・アプリケーション開発
Object-Functional Analysis and Design : 次世代モデリングパラダイムへの道標
アジャイル開発の始め方
開発プロセス 【クラウドアプリケーションのためのオブジェクト指向分析設計講座 第2回】 
Project Facilitation at Kanazawa.rb
イノベーションスプリント2011 infragisticsにおける世界分散アジャイル開発事例~ communication matters ~
リッチなドメインモデル 名前探し
モデリングの神髄
Relationship betweenddd and mvc
Why Agile Now ? - leanstartup and ARC
プログラムの大海に溺れないために
Visualizing Software Development
SEA-KANSAI #43
ソフトウェア開発の現場風景
Process Framework「CYCLONE for Mobile Apps」(20120118)

More from Koichi Hamada

PDF
Anime Generation with AI
PDF
Generative Adversarial Networks @ ICML 2019
PDF
AIによるアニメ生成の挑戦
PDF
Generative Adversarial Networks (GANs) and Disentangled Representations @ N...
PDF
Generative Adversarial Networks (GAN) @ NIPS2017
PDF
DeNAのAI活用したサービス開発
PDF
対話返答生成における個性の追加反映
PDF
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
PDF
複雑ネットワーク上の伝搬法則の数理
PDF
「樹木モデルとランダムフォレスト-機械学習による分類・予測-」-データマイニングセミナー
PDF
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京
Anime Generation with AI
Generative Adversarial Networks @ ICML 2019
AIによるアニメ生成の挑戦
Generative Adversarial Networks (GANs) and Disentangled Representations @ N...
Generative Adversarial Networks (GAN) @ NIPS2017
DeNAのAI活用したサービス開発
対話返答生成における個性の追加反映
Generative Adversarial Networks (GAN) の学習方法進展・画像生成・教師なし画像変換
複雑ネットワーク上の伝搬法則の数理
「樹木モデルとランダムフォレスト-機械学習による分類・予測-」-データマイニングセミナー
オープニングトーク - 創設の思い・目的・進行方針  -データマイニング+WEB勉強会@東京

Mahout JP - #TokyoWebmining 11th #MahoutJP

  • 1.
    第11回データマイニング+WEB@東京 2011/06/12Mahout JP hamadakoichi 濱田 晃一
  • 2.
  • 3.
  • 4.
  • 5.
  • 6.
    AGENDA ◆主催者紹介 ◆Mahout JP ◆創設の思い・目的 ◆Mahoutとは ◆Mahout活用の課題と方策 ◆現状のMahout情報 ◆Mahout JP ◆最後に
  • 7.
    AGENDA ◆主催者紹介 ◆Mahout JP ◆創設の思い・目的 ◆Mahoutとは ◆Mahout活用の課題と方策 ◆現状のMahout情報 ◆Mahout JP ◆最後に
  • 8.
    hamadakoichi 濱田晃一http://iddy.jp/profile/hamadakoichi 8
  • 9.
    データマイニング+WEB勉強会@東京 データマイニング+WEB勉強会@東京の主催者です TokyoWebmining Google Group: http://groups.google.com/group/webmining-tokyo 9
  • 10.
    講師資料Mahout、R、データマイニング・機械学習、等 各種講師資料を公開しています http://www.slideshare.net/hamadakoichi 10
  • 11.
  • 12.
    活動領域: ソーシャルメディアのデータマイニング 楽しさのマイニング ユーザー体験へ還元 Data Mining Machine Learning of Fun PatternMining Clustering Classification Regression Recommendation TimeSeriesAnalysis StatisticalAnalysis NaturalLanguageProcessing ..etc Social Media Experience Social Graph Detailed Actions Changes of Status Social Communications Personality ..etc 12
  • 13.
    活動領域 活動が紹介されました 13
  • 14.
    活動領域 活動が紹介されました Tech総研 (※記事から抜粋) 14
  • 15.
    活動領域 ソーシャルプラットフォームの大規模データマイニング・機械学習活用によるサービス洗練 Hadoop Conference 2011 15
  • 16.
  • 17.
    hamadakoichi 濱田晃一 理論物理 博士(2004.3取得) 量子統計場の理論Statistical Field Theory Spontaneously Time-Reversal Symmetry Breaking Anisotropic Massless Dirac Fermions 博士論文: http://hosi.phys.s.u-tokyo.ac.jp/~koichi/PhD-thesis.pdf 17
  • 18.
    hamadakoichi 濱田晃一 文部大臣に褒められた 元 文部大臣・法務大臣 六法全書著者・元法学政治学研究科長 森山眞弓さん 菅野和夫さん 18
  • 19.
    hamadakoichi 濱田晃一 毎週末3時間ダンスコーチをしています ■過去、東京と京都でも ダンス部を創設。 コーチをしていました 駒場物理ダンス部 京都大学基礎物理学研究所ダンス部 部長兼コーチ 部長兼コーチ 現在: 毎週末 3時間ダンスコーチ Youtube Channel: http://www.youtube.com/hamadakoichi 19
  • 20.
    hamadakoichi 濱田晃一 Los Angelesでプロダンサーに褒められた ・HIP HOP/House ダンス歴14年 ・ダンス開始後 1年半でL.A.でプロダンサーに褒められる Youtube Channel: http://www.youtube.com/hamadakoichi 20
  • 21.
    数理解析手法の実ビジネスへの適用 2004年 博士号取得後 数理解析手法を実ビジネス適用の方法論構築主な領域◆活動の数理モデル化・解析手法◆活動の分析手法・再構築手法◆活動の実行制御・実績解析システム… 内容抜粋 “Decoupling Executions in Navigating Manufacturing "Unified graph representation of processes Processes for Shortening Lead Time and Its Implementation for scheduling with flexible resource to an Unmanned Machine Shop”, assignment", 21
  • 22.
    数理解析手法の実ビジネスへの適用:活動例 活動の統一グラフモデルを構築・解析 Unified graphical model of processes and resources 青字:割付モデル属性 [ ] : OptionalNode ・priority(優先度) Edge ・duration(予定時間) [・earliest(再早開始日時) ] Process EdgeProcess [・deadline(納期) ] [・or(条件集約数) ] 前プロセスの終了後に後プロセスがプロセスを表す 開始できること表す ・attributes(属性) preemptable(中断可否), successive(引継ぎ可否) Uses Edge workload(作業負荷) Processが使用する uses uses uses uses uses uses Assign Region を表すAssign Region Assigns from Edge同一Resourceを割付け続ける Assign Regionに assigns from assigns from 指定Resourceの子Resource集合の範囲を表す assigns assigns 中から割付けることを示す 企業01 [process] has has [startDate(開始日時)] [endDate(終了日時)] Assigns Edge 製品01 組織A StartDateからEndDateまでの間Resource has Assign RegionにResourceを割付対象要素を表す has has has has has has 割付けることを表す ・capacity(容量) ・calender(カレンダー) AAA01 AAB02 … 山田さん 田中さん 鈴木さん ・attributes(属性) Has Edge 東さん Resourceの所有関係を表す 22
  • 23.
    数理解析手法の実ビジネスへの適用:活動例 一品一様の業務プロセスの 動的なプロセス制御数理体系を構築 全体生産リードタイム中央値を 1/2.7に短縮 設計開始~頭だし出荷リードタイム 設計開始~頭だし出荷CT対週集計開始日時の箱ひげ図 体系適用 500 適用後 設計開始~頭だし出荷CT 400 360.4h(15.0日) 1/2.7 300 200 100 0 0 0 0 0 0 0 0 0 0 0 141.6h(5.9日) 0 0 0 9: 0 9 :0 9 :0 9 :0 9: 0 9 :0 9 :0 9 :0 9: 0 9 :0 9 :0 9 :0 9: 0 9 :0 0 7 4 1 8 5 1 8 5 2 9 6 3 0 /2 /2 /0 /1 /1 /2 /0 /0 /1 /2 /2 /0 /1 /2 09 09 10 10 10 10 11 11 11 11 11 12 12 12 4/ 4/ 4/ 4/ 4/ 4/ 4/ 4/ 4/ 4/ 4/ 4/ 4/ 4/ 2 00 2 00 2 00 2 00 2 00 2 00 2 00 2 00 2 00 2 00 2 00 2 00 2 00 2 00 週集計開始日時 23
  • 24.
    数理解析手法の実ビジネスへの適用:活動例 ビジネスとともに 学術分野でも貢献変動性から生じる動的な課題 ・リソースの競合 ・滞留 ・納期遅延 …一品一様な業務プロセスを含む統計解析・制御数理モデル ・統計的な有効変数算出 ・統計数理モデル化 -優先順位制御 -実行タイミング制御 -統計フィードバック -適正リソース量算出 ・予測数理体系論文(体系の一部)M.Nakao, N. Kobayashi, K.Hamada, T.Totsuka, S.Yamada,“Decoupling Executions in Navigating Manufacturing Processes for Shortening Lead Time and Its Implementationto an Unmanned Machine Shop”,CIRP Annals - Manufacturing Technology Volume 56, Issue 1, Pages 171-174 (2007) 24
  • 25.
    活動領域 ソーシャルプラットフォームの大規模データマイニング・機械学習活用によるサービス洗練 Hadoop Conference 2011 25
  • 26.
    ソーシャルメディアのデータマイニング 楽しさのマイニング ユーザー体験へ還元 Data Mining Machine Learning of Fun PatternMining Clustering Classification Regression Recommendation TimeSeriesAnalysis StatisticalAnalysis NaturalLanguageProcessing ..etc Social Media Experience Social Graph Detailed Actions Changes of Status Social Communications Personality ..etc 26
  • 27.
    ソーシャルメディアのデータマイニング 2300万人以上の人々へ各人のつながり・楽しみ・個性にあった適切なサービス配信 Data Mining Machine Learning of Fun PatternMining Clustering Classification Regression Recommendation TimeSeriesAnalysis StatisticalAnalysis NaturalLanguageProcessing ..etc Social Media Experience Social Graph Detailed Actions Changes of Status Social Communications Personality ..etc 27
  • 28.
    ソーシャルメディアのデータマイニング ソーシャル・活動情報の活用により より適切な情報・サービス配信される世界を実現したい Data Mining Machine Learning of Fun PatternMining Clustering Classification Regression Recommendation TimeSeriesAnalysis StatisticalAnalysis NaturalLanguageProcessing ..etc Social Media Experience Social Graph Detailed Actions Changes of Status Social Communications Personality ..etc 28
  • 29.
    AGENDA ◆主催者紹介 ◆Mahout JP ◆創設の思い・目的 ◆Mahoutとは ◆Mahout活用の課題と方策 ◆現状のMahout情報 ◆Mahout JP ◆最後に
  • 30.
    AGENDA ◆主催者紹介 ◆Mahout JP ◆創設の思い・目的 ◆Mahoutとは ◆Mahout活用の課題と方策 ◆現状のMahout情報 ◆Mahout JP ◆最後に
  • 31.
    Mahout JP 思い 31
  • 32.
    Mahout JP 思い 大規模データを活用し 32
  • 33.
    Mahout JP 思い 大規模データを活用し 継続的に活動進化できる 世界を作りたい 33
  • 34.
  • 35.
    Mahout JP大規模データマイニング・機械学習を 実行・活用したい人が それを実現できるようにしたい 35
  • 36.
    Mahout JP Mahout JP 始めました 36
  • 37.
    AGENDA ◆主催者紹介 ◆Mahout JP ◆創設の思い・目的 ◆Mahoutとは ◆Mahout活用の課題と方策 ◆現状のMahout情報 ◆Mahout JP ◆最後に
  • 38.
  • 39.
    Mahoutとは Open Sourceでスケーラブルな 機械学習・データマイニングのライブラリ ・Apache プロジェクト ・機械学習・データマイニングのライブラリ ・Java オープンソース ・Hadoop(大規模 分散処理基盤)上で動作 (Hadoop:象, Mahout: 象使い) http://mahout.apache.org 39
  • 40.
    Mahoutとは Open Sourceでスケーラブルな 機械学習・データマイニングのライブラリ ・Apache プロジェクト ・機械学習・データマイニングのライブラリ ・Java オープンソース ・Hadoop(大規模 分散処理基盤)上で動作 (Hadoop:象, Mahout: 象使い) http://mahout.apache.org 40
  • 41.
    Mahoutとは Open Sourceでスケーラブルな 機械学習・データマイニングのライブラリ ・Apache プロジェクト ・機械学習・データマイニングのライブラリ ・Java オープンソース ・Hadoop(大規模 分散処理基盤)上で動作 (Hadoop:象, Mahout: 象使い) http://mahout.apache.org 41
  • 42.
    Mahoutとは Open Sourceでスケーラブルな 機械学習・データマイニングのライブラリ ・Apache プロジェクト ・機械学習・データマイニングのライブラリ ・Java オープンソース ・Hadoop(大規模 分散処理基盤)上で動作 (Hadoop:象, Mahout: 象使い) http://mahout.apache.org 42
  • 43.
    Mahoutとは Open Sourceでスケーラブルな 機械学習・データマイニングのライブラリ ・Apache プロジェクト ・機械学習・データマイニングのライブラリ ・Java オープンソース ・Hadoop(大規模 分散処理基盤)上で動作 (Hadoop:象, Mahout: 象使い) http://mahout.apache.org 43
  • 44.
    Mahoutとは Open Sourceでスケーラブルな 機械学習・データマイニングのライブラリ ・Apache プロジェクト ・機械学習・データマイニングのライブラリ ・Java オープンソース ・Hadoop(大規模 分散処理基盤)上で動作 ・Hadoop:象, Mahout: 象使い http://mahout.apache.org 44
  • 45.
    Mahoutとは Open Sourceでスケーラブルな 機械学習・データマイニングのライブラリ ・Apache プロジェクト ・機械学習・データマイニングのライブラリ ・Java オープンソース ・Hadoop(大規模 分散処理基盤)上で動作 ・Hadoop:象, Mahout: 象使い http://mahout.apache.org 45
  • 46.
    Mahoutとは Open Sourceでスケーラブルな 機械学習・データマイニングのライブラリ Applications Examples Freq. Genetic Pattern Classification Clustering Recommenders Mining Math Utilities Collections Apache Vectors/Matrices/ Lucene/Vectorizer (primitives) Hadoop SVD http://cwiki.apache.org/confluence/display/MAHOUT/Algorithms http://www.slideshare.net/gsingers/intro-to-apache-mahout 46
  • 47.
    AGENDA ◆主催者紹介 ◆Mahout JP ◆創設の思い・目的 ◆Mahoutとは ◆Mahout活用の課題と方策 ◆現状のMahout情報 ◆Mahout JP ◆最後に
  • 48.
    Mahout 活用の課題と方策 ドキュメント未整備・対象方法論の知識取得で 敷居が高い課題 ・ドキュメント未整備でソースコードから読み解く必要 48
  • 49.
    Mahout 活用の課題と方策 ドキュメント未整備・対象方法論の知識取得で 敷居が高い課題 ・ドキュメント未整備でソースコードから読み解く必要 ・対象データマイニング・機械学習手法の基礎知識が必要 (唯一ある本 Mahout in Action も Mahoutのごく一部しかカバーされていない) 49
  • 50.
    Mahout 活用の課題と方策実行ノウハウ提供・方法論の導入内容の提供による解決課題 ・ドキュメント未整備でソースコードから読み解く必要 ・対象データマイニング・機械学習手法の基礎知識が必要 (唯一ある本 Mahout in Action も Mahoutのごく一部しかカバーされていない)方策 ・Mahout 実行方法のノウハウ提供 ・対象データマイニング・機械学習手法の導入的内容の提供 50
  • 51.
    Mahout 活用の課題と方策実行ノウハウ提供・方法論の導入内容の提供による解決 大規模データマイニング・機械学習活用の裾野の拡大課題 ・ドキュメント未整備でソースコードから読み解く必要 ・対象データマイニング・機械学習手法の基礎知識が必要 (唯一ある本 Mahout in Action も Mahoutのごく一部しかカバーされていない)方策 ・Mahout 実行方法のノウハウ提供 ・対象データマイニング・機械学習手法の導入的内容の提供 大規模データマイニング・機械学習の活用による サービス洗練の裾野拡大 51
  • 52.
    AGENDA ◆主催者紹介 ◆Mahout JP ◆創設の思い・目的 ◆Mahoutとは ◆Mahout活用の課題と方策 ◆現状のMahout情報 ◆Mahout JP ◆最後に
  • 53.
    現状のMahout情報 方法論導入~Mahout実行方法までの内容提供が重要 それらを提供しているコンテンツを調べてみた 53
  • 54.
    現状のMahout情報 方法論導入~Mahout実行方法までの内容提供が重要 それらを提供しているコンテンツを調べてみた 活用に必要な知識 各方法に対し 「データマイニング/機械学習手法の導入的内容」 ~「Mahout での実行方法」まで含まれた内容 54
  • 55.
    現状のMahout情報 方法論導入~Mahout実行方法までの内容提供が重要 それらを提供しているコンテンツを調べてみた 活用に必要な知識 各方法に対し 「データマイニング/機械学習手法の導入的内容」 ~「Mahout での実行方法」まで含まれた内容 ・そもそも情報がないものが多い ・情報があっても大部分が部分的な内容しか含まれていない 55
  • 56.
  • 57.
    現状のMahout情報方法論導入~Mahout実行方法まで含まれている内容を発見 「手法の導入的内容」 「Mahoutでの実行」 http://www.slideshare.net/hamadakoichi/apache-mahout-04-random-forests 57
  • 58.
    現状のMahout情報方法論導入~Mahout実行方法まで含まれている内容を発見 データマイニング+WEB@東京 の各トーク 「手法の導入的内容」 「Mahoutでの実行」 http://www.slideshare.net/hamadakoichi/apache-mahout-04-random-forests 58
  • 59.
  • 60.
    現状のMahout情報方法論導入~Mahout実行方法まで含まれている内容を発見 データマイニング+WEB@東京 の各トーク 「方法論導入」から「実行方法」まで含まれた内容 = データマイニング+WEB@東京 のポリシー 60
  • 61.
    現状のMahout情報方法論導入~Mahout実行方法まで含まれている内容を発見 データマイニング+WEB@東京 の各トーク 「方法論導入」から「実行方法」まで含まれた内容 = データマイニング+WEB@東京 のポリシー Mahout JP継続 61
  • 62.
    AGENDA ◆主催者紹介 ◆Mahout JP ◆創設の思い・目的 ◆Mahoutとは ◆Mahout活用の課題と方策 ◆現状のMahout情報 ◆Mahout JP ◆最後に
  • 63.
    Mahout JP Mahout JP https://sites.google.com/site/mahoutjp/ 大規模分散データマイニング・機械学習ライブラリ Mahout 活用コミュニティ Mahout に関する 「方法論導入」から「Mahout実行方法」までの情報内容 発信・共有・議論し 活用の裾野を広げていく 63
  • 64.
    Mahout JP 内容構成Contents 内容Seminars Mahout の各機械学習・データマイニングの方法論、Mahout での実行法の講師資料まとめです。初めての方はまずここか ら見ると分かりやすいと思います。Applications Mahoutのサービス活用Clustering クラスタリング:似ているものをグループ化するClassification 分類:分類・判別を行うPattern Mining パターンマイニング: 頻出パターンを抽出するRecommender 推薦: 興味に合うものを推薦するRegression 回帰: 数値予測を行うDimension Reduction 次元縮約: 説明変数を重要な変数へ縮約Installation 開発環境の構築法members 情報発信メンバー 64
  • 65.
    AGENDA ◆主催者紹介 ◆Mahout JP ◆創設の思い・目的 ◆Mahoutとは ◆Mahout活用の課題と方策 ◆現状のMahout情報 ◆Mahout JP ◆最後に
  • 66.
    最後に 一緒に情報発信するメンバーを募集しています大規模データマイニング活用の裾野を広げていきましょう1.手法~Mahout実行まで Mahout情報発信・共有したいコンテンツをお送り下さい。 2.アカウントを発行します。 66
  • 67.
    AGENDA ◆主催者紹介 ◆Mahout JP ◆創設の思い・目的 ◆Mahoutとは ◆Mahout活用の課題と方策 ◆現状のMahout情報 ◆Mahout JP ◆最後に

[8]ページ先頭

©2009-2025 Movatter.jp