4 Introduc)on• Takahiro Inoue (TwiPer: @doryokujin ) • Majored in Mathema:cs in Keio University • Chief Data Scien:st and Solu:on Architect @ Treasure-‐Data Presented by • Leader of Japanese MongoDB Community, MData Scien:st Takahiro Inoue – Chief ongo Masters • doryokujin’s blog hPp://doryokujin.hatenablog.jp/
10 Visualiza)on Types(入力データに基づく分類)ScaUer Plot N-‐Dimensional Graph Map Plot Aggregated Data Cross Tables Raw Data 2-‐Dimensional Graph Math Graph Analyzed Data Sta)s)cal Graph
11.
11 Raw Data Explana)onScaUer Plot(散布図) (for Rawdata) データレコードの任意の数値変数2項目をプロットし,関係を発見する。Map Plot (for Rawdata) 位置情報(緯度,経度)を持つデータポイントを地図上にマッピングし,データの密集度などを参考にする。Math Graph (for Rawdata) データの「関係」を数学的グラフによって表現。
40 統計ソフト部門:ggplot2• ggplot2はRのパッケージ。 • “The Grammar of Graphics”:文法に基づいた柔軟な描画が可能。• ありあわせのChart Libraryから選択するのではなく,文法に基づいて現状の問題にあった描画が可能。• The Grammar of Graphicsをさらに拡張し,「レイヤー」という概念を導入。• 豊富な書籍,ドキュメント
41.
41 描画手続き:The Grammar of Graphics要素 名前 説明 data データ ビジュアル化したい対象。 geom幾何学的オブジェクトプロット上のタイプを決める。{ point, bar, boxplot, line } stat統計的変換データをようやくする様々な方法。オプション。{ density, boxplot, smooth, histogram }scaleスケールデータを「位置」と「カラー」にマッピングする。{ x=0.037, y=0.531, colour=#FF6C91 }coord 座標系オブジェクトの位置を指定された座標系の上にプロット平面にマッピング。{ Cartesian, Map, Polar }facetトリレス・プロットの一般化。データ全体から異なる部分集合を抽出する。ファセット例