久しぶりの投稿になってしまいましたが、ニュースパス(現在CM放映中!!)開発部の大曽根です。 作業中はGrover WashingtonJr のWinelightを聴くと元気が出ます。参加ミュージシャンが素晴らしいですね。 なぜ時系列分析をするのか 季節調整 実演 おまけ: 時間別に見てみる まとめ 今後 なぜ時系列分析をするのか 数値を非常に重視している弊社では、数値を知るためのツールとしてRedashやChartioおよびSlackへの通知を活用しています。現在の数値を理解する上では、長期のトレンド(指標が下がっているのか、上がっているのか)を知ることが重要です。しかし、日々変化するデータ(特に売上やKPIと言われる指標)は、ばらつきも大きく、変化を適切に捉えることが難しいこともあります。 特にSlackなどへの通知を行っていると、日々の変化に囚われがちです。例えば、弊社ではニュース


決定木とは 目的変数に属する確率を複数の説明変数の組み合わせで算出する方法。 イメージは以下で、Yes/Noなどの条件に属するかどうかで確率を算出する。 ランダムフォレストとは ランダムフォレストは、アンサンブル学習法(複数の分類器を集めて構成される分類器)の一つ。 決定木を複数集めて使うので、木が集まってフォレスト(森)として使う。 やってみる(sklearnでの決定木) データ用意 ランダムに作ったデータを用意する。 import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn %matplotlib inline from sklearn.datasets import make_blobs # ダミーデータの生成用 X, y = make_blobs(n_samples=5


「計算を行い結果を作図して確認」という作業において計算をリモートで実行するケースも多い.この作業フローについて思い浮かぶ選択肢は以下の通り. 計算結果の出力データ(ログ)をファイルに保存.(テキストベースだったり,シリアライズしたものだったり.)それをクライアントに転送し,別のプログラムで作図,確認する. JupyterNotebookを使う.サーバにてJupyterNotebookサービスを動かし,クライアントからWeb Browserで接続,もちろん図もBrowser上で確認. サーバとリモートデスクトップ接続して,一連の作業を行う. サーバサイドで作図,図のファイル出力まで行う.PNG,PDF等イメージファイルをクライアントPCで見る. これまでは選択肢1, 2を選ぶことが多かったが,今回,選択肢4のサーバサイドでの作図についてTipsを紹介したい. 最初の失敗 「matplot

1リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く