Movatterモバイル変換
[0]
ホーム
URL:
画像なし
夜間モード
Submit Search
OSSで支えられるライブドアの巨大ログ集計 #nhntech
89 likes
7,259 views
SATOSHI TAGOMORI
1 of 27
Download now
Downloaded 111 times
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Ad
Recommended
PDF
Hive Tools in NHN Japan #hadoopreading
SATOSHI TAGOMORI
PDF
PostgreSQL10を導入!大規模データ分析事例からみるDWHとしてのPostgreSQL活用のポイント
NTT DATA OSS Professional Services
PDF
ちょっと理解に自信がないなという皆さまに贈るHadoop/Sparkのキホン (IBM Datapalooza Tokyo 2016講演資料)
hamaken
PDF
HBase at LINE
Shun Nakamura
PPTX
春期夏期実習活動報告会
miii_ozakiii
PPTX
enPiTにおけるチームによるシステム開発演習と学部への展開
Chiemi Watanabe
PPTX
実積ゼミの説明2015
Toshiya Jitsuzumi
PDF
しばちょう先生による特別講義! RMANバックアップの運用と高速化チューニング
オラクルエンジニア通信
PDF
Storage infrastructure using HBase behind LINE messages
LINE Corporation (Tech Unit)
PDF
ログ管理でウキウキAndroid Life (Log Management in Android)
Tomoaki Imai
PDF
クラウド環境向けZabbixカスタマイズ紹介(第5回Zabbix勉強会)
Daisuke Ikeda
PDF
パフォーマンスタブ見れないんですけど!! 株式会社コーソル 河野 敏彦
CO-Sol for Community
PDF
Clojureによるログ収集と解析
Yoshitaka Kawashima
PDF
Splunk_NiteX 「ノンテクエンジニアでも、デキる!ログ解析」
snicker_jp
PDF
Big Data入門に見せかけたFluentd入門
Keisuke Takahashi
PDF
で、次は何がくるの? - 第2回 TIS Matsuri
Yoshitaka Kawashima
PDF
slackのログとりの話
京大 マイコンクラブ
PDF
ログ勉 Vol.1
Kenji Kobayashi
PDF
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
PDF
Hadoopを用いた大規模ログ解析
shuichi iida
PDF
おじさん二人が語る OOW デビューのススメ! Oracle OpenWorld 2016参加報告 [検閲版] 株式会社コーソル 杉本 篤信, 河野 敏彦
CO-Sol for Community
PDF
研究発表のためのプレゼンテーション技術
Shinnosuke Takamichi
PDF
fluentd を利用した大規模ウェブサービスのロギング
Yuichi Tateno
PDF
Fluentdのお勧めシステム構成パターン
Kentaro Yoshida
PDF
Javaのログ出力: 道具と考え方
Taku Miyakawa
PDF
Log analysis with Hadoop in livedoor 2013
SATOSHI TAGOMORI
PPTX
ビッグデータ活用支援フォーラム
Recruit Technologies
PDF
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
NTT DATA OSS Professional Services
PDF
Hadoop ecosystem NTTDATA osc15tk
NTT DATA OSS Professional Services
PDF
Log Analysis System And its designs in LINE Corp. 2014 early
SATOSHI TAGOMORI
More Related Content
Viewers also liked
(17)
PDF
Storage infrastructure using HBase behind LINE messages
LINE Corporation (Tech Unit)
PDF
ログ管理でウキウキAndroid Life (Log Management in Android)
Tomoaki Imai
PDF
クラウド環境向けZabbixカスタマイズ紹介(第5回Zabbix勉強会)
Daisuke Ikeda
PDF
パフォーマンスタブ見れないんですけど!! 株式会社コーソル 河野 敏彦
CO-Sol for Community
PDF
Clojureによるログ収集と解析
Yoshitaka Kawashima
PDF
Splunk_NiteX 「ノンテクエンジニアでも、デキる!ログ解析」
snicker_jp
PDF
Big Data入門に見せかけたFluentd入門
Keisuke Takahashi
PDF
で、次は何がくるの? - 第2回 TIS Matsuri
Yoshitaka Kawashima
PDF
slackのログとりの話
京大 マイコンクラブ
PDF
ログ勉 Vol.1
Kenji Kobayashi
PDF
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
PDF
Hadoopを用いた大規模ログ解析
shuichi iida
PDF
おじさん二人が語る OOW デビューのススメ! Oracle OpenWorld 2016参加報告 [検閲版] 株式会社コーソル 杉本 篤信, 河野 敏彦
CO-Sol for Community
PDF
研究発表のためのプレゼンテーション技術
Shinnosuke Takamichi
PDF
fluentd を利用した大規模ウェブサービスのロギング
Yuichi Tateno
PDF
Fluentdのお勧めシステム構成パターン
Kentaro Yoshida
PDF
Javaのログ出力: 道具と考え方
Taku Miyakawa
Storage infrastructure using HBase behind LINE messages
LINE Corporation (Tech Unit)
ログ管理でウキウキAndroid Life (Log Management in Android)
Tomoaki Imai
クラウド環境向けZabbixカスタマイズ紹介(第5回Zabbix勉強会)
Daisuke Ikeda
パフォーマンスタブ見れないんですけど!! 株式会社コーソル 河野 敏彦
CO-Sol for Community
Clojureによるログ収集と解析
Yoshitaka Kawashima
Splunk_NiteX 「ノンテクエンジニアでも、デキる!ログ解析」
snicker_jp
Big Data入門に見せかけたFluentd入門
Keisuke Takahashi
で、次は何がくるの? - 第2回 TIS Matsuri
Yoshitaka Kawashima
slackのログとりの話
京大 マイコンクラブ
ログ勉 Vol.1
Kenji Kobayashi
MongoDBを用いたソーシャルアプリのログ解析 〜解析基盤構築からフロントUIまで、MongoDBを最大限に活用する〜
Takahiro Inoue
Hadoopを用いた大規模ログ解析
shuichi iida
おじさん二人が語る OOW デビューのススメ! Oracle OpenWorld 2016参加報告 [検閲版] 株式会社コーソル 杉本 篤信, 河野 敏彦
CO-Sol for Community
研究発表のためのプレゼンテーション技術
Shinnosuke Takamichi
fluentd を利用した大規模ウェブサービスのロギング
Yuichi Tateno
Fluentdのお勧めシステム構成パターン
Kentaro Yoshida
Javaのログ出力: 道具と考え方
Taku Miyakawa
Similar to OSSで支えられるライブドアの巨大ログ集計 #nhntech
(20)
PDF
Log analysis with Hadoop in livedoor 2013
SATOSHI TAGOMORI
PPTX
ビッグデータ活用支援フォーラム
Recruit Technologies
PDF
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
NTT DATA OSS Professional Services
PDF
Hadoop ecosystem NTTDATA osc15tk
NTT DATA OSS Professional Services
PDF
Log Analysis System And its designs in LINE Corp. 2014 early
SATOSHI TAGOMORI
PDF
Ruby向け帳票ソリューション「ThinReports」の開発で知るOSSの威力
ThinReports
PDF
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
PDF
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
NTT DATA OSS Professional Services
PDF
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
Hideo Takagi
PDF
トレジャーデータとtableau実現する自動レポーティング
Takahiro Inoue
PDF
20130313 OSCA Hadoopセミナー
Ichiro Fukuda
PDF
Beginner must-see! A future that can be opened by learning Hadoop
DataWorks Summit
PPTX
WebDB Forum 2012 基調講演資料
Recruit Technologies
PPTX
Fluentdの監視サービス (Treasure Agent Monitoring Service) by Treasure Data
Kiyoto Tamura
PDF
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
YusukeKuramata
PDF
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
NTT DATA OSS Professional Services
PDF
Big Data Visual Analytics Realized By Hadoop and Tableau
DataWorks Summit
PDF
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
hamaken
PDF
170827 jtf garafana
OSSラボ株式会社
PDF
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
日本ヒューレット・パッカード株式会社
Log analysis with Hadoop in livedoor 2013
SATOSHI TAGOMORI
ビッグデータ活用支援フォーラム
Recruit Technologies
分散処理基盤Apache Hadoop入門とHadoopエコシステムの最新技術動向 (オープンソースカンファレンス 2015 Tokyo/Spring 講...
NTT DATA OSS Professional Services
Hadoop ecosystem NTTDATA osc15tk
NTT DATA OSS Professional Services
Log Analysis System And its designs in LINE Corp. 2014 early
SATOSHI TAGOMORI
Ruby向け帳票ソリューション「ThinReports」の開発で知るOSSの威力
ThinReports
分散処理基盤ApacheHadoop入門とHadoopエコシステムの最新技術動向(OSC2015 Kansai発表資料)
NTT DATA OSS Professional Services
分散処理基盤Apache Hadoopの現状と、NTTデータのHadoopに対する取り組み
NTT DATA OSS Professional Services
【ウェブセミナー】マネージドな 100% OSS アナリティクス プラットフォーム HDInsight の最新事情
Hideo Takagi
トレジャーデータとtableau実現する自動レポーティング
Takahiro Inoue
20130313 OSCA Hadoopセミナー
Ichiro Fukuda
Beginner must-see! A future that can be opened by learning Hadoop
DataWorks Summit
WebDB Forum 2012 基調講演資料
Recruit Technologies
Fluentdの監視サービス (Treasure Agent Monitoring Service) by Treasure Data
Kiyoto Tamura
今注目のSpark SQL、知っておきたいその性能とは 20151209 OSC Enterprise
YusukeKuramata
並列分散処理基盤Hadoopの紹介と、開発者が語るHadoopの使いどころ (Silicon Valley x 日本 / Tech x Business ...
NTT DATA OSS Professional Services
Big Data Visual Analytics Realized By Hadoop and Tableau
DataWorks Summit
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
hamaken
170827 jtf garafana
OSSラボ株式会社
AI・HPC・ビッグデータで利用される分散ファイルシステムを知る
日本ヒューレット・パッカード株式会社
Ad
More from SATOSHI TAGOMORI
(20)
PDF
Ractor's speed is not light-speed
SATOSHI TAGOMORI
PDF
Good Things and Hard Things of SaaS Development/Operations
SATOSHI TAGOMORI
PDF
Maccro Strikes Back
SATOSHI TAGOMORI
PDF
Invitation to the dark side of Ruby
SATOSHI TAGOMORI
PDF
Hijacking Ruby Syntax in Ruby (RubyConf 2018)
SATOSHI TAGOMORI
PDF
Make Your Ruby Script Confusing
SATOSHI TAGOMORI
PDF
Hijacking Ruby Syntax in Ruby
SATOSHI TAGOMORI
PDF
Lock, Concurrency and Throughput of Exclusive Operations
SATOSHI TAGOMORI
PDF
Data Processing and Ruby in the World
SATOSHI TAGOMORI
PDF
Planet-scale Data Ingestion Pipeline: Bigdam
SATOSHI TAGOMORI
PDF
Technologies, Data Analytics Service and Enterprise Business
SATOSHI TAGOMORI
PDF
Ruby and Distributed Storage Systems
SATOSHI TAGOMORI
PDF
Perfect Norikra 2nd Season
SATOSHI TAGOMORI
PDF
Fluentd 101
SATOSHI TAGOMORI
PDF
To Have Own Data Analytics Platform, Or NOT To
SATOSHI TAGOMORI
PDF
The Patterns of Distributed Logging and Containers
SATOSHI TAGOMORI
PDF
How To Write Middleware In Ruby
SATOSHI TAGOMORI
PDF
Modern Black Mages Fighting in the Real World
SATOSHI TAGOMORI
PDF
Open Source Software, Distributed Systems, Database as a Cloud Service
SATOSHI TAGOMORI
PDF
Fluentd Overview, Now and Then
SATOSHI TAGOMORI
Ractor's speed is not light-speed
SATOSHI TAGOMORI
Good Things and Hard Things of SaaS Development/Operations
SATOSHI TAGOMORI
Maccro Strikes Back
SATOSHI TAGOMORI
Invitation to the dark side of Ruby
SATOSHI TAGOMORI
Hijacking Ruby Syntax in Ruby (RubyConf 2018)
SATOSHI TAGOMORI
Make Your Ruby Script Confusing
SATOSHI TAGOMORI
Hijacking Ruby Syntax in Ruby
SATOSHI TAGOMORI
Lock, Concurrency and Throughput of Exclusive Operations
SATOSHI TAGOMORI
Data Processing and Ruby in the World
SATOSHI TAGOMORI
Planet-scale Data Ingestion Pipeline: Bigdam
SATOSHI TAGOMORI
Technologies, Data Analytics Service and Enterprise Business
SATOSHI TAGOMORI
Ruby and Distributed Storage Systems
SATOSHI TAGOMORI
Perfect Norikra 2nd Season
SATOSHI TAGOMORI
Fluentd 101
SATOSHI TAGOMORI
To Have Own Data Analytics Platform, Or NOT To
SATOSHI TAGOMORI
The Patterns of Distributed Logging and Containers
SATOSHI TAGOMORI
How To Write Middleware In Ruby
SATOSHI TAGOMORI
Modern Black Mages Fighting in the Real World
SATOSHI TAGOMORI
Open Source Software, Distributed Systems, Database as a Cloud Service
SATOSHI TAGOMORI
Fluentd Overview, Now and Then
SATOSHI TAGOMORI
Ad
Recently uploaded
(9)
PDF
2023年版Web3技術の理想と現実
Syuhei Hiya
PDF
ABC2025S LT講演「世界の窓から Androidこんにちは2025」アプリ自動生成の将来?ロボティクスの夢再び?
嶋 是一 (Yoshikazu SHIMA)
PDF
Hyperledger Fabric公式サンプル fabric-samples徹底解説
LFDT Tokyo Meetup
PDF
SIG-AUDIO 2025 Vol.02 オンラインセミナー SIG-Audioプレゼン資料_オーディオプラグイン開発_塩澤達矢.pdf
IGDA Japan SIG-Audio
PDF
Hyperledger Fabric最新v3.x系での機能強化、変更点にキャッチアップ!
LFDT Tokyo Meetup
PDF
20250630_aws_reinforce_2025_aws_sheild_network_security_director
uedayuki
PDF
20250710_Devinで切り拓くDB革命_〜価値創出に集中せよ〜.pdf
Masaki Yamakawa
PDF
生成AIパネルトーク(Interop25Tokyo APPS JAPAN M1-07,M2-07 嶋ポジショントーク)
嶋 是一 (Yoshikazu SHIMA)
PDF
人気ブロックチェーン基盤「Hyperledger Fabric」最新版を動かしてみた!
LFDT Tokyo Meetup
2023年版Web3技術の理想と現実
Syuhei Hiya
ABC2025S LT講演「世界の窓から Androidこんにちは2025」アプリ自動生成の将来?ロボティクスの夢再び?
嶋 是一 (Yoshikazu SHIMA)
Hyperledger Fabric公式サンプル fabric-samples徹底解説
LFDT Tokyo Meetup
SIG-AUDIO 2025 Vol.02 オンラインセミナー SIG-Audioプレゼン資料_オーディオプラグイン開発_塩澤達矢.pdf
IGDA Japan SIG-Audio
Hyperledger Fabric最新v3.x系での機能強化、変更点にキャッチアップ!
LFDT Tokyo Meetup
20250630_aws_reinforce_2025_aws_sheild_network_security_director
uedayuki
20250710_Devinで切り拓くDB革命_〜価値創出に集中せよ〜.pdf
Masaki Yamakawa
生成AIパネルトーク(Interop25Tokyo APPS JAPAN M1-07,M2-07 嶋ポジショントーク)
嶋 是一 (Yoshikazu SHIMA)
人気ブロックチェーン基盤「Hyperledger Fabric」最新版を動かしてみた!
LFDT Tokyo Meetup
OSSで支えられるライブドアの巨大ログ集計 #nhntech
1.
OSSで支えられる
ライブドアの巨大ログ集計 - HiveとFluentd - 第2回 NHNテクノロジーカンファレンス 2012/08/18 TAGOMORI Satoshi (@tagomoris)12年8月18日土曜日
2.
TAGOMORI Satoshi (@tagomoris)
NHNJapan株式会社 ウェブサービス本部 開発2室12年8月18日土曜日
3.
今日の話
どういうことをやっているかの話 機能とコンポーネント分離の話 規模の拡大とデプロイの話12年8月18日土曜日
4.
どういうことをやっているかの話12年8月18日土曜日
5.
アクセスログ収集・集計
システム・サービスの稼動状況を明確にする PV, UUの集計 HTTPレスポンスコード毎の割合の時系列変化 レスポンスタイムの統計・時系列変化 そのほか必要に応じたログ調査など12年8月18日土曜日
6.
概要
Web Server Fluentd log Web Server info Graphs (GrowthForecast) log Hive Client query Hive Server Hadoop/HDFS12年8月18日土曜日
7.
構成ソフトウェア
Hadoop Cluster (Hadoop, Hive) CDH3u5 + CentOS5 + JDK6 Fluentd Cluster Fluentd 0.10.25 + CentOS5 + Ruby 1.9.3-p194 + jemalloc Others GrowthForecast, HRForecast fluent-agent-lite, Shib, ShibUI12年8月18日土曜日
8.
Hive
オープンソースプロダクト Hadoop MapReduce のためのDSL(ドメイン特化言語) HiveQL というほぼSQLそのままのものを使える 特に集計・統計においてパフォーマンスが良い Hive Server経由でRPCを使える12年8月18日土曜日
9.
Fluentd
オープンソースプロダクト 構造化ログ収集用ソフトウェア インストールが簡単、拡張性があり、比較的高速に動作 プラグイン機構を備えていて豊富な公開プラグインが存在 いくつかの機能を使うことでデータ処理にも使用可能12年8月18日土曜日
10.
アクセスログ収集・集計
ログ収集・変換: Fluentd 集計処理: Hive リアルタイム統計処理: Fluentd12年8月18日土曜日
11.
概要
Web Server Fluentd log Web Server info Graphs (GrowthForecast) log Hive Client query Hive Server Hadoop/HDFS12年8月18日土曜日
12.
実装の詳細
"Hive Tools in NHN Japan" Hadoop Source Code Reading vol.9 (2012/05/30) http://www.slideshare.net/tagomoris/hive-tools-in-nhn-japan-hadoopreading "Distributed message stream processing on Fluentd" Fluentd meetup in Japan #1 (2012/02/04) http://www.slideshare.net/tagomoris/distributed-stream-processing-on-fluentd-fluentd "Plugins by tagomoris" Fluentd Casual Talks (2012/05/18) http://www.slideshare.net/tagomoris/plugins-by-tagomoris-fluentdcasual12年8月18日土曜日
13.
実装の詳細
ごめん、無理…… "Hive Tools in NHN Japan" 30分 Hadoop Source Code Reading vol.9 (2012/05/30) http://www.slideshare.net/tagomoris/hive-tools-in-nhn-japan-hadoopreading "Distributed message stream processing on Fluentd" Fluentd meetup in Japan #1 (2012/02/04) 60分 30分 http://www.slideshare.net/tagomoris/distributed-stream-processing-on-fluentd-fluentd "Plugins by tagomoris" Fluentd Casual Talks (2012/05/18) 10分 30分 http://www.slideshare.net/tagomoris/plugins-by-tagomoris-fluentdcasual12年8月18日土曜日
14.
集計クエリの登録と実行
Shib / ShibUI の画面でごらんください Shib でのクエリ入力と実行 ShibUI でのクエリ登録、グラフの閲覧 ShibUI でのクエリ作成12年8月18日土曜日
15.
Why We Don't
Use Data Analytics Services?12年8月18日土曜日
16.
なぜ自分達で作るか
なぜ Google Analytics (or others)じゃいけないのか? 根拠: 数字の理由が説明可能でなければならない 再現性: データさえあれば追試可能でなければならない 機能と継続性の問題 機能とコンポーネント分離の話 規模の拡大とデプロイの話12年8月18日土曜日
17.
機能とコンポーネント分離の話12年8月18日土曜日
18.
コンポーネント分離
Hadoop / HDFS Hive Server 例:Hive系 Shib (node.js) ShibUI (Perl/Plack Web Application: Kossy) Users (Web Browser) HRForecast12年8月18日土曜日
19.
機能のアップデート
ミドルウェアの機能アップデート この分野のツールはアップデートが頻繁にある しかも適用したいアップデートが多い UIツール等の機能アップデート (社内)ユーザ向けの機能の追加・修正など 頻繁に行えないようでは仕事をしているとは言えない12年8月18日土曜日
20.
機能向上のための鉄則
頻繁に、ただし全体を壊さずにアップデートしたい コンポーネント分離を徹底する インターフェイスを明確に定めて疎結合化するため ある箇所の変更の影響範囲をできるだけ小さくするため 小さく、変更内容が追えるツールをOSSで揃える 更新タイミングをコントロール可能な状態を維持する12年8月18日土曜日
21.
規模の拡大とデプロイの話12年8月18日土曜日
22.
デプロイ対象
deliver archiver backup servers deliver servers servers worker worker worker worker worker worker worker worker worker servers servers serializer serializer 例:Fluentdクラスタ HDFS (WebHDFS)12年8月18日土曜日
23.
規模の拡大への対応
量の拡大 PV増にともなうアクセスログの増大への対応 「サーバを増やしてリストに追加するだけ」になってる? バリエーションの拡大 サービス増減に関して手間がかかるようでは駄目 「ログを流せばあとは全自動」になってる? 私見 「スケールする」と言うとき、両方に対応できているべき12年8月18日土曜日
24.
スケールするクラスタ構成の鉄則
変更は少なく、追加は容易に 変更なしでバリエーション増に対応できる設定セットを作る その上で規模の桁が違う一部にだけ特例の設定を行う 汎用の公開ソフトウェアを可能な限りそのまま使う デプロイ手順が複雑な構成はスケールしない できるだけミドルウェアに任せることで複雑さを軽減する 10%+の性能よりもデプロイ容易性の方が価値が高い12年8月18日土曜日
25.
場合によっては
あらゆるところに 手を入れる覚悟をしておく12年8月18日土曜日
26.
コンセプトの良いOSSを
選んで使う Hive と Fluentd12年8月18日土曜日
27.
Thanks!
photo: crouton & luke by @kbysmnr12年8月18日土曜日
Download
[8]
ページ先頭
©2009-2025
Movatter.jp