Movatterモバイル変換
[0]
ホーム
URL:
画像なし
夜間モード
Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
shunsuke Mikami
PPTX, PDF
2,237 views
Hdfsソースコードリーディング第2回
Technology
◦
Read more
4
Save
Share
Embed
Embed presentation
Download
Downloaded 36 times
1
/ 23
2
/ 23
3
/ 23
4
/ 23
5
/ 23
6
/ 23
7
/ 23
8
/ 23
9
/ 23
10
/ 23
11
/ 23
12
/ 23
13
/ 23
14
/ 23
15
/ 23
16
/ 23
17
/ 23
18
/ 23
19
/ 23
20
/ 23
21
/ 23
22
/ 23
23
/ 23
Recommended
PPTX
Hdfsソースコードリーディング第一回
by
shunsuke Mikami
PPT
Hadoopの紹介
by
bigt23
PPTX
Hadoop gfarm使い方
by
shunsuke Mikami
PDF
分散処理のすゝめ?
by
y oe
PDF
Hadoopとその周辺の紹介
by
Shinya Okano
PDF
なぜApache HBaseを選ぶのか? #cwt2013
by
Cloudera Japan
PPTX
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
by
AdvancedTechNight
PPTX
H2O 3.0
by
池田 直哉
PPTX
Hadoop
by
Atsushi Shimura
PPTX
H2O 3.0 with .net
by
池田 直哉
PPTX
データベース入門
by
拓 小林
PPTX
Tuning maniax 2014 Hadoop編
by
ThinkIT_impress
PPTX
分散ファイルシステムGfarm上でのHadoop MapReduce
by
shunsuke Mikami
PPTX
Cache勉強会
by
Shinji Miyazato
PDF
2019-10-18 JXUG Xamarin.Essentials - #3 File System Helpers
by
Takeshi Fujimoto
PDF
レッドハット グラスター ストレージ Red Hat Gluster Storage (Japanese)
by
Katsutoshi Kojima
PPTX
SASとHadoopとの連携
by
SAS Institute Japan
PDF
2019-09-20 JXUG Introduction to Xamarin.Essentials #2 Preferences
by
Takeshi Fujimoto
PDF
HBaseを用いたグラフDB「Hornet」の設計と運用
by
Toshihiro Suzuki
PDF
DBP-011_Apache Spark for Azure HDInsight ~新世代の Big Data 処理基盤~
by
decode2016
PDF
MapReduceプログラミング入門
by
Satoshi Noto
PDF
Osc2012 spring HBase Report
by
Seiichiro Ishida
PDF
オライリーセミナー Hive入門 #oreilly0724
by
Cloudera Japan
PPT
遊休リソースを用いた相同性検索処理の並列化とその評価
by
Satoshi Nagayasu
PDF
20120913 nosql@hikarie(okuyama fuse)
by
Takahiro Iwase
PDF
ただいまHadoop勉強中
by
Satoshi Noto
PDF
Quick Introduction to GlusterFS
by
Etsuji Nakai
PPTX
Data replication and synchronization ガイダンス
by
Kazuhiro Taguchi
PDF
Hadoop book-2nd-ch3-update
by
Taisuke Yamada
PDF
HDFS basics from API perspective
by
NTT DATA OSS Professional Services
More Related Content
PPTX
Hdfsソースコードリーディング第一回
by
shunsuke Mikami
PPT
Hadoopの紹介
by
bigt23
PPTX
Hadoop gfarm使い方
by
shunsuke Mikami
PDF
分散処理のすゝめ?
by
y oe
PDF
Hadoopとその周辺の紹介
by
Shinya Okano
PDF
なぜApache HBaseを選ぶのか? #cwt2013
by
Cloudera Japan
PPTX
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
by
AdvancedTechNight
PPTX
H2O 3.0
by
池田 直哉
Hdfsソースコードリーディング第一回
by
shunsuke Mikami
Hadoopの紹介
by
bigt23
Hadoop gfarm使い方
by
shunsuke Mikami
分散処理のすゝめ?
by
y oe
Hadoopとその周辺の紹介
by
Shinya Okano
なぜApache HBaseを選ぶのか? #cwt2013
by
Cloudera Japan
ATN No.1 MapReduceだけでない!? Hadoopとその仲間たち
by
AdvancedTechNight
H2O 3.0
by
池田 直哉
What's hot
PPTX
Hadoop
by
Atsushi Shimura
PPTX
H2O 3.0 with .net
by
池田 直哉
PPTX
データベース入門
by
拓 小林
PPTX
Tuning maniax 2014 Hadoop編
by
ThinkIT_impress
PPTX
分散ファイルシステムGfarm上でのHadoop MapReduce
by
shunsuke Mikami
PPTX
Cache勉強会
by
Shinji Miyazato
PDF
2019-10-18 JXUG Xamarin.Essentials - #3 File System Helpers
by
Takeshi Fujimoto
PDF
レッドハット グラスター ストレージ Red Hat Gluster Storage (Japanese)
by
Katsutoshi Kojima
PPTX
SASとHadoopとの連携
by
SAS Institute Japan
PDF
2019-09-20 JXUG Introduction to Xamarin.Essentials #2 Preferences
by
Takeshi Fujimoto
PDF
HBaseを用いたグラフDB「Hornet」の設計と運用
by
Toshihiro Suzuki
PDF
DBP-011_Apache Spark for Azure HDInsight ~新世代の Big Data 処理基盤~
by
decode2016
PDF
MapReduceプログラミング入門
by
Satoshi Noto
PDF
Osc2012 spring HBase Report
by
Seiichiro Ishida
PDF
オライリーセミナー Hive入門 #oreilly0724
by
Cloudera Japan
PPT
遊休リソースを用いた相同性検索処理の並列化とその評価
by
Satoshi Nagayasu
PDF
20120913 nosql@hikarie(okuyama fuse)
by
Takahiro Iwase
PDF
ただいまHadoop勉強中
by
Satoshi Noto
PDF
Quick Introduction to GlusterFS
by
Etsuji Nakai
PPTX
Data replication and synchronization ガイダンス
by
Kazuhiro Taguchi
Hadoop
by
Atsushi Shimura
H2O 3.0 with .net
by
池田 直哉
データベース入門
by
拓 小林
Tuning maniax 2014 Hadoop編
by
ThinkIT_impress
分散ファイルシステムGfarm上でのHadoop MapReduce
by
shunsuke Mikami
Cache勉強会
by
Shinji Miyazato
2019-10-18 JXUG Xamarin.Essentials - #3 File System Helpers
by
Takeshi Fujimoto
レッドハット グラスター ストレージ Red Hat Gluster Storage (Japanese)
by
Katsutoshi Kojima
SASとHadoopとの連携
by
SAS Institute Japan
2019-09-20 JXUG Introduction to Xamarin.Essentials #2 Preferences
by
Takeshi Fujimoto
HBaseを用いたグラフDB「Hornet」の設計と運用
by
Toshihiro Suzuki
DBP-011_Apache Spark for Azure HDInsight ~新世代の Big Data 処理基盤~
by
decode2016
MapReduceプログラミング入門
by
Satoshi Noto
Osc2012 spring HBase Report
by
Seiichiro Ishida
オライリーセミナー Hive入門 #oreilly0724
by
Cloudera Japan
遊休リソースを用いた相同性検索処理の並列化とその評価
by
Satoshi Nagayasu
20120913 nosql@hikarie(okuyama fuse)
by
Takahiro Iwase
ただいまHadoop勉強中
by
Satoshi Noto
Quick Introduction to GlusterFS
by
Etsuji Nakai
Data replication and synchronization ガイダンス
by
Kazuhiro Taguchi
Similar to Hdfsソースコードリーディング第2回
PDF
Hadoop book-2nd-ch3-update
by
Taisuke Yamada
PDF
HDFS basics from API perspective
by
NTT DATA OSS Professional Services
PDF
HDFSのスケーラビリティの限界を突破するためのさまざまな取り組み | Hadoop / Spark Conference Japan 2019 #hc...
by
Yahoo!デベロッパーネットワーク
PDF
HBase on EC2
by
Eiichi Sato
PDF
HDFS vs. MapR Filesystem
by
日本ヒューレット・パッカード株式会社
PDF
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
by
Yahoo!デベロッパーネットワーク
Hadoop book-2nd-ch3-update
by
Taisuke Yamada
HDFS basics from API perspective
by
NTT DATA OSS Professional Services
HDFSのスケーラビリティの限界を突破するためのさまざまな取り組み | Hadoop / Spark Conference Japan 2019 #hc...
by
Yahoo!デベロッパーネットワーク
HBase on EC2
by
Eiichi Sato
HDFS vs. MapR Filesystem
by
日本ヒューレット・パッカード株式会社
Apache Hadoop HDFSの最新機能の紹介(2018)#dbts2018
by
Yahoo!デベロッパーネットワーク
Hdfsソースコードリーディング第2回
1.
HDFSソースコードリーディング(第2回)三上俊輔2010/12/17
2.
自己紹介筑波大学大学院1年Hadoop, Gfarmなど分散ファイルシステムを研究中(主に性能評価など)Twitter: @shun0102三上俊輔の研究日記
: http://shun0102.net
3.
HDFSリーディング概要第一回org.apache.hadoop.fsを中心に見た第二回HDFS-265のappendDesign3.pdfを元にブロックの状態管理について第三回一貫性障害からの復帰
4.
前回の内容HadoopのファイルシステムはプラガブルHadoopMapReduceorg.apache.hadoop.fs.FileSystemHDFS clientOther Filesystems
clientHDFS serverOther Filesystems server
5.
Append/Hflush/Read DesignHDFS-265の appendDesign3.pdfAppendを実装するためにのデザイン設計HDFSの書き込み時、読み込み時、エラー処理の時の振る舞いが細かく書かれているHadoop
0.21これを読むことで、HDFSの一貫性モデル、故障時の振る舞いが具体的にわかる今回は2章をメインに
6.
ブロックの状態管理DataNodeでのブロックをレプリカと呼び、NameNodeでのブロックはブロックと呼ぶNameNode{Finename, numReplicas, block-ids}{block-id,
datanodes}ブロックの状態DataNodesblock-idblock-idblock-idレプリカの状態レプリカの状態レプリカの状態
7.
Append 導入前initCreateTemporaryFinalizedCloseOpen for
AppendAppend導入後errordelete
8.
なぜAppendのために新しいブロックの状態が必要か?Temporaryと finalized のみの状態管理では既にfinalized
したブロックを失う可能性があるfileappendブロックを失ってしまうerrorTemporary block
9.
Appendの目標Appendする前のデータに対する強い耐障害性Hflushしたデータに対する best effortな耐障害性※以前はAtoimicな追記(Hadoop-1700)を目指していたが、今回はAtomicではないHflush:
Datanodeに転送してackが戻ってきたデータ
10.
DataNodeのレプリカの状態以下の5状態があり、これはDataNodeのメモリ上で管理されるFinalizedRbw (Replica Being
Written to)Rwr (Replica Waiting to be Recovered)Rur (Replica Under Recovery)Temporary
11.
Finalized書き込みが終了し、appendのために再オープンされない限りも書き込まれない状態
12.
Rbw (Replica Being
Written to)レプリカが作成されるかappendされる時にrbw状態になる常にファイルの最後のブロック同じblock idの他のレプリカとデータサイズが一致していない状態Bytes はリーダーに見えるが、全てではないかもしれない障害時に出来るだけ保持しようとする
13.
Rwr (Replica Waiting
to be Recovered)データノードが死んで再起動した時、全ての rbwレプリカは rwrになるパイプラインには復帰しないので、新しいバイトは受け取らないクライアントが生きてれば無効になるクライアントも死んでいればリースリカバリに参加する
14.
リースリカバリとはNameNode{Finename, lease expire,
lease holder}Updatelease holderClientWriteDataNode
15.
Rur (Replica Under
Recovery)リースリカバリの結果、レプリカを復旧する時にこの状態になる
16.
Temporaryレプリカ作成か、クラスタのバランシングのためのレプリカRbwと共通点は多いが、リーダーには見えず、DataNodeの再起動時には削除されるdeletedfail or DN
restartTemporaryReplicainitreplicate/copy for balancingsucceedsFinalizedReplica
17.
ディスク上での保存方法dfs.data.dir以下の3つのサブディレクトリに保存されるcurrent (finalized)再起動時に全て finalized
レプリカになるtmp (temporary)再起動時に全て削除されるrbw (rbw, rwr, rur)再起動時に全て rwrレプリカになる
18.
レプリカの状態遷移initCreateReplicaBeingWrittenFinalizedReplicacloseWriteAppendReplicaRecaveryfinishesReplica recovery startsDN
restartsDN diesDN diesReplicaWaiting ToRecoveredReplicaUnderRecoveryReplica recovery startsReplicaRecovery starts
19.
ブロックの状態 (NameNode)UnderConstruction書き込み中のブロックUnderRecoveryリカバリ中のブロックファイルの有効期限が切れるとこの状態になるCommitted全てのバイトを転送し終わって、GSとファイルサイズをfinalized した状態まだ全DataNodeからのackを受け取っていないComplete書き込み完了
20.
ブロックの状態遷移(通常時)initaddBlockAppend if last
block is fullCompleteBlockBlock UnderConstructionclose / addBlockAppendclose / addBlockReceives a GS/Lenmatched finalizedreplicaCommittedBlock
21.
ブロックの状態遷移(クライアントが死んだ場合)CompleteBlockBlock UnderConstructionReceives a
GS/Lenmatched finalizedreplicaLease expires &block recovery startsBlock UnderRecoveryCommittedBlockRecovery succeeds
22.
ブロックの状態遷移(NN再起動時)CompleteBlockBlock UnderConstructionLast blockof
an unclosed fileinitrestReceives a GS/Lenmatched finalizedreplicaLease expires &block recovery startsBlock UnderRecoveryCommittedBlockRecovery succeeds
23.
まとめAppendの目的一度finalizedしたデータに対して強い耐障害性Hflushしたデータに対して best effort
な耐障害性Append のために新しいレプリカ、ブロックの状態を導入レプリカは5状態、ブロックは4状態で管理状態はメモリ上に保存される
Download
[8]
ページ先頭
©2009-2025
Movatter.jp