Movatterモバイル変換

© 2020 NTT DATA Corporation 5Javaで実装Java部分は多くのプラットフォームで動く性能向上等の目的で(Cで書かれた)nativeコードをJNI経由で利用nativeコードがなければpure Java実装にフォールバックLinuxのシステムコール前提な部分が多い特にHDFSに関しては実用上Linuxを使うべきCLIはbashスクリプトWindows対応の名残はあるが今はあまりメンテされてないMicrosoft AzureのHDInsightもUbuntuを利用# Amazon EMRはAmazon Linuxプラットフォーム互換性

© 2020 NTT DATA Corporation 6ユーザとHadoopとのインタラクション分散ファイルシステム(HDFS)上のデータの読み書き分散処理フレームワーク(YARN)へのジョブ投入ジョブおよびクラスタそれ自体の運用監視(マイナー)バージョンアップでユーザ側に影響を与えないように互換性を維持するpublicなAPIのシグネチャCLIのオプション(メタ)データフォーマットメトリクス監査ログのフォーマット...Hadoopとのインタラクション

© 2020 NTT DATA Corporation 7実用上、多種多様な周辺ミドルウェアと組み合わせて利用するSpark: モダンな分散処理基盤/API (deprecating MapReduce)Hive: SQL(ライクな)言語処理系HBase: 分散KVS (like Bigtable)Sqoop: データローダOozie: ワークフロースケジューラRanger: アクセス制御...ユーザアプリケーションと周辺ミドルウェアの両方がHadoopのAPIを使うHadoop側の非互換な変更の影響を受ける範囲が広いHadoopエコシステム

© 2020 NTT DATA Corporation 9いろいろな側面から互換性について定めているhttps://hadoop.apache.org/docs/r3.3.0/hadoop-project-dist/hadoop-common/Compatibility.htmlJava API, Native Dependencies, Wire Protocols, Transports, REST APIs, Log Output,Audit Log Output, Metrics/JMX, File formats & Metadata...基本路線は、メジャーバージョンアップでのみ互換性を壊す変更を行うメジャーリリースなら変更できるが、ユーザはなかなか移行してくれないHadoop 3.0.0は2017年12月にリリースされたが、移行はなかなか進まなかった今でもHadoop 2.xは使われていて、メンテされているApache Hadoop Compatibility

© 2020 NTT DATA Corporation 11Javaではpublic, protected, privateのような修飾子で可視性を制御すべてのpublicなクラス/メソッドがエンドユーザ向けではないモジュール間で参照できるためにpublicなものも多いそれを示すためのInterfaceAudienceアノテーションが付いている@InterfaceAudience.PublicなものだけJavadocが出力される@InterfaceAudience.Privateだとマイナーバージョンアップでも変更されうるアノテーションがついてるから外から呼べなくなるわけではない歴史的経緯で周辺ミドルウェアから呼ばれていることも多いAPIを足すのは容易だが、変更/削除はそうではない。publicだけどprivate@InterfaceAudience.LimitedPrivate({ "MapReduce", "HBase" })@InterfaceStability.Unstablepublic class DistributedFileSystem extends FileSystemimplements KeyProviderTokenIssuer, BatchListingOperations {...DistributedFileSystem.java:

© 2020 NTT DATA Corporation 12Java 9に入ったProject Jigsawの成果どのAPIを外部に晒すかを制御しやすくなるHadoopでのModule対応はまだ始まっていないパッケージ構造はそれなりに整理する必要があるJava 9(以降)でビルドできるようにするのが実は大変依存ライブラリをJava 9以降に対応したバージョンにupgrade広範囲で使われている場合の修正が困難: e.g. Jersey (HADOOP-15984)Java 8サポートのdropは次のメジャーバージョンアップ (Hadoop 4.0.0)?Java Platform Module System (JPMS)

© 2020 NTT DATA Corporation 15データのシリアライゼーションのためのライブラリ類似製品としてThrift, Avro, MessagePackなどが挙げられるメッセージとシグネチャを定義した.protoファイルから(各種言語の)コードを自動生成生成された(Javaの)コードをHadoop RPCのコードが使うProtocol Buffersmessage GetBlockLocationsRequestProto {required string src = 1; // file namerequired uint64 offset = 2; // range start offsetrequired uint64 length = 3; // range length}message GetBlockLocationsResponseProto {optional LocatedBlocksProto locations = 1;}...service ClientNamenodeProtocol {rpc getBlockLocations(GetBlockLocationsRequestProto)returns(GetBlockLocationsResponseProto);...ClientNamenodeProtocol.protoの抜粋:

© 2020 NTT DATA Corporation 16あってもなくてもよいフィールドbackward compatibleに追加できる旧バージョンのmessageはoptionalなフィールドを持たない場合と解釈できるフィールドを足すのは容易だが、変更/削除はそうではない。Protocol Buffersのoptional fieldmessage RpcRequestHeaderProto { // the header for the RpcRequest...optional RpcKindProto rpcKind = 1;optional OperationProto rpcOp = 2;required sint32 callId = 3; // a sequence number that is sent back in responserequired bytes clientId = 4; // Globally unique client ID// clientId + callId uniquely identifies a request// retry count, 1 means this is the first retryoptional sint32 retryCount = 5 [default = -1];optional RPCTraceInfoProto traceInfo = 6; // tracing infooptional RPCCallerContextProto callerContext = 7; // call contextoptional int64 stateId = 8; // The last seen Global State ID}RpcHeader.protoの抜粋:

© 2020 NTT DATA Corporation 17複数言語に対応しているC++, Java, Python, Go,Dart, Ruby, C#,Hadoopビルトインのパーツでは一部しか活用していないHadoop本体はJavaHDFSのC++クライアント(libhdfspp)はProtocol Buffersで生成したC++のコードを利用# HDFSのCクライアント(libhdfs)はJNIでJavaのコードを呼び出すProtocol Buffersによる多言語対応

© 2020 NTT DATA Corporation 18Protocol Buffers自体のバージョンアップは大変2011年にProtobol Buffersを導入 (HADOOP-7773)2013年ごろからずっとProtocol Buffers 2.5.02019年にProtocol Buffers 3.7.1にupgrade (HADOOP-13363)RpcEngineのコードは古いものものも残されているWritableRpcEngine: Hadoop独自のシリアライゼーション(Writable)ProtobufRpcEngine: protobuf-2.5.0ProtobufRpcEngine2: hadoop-thirdparty(後述)のshaded protobuf-3.7.1切り替えて使いわけるものではない新しい仕組みに根本的な問題があった時に切り戻すためこの仕組みを使っている関連プロダクト(Hive, Tez)のためモジュールを足すのは容易?だが、変更/削除はそうではない。Protocol Buffersのアップグレード

© 2020 NTT DATA Corporation 20HadoopはMavenを利用多くのプロダクトに依存し多くのプロダクトから依存されている# Hadoopエコシステムのプロダクト同士の相互依存もあるユーザアプリケーションを実行するフレームワーク競合しがちなdependenciesSLF4J, Log4jcommons-logging, commons-cli, commons-httpclientJacksonGuavaNetty, Jetty, Jerseyprotobuf-javaZooKeeper, Curator...Hadoopの依存関係

© 2020 NTT DATA Corporation 21https://maven.apache.org/guides/introduction/introduction-to-dependency-mechanism.html#Transitive_Dependencies依存ライブラリの依存ライブラリも依存ライブラリ同一クラスローダ上に同じクラスの異なるバージョンは並存できない依存関係ツリー上に複数のバージョンがある場合、近いものが勝つ (dependency mediation)mediationの結果、問題なくビルドできて動くという保証はないHadoopエコシステムのプロダクトの依存関係ツリーは、さらに深くなるTransitive dependencies$ mvn dependency:tree -Dmaven-dependency-plugin.version=2.10 -Dverbose...[INFO] org.apache.hadoop:hadoop-common:jar:3.4.0-SNAPSHOT...[INFO] +- org.apache.httpcomponents:httpclient:jar:4.5.13:compile[INFO] | +- org.apache.httpcomponents:httpcore:jar:4.4.13:compile[INFO] | +- (commons-logging:commons-logging:jar:1.1.3:compile - version managed from 1.2; omitted for duplicate)...[INFO] +- commons-logging:commons-logging:jar:1.1.3:compile...[INFO] +- commons-beanutils:commons-beanutils:jar:1.9.4:compile[INFO] | +- (commons-logging:commons-logging:jar:1.1.3:compile - version managed from 1.2; omitted for duplicate)[INFO] | - (commons-collections:commons-collections:jar:3.2.2:compile - omitted for duplicate)[INFO] +- org.apache.commons:commons-configuration2:jar:2.1.1:compile[INFO] | - (commons-logging:commons-logging:jar:1.1.3:compile - version managed from 1.2; omitted for duplicate)hadoop-commonのcommon-loggingに関するdependency mediation:

© 2020 NTT DATA Corporation 22hadoop-clientのtransitive dependenciesを隠したものHadoop 3.0.0で登場 (HADOOP-11804)maven-shade-pluginのrelocation機能を利用依存ライブラリと、その呼び出し箇所のパッケージ名をバイトコード上書き換え衝突しがちな依存ライブラリを自分専用にして抱えるhadoop-client-api: relocateされたorg.apache.hadoop.*が入ったfat jarhadoop-client-runtime: relocateされた依存ライブラリが入ったfat jarhadoop-client-apiとhadoop-client-runtime (aka shaded client)$ ls -lh hadoop-client-api-3.4.0-SNAPSHOT.jar-rw-rw-r--. 1 centos centos 19M Dec 11 11:05 hadoop-client-api-3.4.0-SNAPSHOT.jar$ ls -lh hadoop-client-runtime-3.4.0-SNAPSHOT.jar-rw-rw-r--. 1 centos centos 30M Dec 11 11:07 hadoop-client-runtime-3.4.0-SNAPSHOT.jar$ jar tvf hadoop-client-runtime-3.4.0-SNAPSHOT.jar | grep '/shaded/' | awk '{print $8}'...org/apache/hadoop/shaded/com/google/common/annotations/VisibleForTesting.classorg/apache/hadoop/shaded/com/google/common/base/Absent.class...hadoop-client-apiとhadoop-client runtime:

© 2020 NTT DATA Corporation 23relocateされるクラスを引数にとるメソッドがあるとまずい (HADOOP-16080)ビルド(mvn package)にすごく時間がかかる関係ない部分を開発してるときは-DskipShadeでスキップできるshaded clientの注意点$ mvn clean install -DskipTests -DskipShadeshaded clientをスキップしてビルド:

© 2020 NTT DATA Corporation 24relocateしたライブラリを独立のartifactとしてリリースしたものhttps://github.com/apache/hadoop-thirdpartyhadoop-client以外の場所でもtransitive dependencyを隠すときに使うHadoopは置き換えられたパッケージ名を明示的に指定する現時点ではProtocol Buffers、Guava、Jaegerがhadoop-thirdpartyに含まれるhadoop-thirdparty<dependency><groupId>org.apache.hadoop.thirdparty</groupId><artifactId>hadoop-shaded-protobuf_3_7</artifactId></dependency>hadoop-commonのpom.xml:import org.apache.hadoop.thirdparty.protobuf.BlockingService;RPC.java:<relocation><pattern>com/google/protobuf</pattern><shadedPattern>org.apache.hadoop.thirdparty.protobuf</shadedPattern></relocation>hadoop-thirdparty/hadoop-shaded-protobuf_3_7のpom.xml (を分かりやすさのために変数展開したもの):

© 2020 NTT DATA Corporation 25transitive dependencyのupgradeや削除はdependentに影響するhadoop-thirdpartyとオリジナルのライブラリを共存させて使えるHadoop自体はhadoop-thirdpartyのライブラリを使うコードに移行shaded protobuf-3.7.1を使うProtobufRpcEngine2dependentのためにオリジナル版を使うコードを残すprotobuf-2.5.0を使うProtobufRpcEnginehadoop-thirdpartyのユースケース<dependencies><dependency><groupId>org.apache.hadoop.thirdparty</groupId><artifactId>hadoop-shaded-protobuf_3_7</artifactId></dependency>...<dependency><groupId>com.google.protobuf</groupId><artifactId>protobuf-java</artifactId><scope>compile</scope></dependency>...hadoop-commonのpom.xml:

© 2020 NTT DATA Corporation 26アプリケーション用のClassLoaderを作る試み(YARN-286, MAPREDUCE-1700, HADOOP-10893)特定のパターンにマッチするクラスをアプリケーションのclasspathからロードしないパターンのデフォルト値はjava.,javax.accessibility.,javax.activation.,javax.activity.,javax.annotation.,javax.annotation.processing.,javax.crypto.,javax.imageio.,javax.jws.,javax.lang.model.,-javax.management.j2ee.,javax.management.,javax.naming.,javax.net.,javax.print.,javax.rmi.,javax.script.,-javax.security.auth.message.,javax.security.auth.,javax.security.cert.,javax.security.sasl.,javax.sound.,javax.sql.,javax.swing.,javax.tools.,javax.transaction.,-javax.xml.registry.,-javax.xml.rpc.,javax.xml.,org.w3c.dom.,org.xml.sax.,org.apache.commons.logging.,org.apache.log4j.,-org.apache.hadoop.hbase.,org.apache.hadoop.,core-default.xml,hdfs-default.xml,mapred-default.xml,yarn-default.xml# see https://github.com/apache/hadoop/blob/rel/release-3.3.0/hadoop-common-project/hadoop-common/src/main/resources/org.apache.hadoop.application-classloader.propertiesこの路線の改善は進んでいない (HADOOP-13070)ApplicationClassLoader<property><name>mapreduce.job.classloader</name><value>true</value></property>MapReduceアプリケーションでApplicationClassLoaderを使う設定(mapred-site.xml):export HADOOP_USE_CLIENT_CLASSLOADER=trueHadoopクライアントでApplicationClassLoaderを使う設定(hadoop-env.sh):

© 2020 NTT DATA Corporation 30誰がどういう操作をしたかの記録タブ区切りの独自フォーマットいまならもっとよいフォーマットにできそうだが..機械的に処理してチェックされがちなので積極的に変えない監査ログip=/x.x.x.x cmd=mkdirs src=/tmp dst=null perm=centos:supergroup:rwxr-xr-x proto=rpcip=/x.x.x.x cmd=setPermission src=/tmp dst=null perm=centos:supergroup:rwxrwxrwx proto=rpcip=/x.x.x.x cmd=create src=/tmp/README.txt._COPYING_ dst=null perm=centos:supergroup:rw-r--r-- proto=rpcip=/x.x.x.x cmd=rename src=/tmp/README.txt._COPYING_ dst=/tmp/README.txt perm=centos:supergroup:rw-r--r-- proto=rpcip=/x.x.x.x cmd=listStatus src=/tmp dst=null perm=null proto=rpcip=/x.x.x.x cmd=open src=/tmp/README.txt dst=null perm=null proto=rpc...HDFSのauditログ(の一部):

© 2020 NTT DATA Corporation 31動作状態や性能を監視する上で有用な統計情報などJMXで提供しているWebインタフェースからJSON形式で取得することもできる項目の追加は問題なくできる既存の項目の変更や削除はincompatible changeとして避けるべきメトリクス$ curl localhost:9870/jmx?qry=Hadoop:service=NameNode,name=ReplicatedBlocksState{"beans" : [ {"name" : "Hadoop:service=NameNode,name=ReplicatedBlocksState","modelerType" : "org.apache.hadoop.hdfs.server.namenode.FSNamesystem","LowRedundancyReplicatedBlocks" : 0,"CorruptReplicatedBlocks" : 0,"MissingReplicatedBlocks" : 0,"MissingReplicationOneBlocks" : 0,"BytesInFutureReplicatedBlocks" : 0,"PendingDeletionReplicatedBlocks" : 0,"TotalReplicatedBlocks" : 1} ]}JMXJsonServletを利用したメトリクス取得:

© 2020 NTT DATA Corporation 33複数のプロダクトを組み合わせて互換性を維持し続けるのは大変ユーザが機能するバージョンの組み合わせを見つけるのも大変機能するOSSの組み合わせ(ディストリビューション)を企業(ディストリビュータ)が提供するパッケージングと継続的なupdateの提供テクニカルサポートLinux(OS)の例として、Red Hat(IBM社)のRed Hat Enterprise Linuxベースバージョンを(原則)固定してパッケージングupstreamの機能追加やバグ修正をbackportしていく互換性を壊す修正は入れないか、壊さないように直すminor updateしても(原則)アプリケーションに影響を与えないHadoopエコシステムではCloudera社がディストリビューションを提供Red Hat同様のベースバージョン固定方式で互換性を維持多種プロダクトの動く組み合わせをテストして提供独自プロビジョニングツールによる運用が前提(CentOSのような)無償版はないディストリビューション

© 2020 NTT DATA Corporation 34コミュニティベースの取り組みHadoopエコシステムのミドルウェアのパッケージングを提供プロダクトとバージョンの組み合わせ選定必要に応じてパッチ適用.rpmおよび.debを作るための資材プロビジョニング資材PuppetマニフェストDockerファイル/イメージクラスタ起動用docker-compose資材テストフレームワークとテストケース以上をGradleタスクとして簡易に実行する枠組み継続的なpatchのバックポートやminor updateは提供していない(現状)テストは網羅的ではないApache Bigtop

© 2020 NTT DATA Corporation 35Products:Hadoop 2.10.1 # 次のバージョンでHadoop 3になるHBase 1.5.0Hive 2.3.6Kafka 2.4.0Phoenix 4.15.0-HBase-1.5Spark 2.4.5Zookeeper 3.4.13...Distros:CentOS 7 and 8, Debian 9 and 10, Fedora 31, Ubuntu 16.04 and 18.04Architectures:x86_64, aarch64 # ppc64leは(マシンがなくて)テストされてないBigtop 1.5.0

© 2020 NTT DATA Corporation 37一度普及したモノは簡単に変えられない新メジャーバージョンをリリースしても、ユーザはなかなか移行しない大きく変えるなら別のプロダクトとして出したほうがよい?# メジャーバージョンアップでまるっと書き直されたプロダクトは消えていった機能の追加はやりやすい既にある機能の変更/削除は難しいメンテナンスするコードが増えていきがち辛いけど、広く世の中で使われるためには、互換性にまじめに向き合う必要があるまとめ

© 2020 NTT DATA Corporation 40HDFSのアーキテクチャは、ファイルシステムメタデータとデータブロックの状態を管理するNameNodeと、実データへの読み書きを提供する多数のDataNodeからなる。データは自動的に冗長化される。典型的にはノード群がデータを処理する計算ノードも兼ねており、ノードの数を増やすことで、ストレージ容量と処理能力を拡張することができる。アーキテクチャ上、単一クラスタにおけるスレーブノード数は、数千ノード規模まで増やすことができる。Hadoopの分散ファイルシステム(HDFS)https://hadoop.apache.org/docs/r3.3.0/hadoop-project-dist/hadoop-hdfs/HdfsDesign.html

© 2020 NTT DATA Corporation 41YARNのアーキテクチャは、クラスタ内のリソース利用状況を把握して処理を割り当てるResourceManagerと、各計算ノード上で処理タスクを実行管理する多数のNodeManagerからなる。エンドユーザがジョブを投入すると、ジョブ毎に起動されるApplicationMasterが、リソース割り当て要求をResourceManagerに送り、タスク(コンテナ)の実行状況を管理する。典型的には、エンドユーザはYARN上で動作するMapReduceやSparkといったフレームワークを利用してアプリケーションを記述するため、あまりYARNのAPIを意識しない。Hadoopの計算リソース管理機構(YARN)http://hadoop.apache.org/docs/r3.3.0/hadoop-yarn/hadoop-yarn-site/YARN.html

© 2020 NTT DATA Corporation 42下図は、Hadoopのファイルアクセス用インターフェースを図示したものである。FileSystemAPIはHDFSのAPIを抽象化したもので、これを各種データストアにアクセスするためのモジュールが実装している。例えばLocalFileSystemはローカルファイルシステムにアクセスするためのもので、HDFSにデータをロードする以外にも、MapReduceやSparkなどのアプリケーションをローカルファイルシステム上でテスト実行する場合にも利用される。Amazon S3やAzure Data Lake Storageにアクセスするためのモジュールも、ビルトインで提供されている。これらのAPIおよびモジュール群は、Hadoop Compatible File Systemsと呼ばれる。Hadoop Compatible File SystemsHadoop FileSystem APIHadoopApplicationHDFS Local FS Amazon S3AzureData LakeStorage gen2...DistributedFileSystemLocalFileSystemS3AFileSystemAzureBlobFileSystemSparkMapReduceSparkApplicationMapReduceApplicationWebHdfsFileSystemOzoneOzoneFileSystem

Movatterモバイル変換

Change Language

Apache Hadoopに見るJavaミドルウェアのcompatibility（Open Developers Conference 2020 Online 発表資料）

Embed presentation

Recommended

More Related Content

What's hot

Similar to Apache Hadoopに見るJavaミドルウェアのcompatibility（Open Developers Conference 2020 Online 発表資料）

More from NTT DATA Technology & Innovation

Apache Hadoopに見るJavaミドルウェアのcompatibility（Open Developers Conference 2020 Online 発表資料）

Editor's Notes