Movatterモバイル変換


[0]ホーム

URL:


ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)

ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)2020年10月16日(金)NTT ソフトウェアイノベーションセンタZhai Hongjie講演動画は、YouTubeチャンネル「NTT DATA Tech」にて公開中!https://www.youtube.com/watch?v=qMmJUjpff-8

Embed presentation

ポスト・ラムダアーキテクチャの切り札?ー Apache HudiNTTソフトウェアイノベーションセンタ2020年10月16日Zhai Hongjie, 研究員大村 圭, 主任研究員
データを永続的に扱うデータレイクを起点としたとき、軸①「データの取り回し」、軸②「活用のしやすさ」の2軸から課題を定義できる2データレイクの課題既存のデータレイクはシンプルな機能しかなく、多様な要件に対応するために高度化が必要データレイクバッチデータストリーミングデータ(Near)Real-time分析バッチ処理新規データのみ(Incremental Read)全データストリーミングデータストリーミングデータバッチデータバッチデータバッチ処理バッチ処理(Near)Real-time分析(Near)Real-time分析データの更新・削除②分析や機械学習向けに複雑な機能を利用する①バッチとストリームデータを合わせて扱う
ラムダアーキテクチャ(*)のようにバッチとストリーミングそれぞれで対応はできるが・・・3データレイクの高度化バッチデータストリーミングデータ(Near)Real-time分析バッチ処理新規データのみ(Incremental Read)全データストリーミングデータストリーミングデータバッチデータバッチデータバッチ処理バッチ処理(Near)Real-time分析(Near)Real-time分析データの更新・削除ストリーミング統合機能バッチ統合機能ストレージ(HDFS、S3、etc.)ストリーミング統合機能ストリーミング対応バッチ統合機能バッチ差分取得Update/Delete対応パイプラインがどんどん複雑になり、運用が困難(*): http://lambda-architecture.net
HDFS・S3などはデファクトスタンダードになっているため、変更しづらい必要な機能を全部まとめたストレージレイヤを用意4高度化・シンプル化の両立今回はApache Hudiを紹介しますバッチデータストリーミングデータ(Near)Real-time分析バッチ処理新規データのみ(Incremental Read)全データストリーミングデータストリーミングデータバッチデータバッチデータバッチ処理バッチ処理(Near)Real-time分析(Near)Real-time分析データの更新・削除ストレージ(HDFS、S3、etc.)ストレージレイヤソフトウェア最近Apache HudiやDelta LakeなどのOSSが出ています
Apache Hudiの「Hudi」の由来はどれでしょう?A: 初期の名前Hoodieと同じ発音の単語B: Hadoop Upsert Delete and Incrementalの略C: Hive, Uber DEveloped略「HuDE」と同じ発音の単語D: 開発者の名前5【問題】Hudiは2016年からUberによって開発され、多様なワークロード(Read重視・Write重視)に対応できることが特徴です。https://github.com/apache/hudi
Apache Hudiの「Hudi」の由来はどれでしょう?A: 初期の名前Hoodieと同じ発音の単語B: Hadoop Upsert Delete and Incrementalの略C: Hive, Uber DEveloped略「HuDE」と同じ発音の単語D: 開発者の名前6【解答】名前の通り、Apache HudiはHDFS・S3などにデータのUpsert(Update& Insert)、Delete、Incremental Read機能を実現するソフトウェア
7Apache Hudiの概要Copy-On-Write(CoW) Table: Read-intensiveなワークロード向き(書き込みが重い)・新規データは既存の小さいParquetに統合するMerge-On-Read(MoR) Table: Write-intensiveなワークロード向き(読み出しが重い)・新規データはAvroで一時保存してからParquetに統合(Compaction)するApache Hudiストレージ(HDFS,S3, etc.)Data(Parquet,Avro)Spark APIHudiWriteClient APIHudiReadClient APISpark APIMetadata IndexDBCopy-On-Write TableMerge-On-Read Table・バッチReadバッチ分析向け・Incremental Readリアルタイム分析向け・Compaction・Rollbackデータを指定の時間まで巻き戻す・バッチUpsert・バッチDelete・ストリーミングWrite
8Apache Hudiの概要Copy-On-Write(CoW) Table: Read-intensiveなワークロード向き(書き込みが重い)・新規データは既存の小さいParquetに統合するMerge-On-Read(MoR) Table: Write-intensiveなワークロード向き(読み出しが重い)・新規データはAvroで一時保存してからParquetに統合(Compaction)するApache Hudiストレージ(HDFS,S3, etc.)Data(Parquet,Avro)Spark APIHudiWriteClient APIHudiReadClient APISpark APIMetadata IndexDBCopy-On-Write TableMerge-On-Read Table・バッチReadバッチ分析向け・Incremental Readリアルタイム分析向け・Compaction・Rollbackデータを指定の時間まで巻き戻す・バッチUpsert・バッチDelete・ストリーミングWrite
9Apache Hudiの概要Copy-On-Write(CoW) Table: Read-intensiveなワークロード向き(書き込みが重い)・新規データは既存の小さいParquetに統合するMerge-On-Read(MoR) Table: Write-intensiveなワークロード向き(読み出しが重い)・新規データはAvroで一時保存してからParquetに統合(Compaction)するApache Hudiストレージ(HDFS,S3, etc.)Data(Parquet,Avro)Spark APIHudiWriteClient APIHudiReadClient APISpark APIMetadata IndexDBCopy-On-Write TableMerge-On-Read Table・バッチReadバッチ分析向け・Incremental Readリアルタイム分析向け・Compaction・Rollbackデータを指定の時間まで巻き戻す・バッチUpsert・バッチDelete・ストリーミングWrite
10Apache Hudiの概要Apache Hudiストレージ(HDFS,S3, etc.)Data(Parquet,Avro)Spark APIHudiWriteClient APIHudiReadClient APISpark APIMatadata IndexDBCopy-On-Write TableMerge-On-Read Table・バッチReadバッチ分析向け・Incremental Readリアルタイム分析向け・Compaction・Rollbackデータを指定の時間まで巻き戻す・バッチUpsert・バッチDelete・ストリーミングWrite今回はApache Hudiのベンチマークからわかる得意分野・落し穴をピックアップして紹介※ベンチマークは0.5.2のものです。最新版では仕様が変更されている可能性があります
111:テーブルタイプーMoR vs CoW01000020000300004000050000600007000080000Create Append Delete時間(ms)Upsert性能比較 (Partitionなし)COW MORAppendではMoRはCoWより19.4%速くなった遅い速い設計通りUpsert(Update & Insert)に関してはMoRのほうが速いただし例外も・・・Benchmark Environment:・Master: AWS m5.2xlarge * 1・Worker: AWS m5.2xlarge * 3・Hadoop 3.2.1 & Spark 2.4.5・Apache Hudi 0.5.2・Data: TPC-DS / store_sales
Upsert系の性能は1ファイルのサイズに左右される• ベンチマークのように初期データを細かく分割して書き込んだ直後、MoRとCoWは変わらない• 長期運用だと設計上MoRが速くなる12MoRは常に速いわけではない02000004000006000008000001000000120000014000001 10 20 30 40 50 60 70 80 90 100時間(ms)Scale FactorInsert性能(Partitionあり) Insert(COW) with PartitionInsert(MOR) wth Partition7000007500008000008500009000009500001000000105000070 80データをPartitionで細かく分割すると、MoRは逆に1.5%遅くなった遅い速い
Upsert系の性能は1ファイルのサイズに左右される• ベンチマークのように初期データを細かく分割して書き込んだ直後、MoRとCoWは変わらない• 長期運用だと設計上MoRが速くなる13MoRは常に速いわけではないCopy-On-Write TableMerge-On-Read TablePartitionありのテーブルA, B CA, B CE,FDPartitionありの場合、1ファイルサイズは小さいため、CoWのファイルコピーは速い。場合によってMoRのファイル内容書き換えより速くなる。DE,FUpdate: E→E'E',FCopy&UpdateE',FUpdate1KB 1KB 1KB 1KB1KB 1KB 1KB 1KB
Upsert系の性能は1ファイルのサイズに左右される• ベンチマークのように初期データを細かく分割して書き込んだ直後、MoRとCoWは変わらない• 長期運用だと設計上MoRが速くなる14MoRは常に速いわけではないCopy-On-Write TableMerge-On-Read Table書き込みし続けるとA, B,G,H,I ..C,M,N,U,V,...A, B CE,F,K,L,X...D長期運用(書き込みし続ける)と、CoWのファイルは大きくなり、コピーも遅くなる。MoRは差分毎ファイル作っているため(*)、操作が速いD,O,Q,R,S,T ...E,FUpdate: E→E'E',FCopy&UpdateE',FUpdate120MB 120MB 120MB 120MBX Y Z 1KB * Compactionされる前のデータに限る
ベンチマーク中予想外のことが発生していた・元データに対して、Hudiの書き込み量は2倍ぐらい・CoWに対するWriteで大量のSmall File(i.e. < 120MB)が作られたー 小さいファイルが埋める前に新しいファイル作らないはず色々と調査した結果・・・152:Hudiの隠し前提条件HudiはRecordサイズを1KBと仮定しているapproxRecordSize(Default = 1024)Recordサイズの平均値。データを既に書き込んだ場合データから計算することもできるが、それ以外はこの仮定値を使う。この設定はあらゆるところに影響が出る。
Hudiは1レコード1KB前提で設計されているー Incremental Readなどの機能を実現するために必要ー e.g. メタデータの設計、レコード書き込みアルゴリズム16書き込み量問題とHudiメタデータ生のデータ HudiメタデータIndexデータHudiのParquet・生のParquetに相当・Hudiはこの部分を1KBと仮定・今回のデータは約130bytes・Record毎に付与する・約130 bytes、サイズ調整不可・ファイル毎付与する・BloomFilterを使う場合のみ存在・データ量と関係なく422KB・サイズは調整可能- bloomFilterNumEntries- bloomFilterFPP1ファイル約100Kレコードの場合、最大メタデータ量:130𝑏𝑦𝑡𝑒𝑠 × 100,000 + 422𝐾𝐵 = 13.42𝑀𝐵Hudiの仮定通りRecordサイズ1KBなら、1ファイル約+13.4%今回の場合は、+100%の書き込み量となった
17ファイルサイズへの影響204060801001201400 500 1000 1500 2000 2500 3000 3500ファイルサイズ(MB)レコードサイズ(Byte)ファイルサイズとレコードサイズの関係Averge File Size(Copy On…ファイル最大サイズ(PARQUET_FILE_MAX_SIZE)4090140900 950 1000 1050 1100 11501024bytesレコードサイズが小さすぎると、出来上がったファイルもSmall File(i.e. <120MB)になる。小さいレコードは特に苦手レコードサイズ仮定値の手前でのファイルサイズが一番大きい
• 実はIncrement Queryの実装は全然速くない– MoRだと速いはずだが、まだ対応してない• スケーラビリティー重視のBulk Insertはパラメータによって遅くなることもある• ファイルDelete/Updateしても、ファイルにあるレコードの順番は変わらない• レコードサイズが時間によって大きく変動する場合、Small Fileができたり、巨大ファイルできたりするかもしれない18その他気づいたところ興味ある方はぜひAsk the Speakerで質問していただければ
19本講演のまとめ• データレイクへの期待が多様化しており、それを受けてApache Hudiが開発された• バッチ・ストリーミングを同じレイヤで処理するポスト・ラムダアーキテクチャ• 多様なワークロードに対応するテーブルタイプ(CoW・MoR)• まだ1.0に向けて開発中のため、対応しきれてないところもある• 現在はUber自身のユースケース(レコードサイズの仮定など)を優先している• 予想通りにならない時、隠し仕様あるかを一回調べましょう
20以下、参考資料
Hudiは1レコード1KB前提で設計されているー Incremental Readなどの機能を実現するために必要ー e.g. メタデータの設計、レコード書き込みアルゴリズム21Small File問題private void assignInserts(WorkloadProfile profile) {...long averageRecordSize =averageBytesPerRecord(metaClient.getActiveTimeline().getCommitTimeline().filterCompletedInstants(),config.getCopyOnWriteRecordSizeEstimate());List<SmallFile> smallFiles = getSmallFiles(partitionPath);...for (SmallFile smallFile : smallFiles) {long recordsToAppend =Math.min((config.getParquetMaxFileSize() -smallFile.sizeBytes) / averageRecordSize,totalUnassignedInserts);src/main/java/org/apache/hudi/table/HoodieCopyOnWriteTable.java,ファイルに書き込むレコード数はRecordサイズで算出される。実際のレコードは1KBより小さい場合、Small Fileになる初回書き込みなどレコードサイズ計算できない場合、Hudiの仮定値を使うファイルに書き込むべきレコード数を計算する関数
Insert: 一般的な書き込みBulk_insert:スケーラアップしやすいInsert222:書き込みーInsert vs Bulk_Insert00.0050.010.0150.020.0250.030.0350.040.0450.050 20 40 60 80 100 120bulk_insert vs insert性能比較Bulk Insert(COW)Bulk Insert(MOR)Insert(COW)Insert(MOR)ScaleFactor=50(約10GB)からInsertの効率が落ち始め、Bulk_Insertの効率は上がり続けるTime(ms)/RecordScale Factor遅い速い0.0040.00450.0050.00550.00640 60 80 100 120ただし、どんなサイズのデータでも速いわけではない小さいデータでは、Insertは圧倒的に速い
23Bulk InsertのターゲットデータサイズBulk Insertが速いのは一定のサイズまで– このサイズは、以下2つのパラメータに影響されるBulkInsertParallelism(Default =1500)ParquetFileMaxSize(Default =120MB)参考ページ:https://hudi.apache.org/docs/configurations.html予め用意するファイルの数。このファイルをすべて使い切る前に新しいファイル作る必要はない。1つのファイルの最大サイズ。このサイズを越えたファイルには新しいデータを書き込めない。初期状態のターゲットサイズは1500 × 120𝑀𝐵 = 175𝐺𝐵このサイズ越えたら、普通のInsertと変わらなくなる違うサイズを想定しているならば、BulkInsertParallelismを優先的に調整する(ParquetFileMaxSizeは副作用出るかもしれないので、調整は慎重に)

Recommended

PPTX
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
PPTX
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
PDF
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
PPTX
祝!PostgreSQLレプリケーション10周年!徹底紹介!!
PDF
ヤフー発のメッセージキュー「Pulsar」のご紹介
PDF
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
PPTX
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
PDF
Apache Kafka 0.11 の Exactly Once Semantics
PDF
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
PDF
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
PPTX
Apache Spark on Kubernetes入門(Open Source Conference 2021 Online Hiroshima 発表資料)
PDF
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
PDF
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
PDF
AWS Black Belt Techシリーズ Amazon EMR
PPTX
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
PDF
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
PPTX
分散システムについて語らせてくれ
PPTX
本当は恐ろしい分散システムの話
PPT
Cassandraのしくみ データの読み書き編
PPTX
PostgreSQLのロール管理とその注意点(Open Source Conference 2022 Online/Osaka 発表資料)
PDF
インフラCICDの勘所
PPTX
Kafkaを活用するためのストリーム処理の基本
PPTX
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
PDF
webエンジニアのためのはじめてのredis
PDF
ロードバランスへの長い道
PDF
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント
PDF
マイクロにしすぎた結果がこれだよ!
PPTX
PostgreSQL 12は ここがスゴイ! ~性能改善やpluggable storage engineなどの新機能を徹底解説~ (NTTデータ テクノ...
PPTX
BigData Architecture for Azure
PDF
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017

More Related Content

PPTX
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
PPTX
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
PDF
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
PPTX
祝!PostgreSQLレプリケーション10周年!徹底紹介!!
PDF
ヤフー発のメッセージキュー「Pulsar」のご紹介
PDF
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
PPTX
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
PDF
Apache Kafka 0.11 の Exactly Once Semantics
分析指向データレイク実現の次の一手 ~Delta Lake、なにそれおいしいの?~(NTTデータ テクノロジーカンファレンス 2020 発表資料)
大規模データ処理の定番OSS Hadoop / Spark 最新動向 - 2021秋 -(db tech showcase 2021 / ONLINE 発...
Apache Kafkaって本当に大丈夫?~故障検証のオーバービューと興味深い挙動の紹介~
祝!PostgreSQLレプリケーション10周年!徹底紹介!!
ヤフー発のメッセージキュー「Pulsar」のご紹介
実運用して分かったRabbit MQの良いところ・気をつけること #jjug
え、まって。その並列分散処理、Kafkaのしくみでもできるの? Apache Kafkaの機能を利用した大規模ストリームデータの並列分散処理
Apache Kafka 0.11 の Exactly Once Semantics

What's hot

PDF
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
PDF
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
PPTX
Apache Spark on Kubernetes入門(Open Source Conference 2021 Online Hiroshima 発表資料)
PDF
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
PDF
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
PDF
AWS Black Belt Techシリーズ Amazon EMR
PPTX
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
PDF
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
PPTX
分散システムについて語らせてくれ
PPTX
本当は恐ろしい分散システムの話
PPT
Cassandraのしくみ データの読み書き編
PPTX
PostgreSQLのロール管理とその注意点(Open Source Conference 2022 Online/Osaka 発表資料)
PDF
インフラCICDの勘所
PPTX
Kafkaを活用するためのストリーム処理の基本
PPTX
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
PDF
webエンジニアのためのはじめてのredis
PDF
ロードバランスへの長い道
PDF
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント
PDF
マイクロにしすぎた結果がこれだよ!
PPTX
PostgreSQL 12は ここがスゴイ! ~性能改善やpluggable storage engineなどの新機能を徹底解説~ (NTTデータ テクノ...
40分でわかるHadoop徹底入門 (Cloudera World Tokyo 2014 講演資料)
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
Apache Spark on Kubernetes入門(Open Source Conference 2021 Online Hiroshima 発表資料)
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
クラウドDWHにおける観点とAzure Synapse Analyticsの対応
AWS Black Belt Techシリーズ Amazon EMR
大規模データ活用向けストレージレイヤソフトのこれまでとこれから(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
分散システムについて語らせてくれ
本当は恐ろしい分散システムの話
Cassandraのしくみ データの読み書き編
PostgreSQLのロール管理とその注意点(Open Source Conference 2022 Online/Osaka 発表資料)
インフラCICDの勘所
Kafkaを活用するためのストリーム処理の基本
ストリーム処理におけるApache Avroの活用について(NTTデータ テクノロジーカンファレンス 2019 講演資料、2019/09/05)
webエンジニアのためのはじめてのredis
ロードバランスへの長い道
日本のお客様におけるAmazon Auroraへの移行・検証事例と技術ポイント
マイクロにしすぎた結果がこれだよ!
PostgreSQL 12は ここがスゴイ! ~性能改善やpluggable storage engineなどの新機能を徹底解説~ (NTTデータ テクノ...

Similar to ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)

PPTX
BigData Architecture for Azure
PDF
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
PDF
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
PPTX
ビッグデータ活用支援フォーラム
PPTX
WebDB Forum 2012 基調講演資料
PPTX
ビッグデータ&データマネジメント展
PDF
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
PDF
Multiple Dimension Spreadのご紹介
PDF
オフラインWebアプリの再到来で今、再び注目されるAPIの本命 ーJavaScript SQL-like database
PPTX
20160115nodered design patterns
 
PDF
Developers Summit 2018: ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデー...
PPT
【17-C-2】 クラウド上でのエンタープライズアプリケーション開発
 
PPTX
Cloudera大阪セミナー 20130219
PDF
Facebookのリアルタイム Big Data 処理
PDF
Dat009 クラウドでビック
PDF
Configureing analytics system with apache spark and object storage service of...
PPTX
Dat009 クラウドでビック
PDF
[Japanese Content] Lance Riedel_The App Server, The Hive in Tokyo_Aug29
PPTX
継続的12章
PPT
Cassandra(no sql)によるシステム提案と開発
BigData Architecture for Azure
Apache Kuduは何がそんなに「速い」DBなのか? #dbts2017
Data Engineering Meetup #1 持続可能なデータ基盤のためのデータの多様性に対する取り組み
ビッグデータ活用支援フォーラム
WebDB Forum 2012 基調講演資料
ビッグデータ&データマネジメント展
[db tech showcase Tokyo 2014] L34: そのデータベース 5年後大丈夫ですか by 日本ヒューレット・パッカード株式会社 後藤宏
Multiple Dimension Spreadのご紹介
オフラインWebアプリの再到来で今、再び注目されるAPIの本命 ーJavaScript SQL-like database
20160115nodered design patterns
 
Developers Summit 2018: ストリームとバッチを融合したBigData Analytics ~事例とデモから見えてくる、これからのデー...
【17-C-2】 クラウド上でのエンタープライズアプリケーション開発
 
Cloudera大阪セミナー 20130219
Facebookのリアルタイム Big Data 処理
Dat009 クラウドでビック
Configureing analytics system with apache spark and object storage service of...
Dat009 クラウドでビック
[Japanese Content] Lance Riedel_The App Server, The Hive in Tokyo_Aug29
継続的12章
Cassandra(no sql)によるシステム提案と開発

More from NTT DATA Technology & Innovation

PDF
2025年現在のNewSQL (最強DB講義 #36 発表資料)
PDF
PostgreSQLのHTAP適応について考える (PostgreSQL Conference Japan 2024 講演資料)
PDF
ストリーム処理はデータを失うから怖い?それ、何とかできますよ! 〜Apahe Kafkaを用いたストリーム処理における送達保証〜 (Open Source...
PDF
PostgreSQLのgitレポジトリから見える2024年の開発状況 (第51回 PostgreSQLアンカンファレンス@オンライン 発表資料)
PDF
生成AI時代のPostgreSQLハイブリッド検索 (第50回PostgreSQLアンカンファレンス@オンライン 発表資料)
PDF
つくって壊して直して学ぶ Database on Kubernetes (CloudNative Days Summer 2025 発表資料)
PDF
PostgreSQL18新機能紹介(db tech showcase 2025 発表資料)
PDF
PostgreSQL最新動向 ~カラムナストアから生成AI連携まで~ (Open Source Conference 2025 Tokyo/Spring ...
PDF
基礎から学ぶ PostgreSQL の性能監視 (PostgreSQL Conference Japan 2025 発表資料)
PDF
pgbenchのスレッドとクライアント (第51回 PostgreSQLアンカンファレンス@オンライン 発表資料)
PDF
Apache Sparkに対するKubernetesのNUMAノードを意識したリソース割り当ての性能効果 (Open Source Conference ...
PDF
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
PDF
論理レプリケーションのアーキテクチャ (第52回 PostgreSQLアンカンファレンス@オンライン 発表資料)
PDF
PGConf.dev 2025 参加レポート (JPUG総会併設セミナー2025 発表資料)
PDF
Java in Japan: A Journey of Community, Culture, and Global Integration (JavaO...
PDF
開発中の新機能 Spark Declarative Pipeline に飛びついてみたが難しかった(JEDAI DAIS Recap#2 講演資料)
PDF
DAIS2024参加報告 ~Spark中心にしらべてみた~ (JEDAI DAIS Recap 講演資料)
PDF
Can We Use Rust to Develop Extensions for PostgreSQL? (POSETTE: An Event for ...
PDF
Unveiling the Hidden Layers of Java Class Files: Beyond Bytecode (Devnexus 2025)
PDF
SAFe実践から見えた、フレームワークより大切な組織変革の道程(Scrum Fest Sendai 2025 発表資料)
2025年現在のNewSQL (最強DB講義 #36 発表資料)
PostgreSQLのHTAP適応について考える (PostgreSQL Conference Japan 2024 講演資料)
ストリーム処理はデータを失うから怖い?それ、何とかできますよ! 〜Apahe Kafkaを用いたストリーム処理における送達保証〜 (Open Source...
PostgreSQLのgitレポジトリから見える2024年の開発状況 (第51回 PostgreSQLアンカンファレンス@オンライン 発表資料)
生成AI時代のPostgreSQLハイブリッド検索 (第50回PostgreSQLアンカンファレンス@オンライン 発表資料)
つくって壊して直して学ぶ Database on Kubernetes (CloudNative Days Summer 2025 発表資料)
PostgreSQL18新機能紹介(db tech showcase 2025 発表資料)
PostgreSQL最新動向 ~カラムナストアから生成AI連携まで~ (Open Source Conference 2025 Tokyo/Spring ...
基礎から学ぶ PostgreSQL の性能監視 (PostgreSQL Conference Japan 2025 発表資料)
pgbenchのスレッドとクライアント (第51回 PostgreSQLアンカンファレンス@オンライン 発表資料)
Apache Sparkに対するKubernetesのNUMAノードを意識したリソース割り当ての性能効果 (Open Source Conference ...
実はアナタの身近にある!? Linux のチェックポイント/レストア機能 (NTT Tech Conference 2025 発表資料)
論理レプリケーションのアーキテクチャ (第52回 PostgreSQLアンカンファレンス@オンライン 発表資料)
PGConf.dev 2025 参加レポート (JPUG総会併設セミナー2025 発表資料)
Java in Japan: A Journey of Community, Culture, and Global Integration (JavaO...
開発中の新機能 Spark Declarative Pipeline に飛びついてみたが難しかった(JEDAI DAIS Recap#2 講演資料)
DAIS2024参加報告 ~Spark中心にしらべてみた~ (JEDAI DAIS Recap 講演資料)
Can We Use Rust to Develop Extensions for PostgreSQL? (POSETTE: An Event for ...
Unveiling the Hidden Layers of Java Class Files: Beyond Bytecode (Devnexus 2025)
SAFe実践から見えた、フレームワークより大切な組織変革の道程(Scrum Fest Sendai 2025 発表資料)

ポスト・ラムダアーキテクチャの切り札? Apache Hudi(NTTデータ テクノロジーカンファレンス 2020 発表資料)


[8]ページ先頭

©2009-2025 Movatter.jp