Movatterモバイル変換
[0]
ホーム
URL:
画像なし
夜間モード
Download free for 30 days
Sign in
Upload
Language (EN)
Support
Business
Mobile
Social Media
Marketing
Technology
Art & Photos
Career
Design
Education
Presentations & Public Speaking
Government & Nonprofit
Healthcare
Internet
Law
Leadership & Management
Automotive
Engineering
Software
Recruiting & HR
Retail
Sales
Services
Science
Small Business & Entrepreneurship
Food
Environment
Economy & Finance
Data & Analytics
Investor Relations
Sports
Spiritual
News & Politics
Travel
Self Improvement
Real Estate
Entertainment & Humor
Health & Medicine
Devices & Hardware
Lifestyle
Change Language
Language
English
Español
Português
Français
Deutsche
Cancel
Save
Submit search
EN
Uploaded by
Amazon Web Services Japan
PDF, PPTX
5,975 views
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
2019年10月に京都で開催された CTO Night & Day 2019 Fall Day1 モーニングセッションでの講演資料です
Technology
◦
Read more
8
Save
Share
Embed
Embed presentation
Download
Download as PDF, PPTX
1
/ 47
2
/ 47
3
/ 47
4
/ 47
5
/ 47
6
/ 47
7
/ 47
8
/ 47
9
/ 47
10
/ 47
11
/ 47
12
/ 47
13
/ 47
14
/ 47
15
/ 47
16
/ 47
17
/ 47
18
/ 47
19
/ 47
20
/ 47
21
/ 47
22
/ 47
23
/ 47
24
/ 47
25
/ 47
26
/ 47
27
/ 47
28
/ 47
29
/ 47
30
/ 47
31
/ 47
32
/ 47
33
/ 47
34
/ 47
35
/ 47
36
/ 47
37
/ 47
38
/ 47
39
/ 47
40
/ 47
41
/ 47
42
/ 47
43
/ 47
44
/ 47
45
/ 47
46
/ 47
47
/ 47
Recommended
PDF
データ活用を加速するAWS分析サービスのご紹介
by
Amazon Web Services Japan
PDF
20191001 AWS Black Belt Online Seminar AWS Lake Formation
by
Amazon Web Services Japan
PDF
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
by
Amazon Web Services Japan
PDF
20210127 AWS Black Belt Online Seminar Amazon Redshift 運用管理
by
Amazon Web Services Japan
PDF
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
by
Noritaka Sekiyama
PPTX
AWSで作る分析基盤
by
Yu Otsubo
PDF
20200630 AWS Black Belt Online Seminar Amazon Cognito
by
Amazon Web Services Japan
PPTX
Awsをオンプレドメコンに連携させる
by
Syuichi Murashima
PDF
20210330 AWS Black Belt Online Seminar AWS Glue -Glue Studioを使ったデータ変換のベストプラクティス-
by
Amazon Web Services Japan
PDF
20190220 AWS Black Belt Online Seminar Amazon S3 / Glacier
by
Amazon Web Services Japan
PDF
20210216 AWS Black Belt Online Seminar AWS Database Migration Service
by
Amazon Web Services Japan
PDF
20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報
by
Amazon Web Services Japan
PDF
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
by
Amazon Web Services Japan
PDF
マルチテナント化で知っておきたいデータベースのこと
by
Amazon Web Services Japan
PDF
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
by
Amazon Web Services Japan
PDF
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
by
Ryoma Nagata
PDF
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介
by
Amazon Web Services Japan
PDF
AWS Black Belt Online Seminar 2017 Amazon ElastiCache
by
Amazon Web Services Japan
PDF
20190821 AWS Black Belt Online Seminar AWS AppSync
by
Amazon Web Services Japan
PDF
OSS+AWSでここまでできるDevSecOps (Security-JAWS第24回)
by
Masaya Tahara
PDF
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
PDF
20190129 AWS Black Belt Online Seminar AWS Identity and Access Management (AW...
by
Amazon Web Services Japan
PDF
PostgreSQLアーキテクチャ入門
by
Uptime Technologies LLC (JP)
PDF
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
by
NTT DATA Technology & Innovation
PDF
PostgreSQLでスケールアウト
by
Masahiko Sawada
PPTX
PostgreSQLモニタリングの基本とNTTデータが追加したモニタリング新機能(Open Source Conference 2021 Online F...
by
NTT DATA Technology & Innovation
PDF
20191023 AWS Black Belt Online Seminar Amazon EMR
by
Amazon Web Services Japan
PPTX
Redisの特徴と活用方法について
by
Yuji Otani
PDF
20200617 AWS Black Belt Online Seminar Amazon Athena
by
Amazon Web Services Japan
PDF
AWS Black Belt - AWS Glue
by
Amazon Web Services Japan
More Related Content
PDF
データ活用を加速するAWS分析サービスのご紹介
by
Amazon Web Services Japan
PDF
20191001 AWS Black Belt Online Seminar AWS Lake Formation
by
Amazon Web Services Japan
PDF
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
by
Amazon Web Services Japan
PDF
20210127 AWS Black Belt Online Seminar Amazon Redshift 運用管理
by
Amazon Web Services Japan
PDF
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
by
Noritaka Sekiyama
PPTX
AWSで作る分析基盤
by
Yu Otsubo
PDF
20200630 AWS Black Belt Online Seminar Amazon Cognito
by
Amazon Web Services Japan
PPTX
Awsをオンプレドメコンに連携させる
by
Syuichi Murashima
データ活用を加速するAWS分析サービスのご紹介
by
Amazon Web Services Japan
20191001 AWS Black Belt Online Seminar AWS Lake Formation
by
Amazon Web Services Japan
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
by
Amazon Web Services Japan
20210127 AWS Black Belt Online Seminar Amazon Redshift 運用管理
by
Amazon Web Services Japan
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
by
Noritaka Sekiyama
AWSで作る分析基盤
by
Yu Otsubo
20200630 AWS Black Belt Online Seminar Amazon Cognito
by
Amazon Web Services Japan
Awsをオンプレドメコンに連携させる
by
Syuichi Murashima
What's hot
PDF
20210330 AWS Black Belt Online Seminar AWS Glue -Glue Studioを使ったデータ変換のベストプラクティス-
by
Amazon Web Services Japan
PDF
20190220 AWS Black Belt Online Seminar Amazon S3 / Glacier
by
Amazon Web Services Japan
PDF
20210216 AWS Black Belt Online Seminar AWS Database Migration Service
by
Amazon Web Services Japan
PDF
20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報
by
Amazon Web Services Japan
PDF
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
by
Amazon Web Services Japan
PDF
マルチテナント化で知っておきたいデータベースのこと
by
Amazon Web Services Japan
PDF
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
by
Amazon Web Services Japan
PDF
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
by
Ryoma Nagata
PDF
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介
by
Amazon Web Services Japan
PDF
AWS Black Belt Online Seminar 2017 Amazon ElastiCache
by
Amazon Web Services Japan
PDF
20190821 AWS Black Belt Online Seminar AWS AppSync
by
Amazon Web Services Japan
PDF
OSS+AWSでここまでできるDevSecOps (Security-JAWS第24回)
by
Masaya Tahara
PDF
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
PDF
20190129 AWS Black Belt Online Seminar AWS Identity and Access Management (AW...
by
Amazon Web Services Japan
PDF
PostgreSQLアーキテクチャ入門
by
Uptime Technologies LLC (JP)
PDF
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
by
NTT DATA Technology & Innovation
PDF
PostgreSQLでスケールアウト
by
Masahiko Sawada
PPTX
PostgreSQLモニタリングの基本とNTTデータが追加したモニタリング新機能(Open Source Conference 2021 Online F...
by
NTT DATA Technology & Innovation
PDF
20191023 AWS Black Belt Online Seminar Amazon EMR
by
Amazon Web Services Japan
PPTX
Redisの特徴と活用方法について
by
Yuji Otani
20210330 AWS Black Belt Online Seminar AWS Glue -Glue Studioを使ったデータ変換のベストプラクティス-
by
Amazon Web Services Japan
20190220 AWS Black Belt Online Seminar Amazon S3 / Glacier
by
Amazon Web Services Japan
20210216 AWS Black Belt Online Seminar AWS Database Migration Service
by
Amazon Web Services Japan
20211203 AWS Black Belt Online Seminar AWS re:Invent 2021アップデート速報
by
Amazon Web Services Japan
AWS Black Belt Online Seminar 2018 Amazon DynamoDB Advanced Design Pattern
by
Amazon Web Services Japan
マルチテナント化で知っておきたいデータベースのこと
by
Amazon Web Services Japan
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
by
Amazon Web Services Japan
データ基盤の従来~最新の考え方とSynapse Analyticsでの実現
by
Ryoma Nagata
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介
by
Amazon Web Services Japan
AWS Black Belt Online Seminar 2017 Amazon ElastiCache
by
Amazon Web Services Japan
20190821 AWS Black Belt Online Seminar AWS AppSync
by
Amazon Web Services Japan
OSS+AWSでここまでできるDevSecOps (Security-JAWS第24回)
by
Masaya Tahara
データ分析を支える技術 DWH再入門
by
Satoru Ishikawa
20190129 AWS Black Belt Online Seminar AWS Identity and Access Management (AW...
by
Amazon Web Services Japan
PostgreSQLアーキテクチャ入門
by
Uptime Technologies LLC (JP)
PostgreSQLをKubernetes上で活用するためのOperator紹介!(Cloud Native Database Meetup #3 発表資料)
by
NTT DATA Technology & Innovation
PostgreSQLでスケールアウト
by
Masahiko Sawada
PostgreSQLモニタリングの基本とNTTデータが追加したモニタリング新機能(Open Source Conference 2021 Online F...
by
NTT DATA Technology & Innovation
20191023 AWS Black Belt Online Seminar Amazon EMR
by
Amazon Web Services Japan
Redisの特徴と活用方法について
by
Yuji Otani
Similar to [CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
PDF
20200617 AWS Black Belt Online Seminar Amazon Athena
by
Amazon Web Services Japan
PDF
AWS Black Belt - AWS Glue
by
Amazon Web Services Japan
PPTX
[20220126] JAWS-UG 2022初頭までに葬ったAWSアンチパターン大紹介
by
Amazon Web Services Japan
PDF
20180619 AWS Black Belt Online Seminar データレイク入門: AWSで様々な規模のデータレイクを分析する効率的な方法
by
Amazon Web Services Japan
PDF
データレイクを基盤としたAWS上での機械学習サービス構築
by
Amazon Web Services Japan
PDF
Amazon S3を中心とするデータ分析のベストプラクティス
by
Amazon Web Services Japan
PDF
Effective Data Lakes - ユースケースとデザインパターン
by
Noritaka Sekiyama
PDF
AWS Glueを使った Serverless ETL の実装パターン
by
seiichi arai
PDF
AWSの様々なアーキテクチャ
by
Kameda Harunobu
PDF
Amazon Game Tech Night #22 AWSで実現するデータレイクとアナリティクス
by
Amazon Web Services Japan
PDF
AWS Black Belt Techシリーズ AWS Data Pipeline
by
Amazon Web Services Japan
PDF
ビッグデータサービス群のおさらい & AWS Data Pipeline
by
Amazon Web Services Japan
PDF
Serverless services on_aws_dmm_meetup_20170801
by
Amazon Web Services Japan
PPTX
AWS朝会2022/1セッション① 数年間、レイクハウスを設計運用してみた
by
tatsuya 264
PDF
Serverless analytics on aws
by
Amazon Web Services Japan
PPTX
Security Operations and Automation on AWS
by
Noritaka Sekiyama
PDF
IoTデザインパターン 2015 JAWS沖縄
by
Toshiaki Enami
PDF
Developers.IO 2019 Effective Datalake
by
Satoru Ishikawa
PDF
Data discoveryを支えるawsのbig data技術と最新事例
by
Takashi Koyanagawa
PPTX
Game Architecture Trends in Tokyo Kansai Social Game Study#5
by
Yasuhiro Matsuo
20200617 AWS Black Belt Online Seminar Amazon Athena
by
Amazon Web Services Japan
AWS Black Belt - AWS Glue
by
Amazon Web Services Japan
[20220126] JAWS-UG 2022初頭までに葬ったAWSアンチパターン大紹介
by
Amazon Web Services Japan
20180619 AWS Black Belt Online Seminar データレイク入門: AWSで様々な規模のデータレイクを分析する効率的な方法
by
Amazon Web Services Japan
データレイクを基盤としたAWS上での機械学習サービス構築
by
Amazon Web Services Japan
Amazon S3を中心とするデータ分析のベストプラクティス
by
Amazon Web Services Japan
Effective Data Lakes - ユースケースとデザインパターン
by
Noritaka Sekiyama
AWS Glueを使った Serverless ETL の実装パターン
by
seiichi arai
AWSの様々なアーキテクチャ
by
Kameda Harunobu
Amazon Game Tech Night #22 AWSで実現するデータレイクとアナリティクス
by
Amazon Web Services Japan
AWS Black Belt Techシリーズ AWS Data Pipeline
by
Amazon Web Services Japan
ビッグデータサービス群のおさらい & AWS Data Pipeline
by
Amazon Web Services Japan
Serverless services on_aws_dmm_meetup_20170801
by
Amazon Web Services Japan
AWS朝会2022/1セッション① 数年間、レイクハウスを設計運用してみた
by
tatsuya 264
Serverless analytics on aws
by
Amazon Web Services Japan
Security Operations and Automation on AWS
by
Noritaka Sekiyama
IoTデザインパターン 2015 JAWS沖縄
by
Toshiaki Enami
Developers.IO 2019 Effective Datalake
by
Satoru Ishikawa
Data discoveryを支えるawsのbig data技術と最新事例
by
Takashi Koyanagawa
Game Architecture Trends in Tokyo Kansai Social Game Study#5
by
Yasuhiro Matsuo
More from Amazon Web Services Japan
PPTX
20220409 AWS BLEA 開発にあたって検討したこと
by
Amazon Web Services Japan
PDF
202201 AWS Black Belt Online Seminar Apache Spark Performnace Tuning for AWS ...
by
Amazon Web Services Japan
PDF
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート
by
Amazon Web Services Japan
PDF
Infrastructure as Code (IaC) 談義 2022
by
Amazon Web Services Japan
PDF
202205 AWS Black Belt Online Seminar Amazon FSx for OpenZFS
by
Amazon Web Services Japan
PDF
20211209 Ops-JAWS Re invent2021re-cap-cloud operations
by
Amazon Web Services Japan
PDF
202205 AWS Black Belt Online Seminar Amazon VPC IP Address Manager (IPAM)
by
Amazon Web Services Japan
PDF
パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介
by
Amazon Web Services Japan
PDF
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ
by
Amazon Web Services Japan
PDF
202202 AWS Black Belt Online Seminar AWS SaaS Boost で始めるSaaS開発⼊⾨
by
Amazon Web Services Japan
PDF
202202 AWS Black Belt Online Seminar AWS Managed Rules for AWS WAF の活用
by
Amazon Web Services Japan
PDF
202204 AWS Black Belt Online Seminar AWS IoT Device Defender
by
Amazon Web Services Japan
PDF
202112 AWS Black Belt Online Seminar 店内の「今」をお届けする小売業向けリアルタイム配信基盤のレシピ
by
Amazon Web Services Japan
PDF
Amazon QuickSight の組み込み方法をちょっぴりDD
by
Amazon Web Services Japan
PDF
202204 AWS Black Belt Online Seminar Amazon Connect を活用したオンコール対応の実現
by
Amazon Web Services Japan
PDF
202202 AWS Black Belt Online Seminar Amazon Connect Customer Profiles
by
Amazon Web Services Japan
PDF
202204 AWS Black Belt Online Seminar Amazon Connect Salesforce連携(第1回 CTI Adap...
by
Amazon Web Services Japan
PDF
202203 AWS Black Belt Online Seminar Amazon Connect Tasks.pdf
by
Amazon Web Services Japan
PDF
Amazon Game Tech Night #24 KPIダッシュボードを最速で用意するために
by
Amazon Web Services Japan
PDF
202111 AWS Black Belt Online Seminar AWSで構築するSmart Mirrorのご紹介
by
Amazon Web Services Japan
20220409 AWS BLEA 開発にあたって検討したこと
by
Amazon Web Services Japan
202201 AWS Black Belt Online Seminar Apache Spark Performnace Tuning for AWS ...
by
Amazon Web Services Japan
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート
by
Amazon Web Services Japan
Infrastructure as Code (IaC) 談義 2022
by
Amazon Web Services Japan
202205 AWS Black Belt Online Seminar Amazon FSx for OpenZFS
by
Amazon Web Services Japan
20211209 Ops-JAWS Re invent2021re-cap-cloud operations
by
Amazon Web Services Japan
202205 AWS Black Belt Online Seminar Amazon VPC IP Address Manager (IPAM)
by
Amazon Web Services Japan
パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介
by
Amazon Web Services Japan
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ
by
Amazon Web Services Japan
202202 AWS Black Belt Online Seminar AWS SaaS Boost で始めるSaaS開発⼊⾨
by
Amazon Web Services Japan
202202 AWS Black Belt Online Seminar AWS Managed Rules for AWS WAF の活用
by
Amazon Web Services Japan
202204 AWS Black Belt Online Seminar AWS IoT Device Defender
by
Amazon Web Services Japan
202112 AWS Black Belt Online Seminar 店内の「今」をお届けする小売業向けリアルタイム配信基盤のレシピ
by
Amazon Web Services Japan
Amazon QuickSight の組み込み方法をちょっぴりDD
by
Amazon Web Services Japan
202204 AWS Black Belt Online Seminar Amazon Connect を活用したオンコール対応の実現
by
Amazon Web Services Japan
202202 AWS Black Belt Online Seminar Amazon Connect Customer Profiles
by
Amazon Web Services Japan
202204 AWS Black Belt Online Seminar Amazon Connect Salesforce連携(第1回 CTI Adap...
by
Amazon Web Services Japan
202203 AWS Black Belt Online Seminar Amazon Connect Tasks.pdf
by
Amazon Web Services Japan
Amazon Game Tech Night #24 KPIダッシュボードを最速で用意するために
by
Amazon Web Services Japan
202111 AWS Black Belt Online Seminar AWSで構築するSmart Mirrorのご紹介
by
Amazon Web Services Japan
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
1.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.Morning SessionAWSで構築するデータレイク基盤とamazon.comでの導入事例
2.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.⾃⼰紹介• 北村 聖児• Amazon Web Service Japan K.K.• Solution Architect• Media & Entertainment• 前職• Server Side Engineer• 好きなAWSサービス• Amazon Connect
3.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.本⽇お伝えしたいこと• データレイクとは• AWSで構築するデータレイクのアーキテクチャ• Amazonでのデータレイク事例
4.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイクとは
5.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイクとは1. 将来、必要な時に分析できるよう明細データを捨てずに蓄積する「湖」(2010年にJames Dixon(Pentaho CTO)がHadoop Worldで提唱)分析要件A別のカットでの分析不可分析要件A分析要件B将来、新たなカットで分析可能
6.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイクとは2. 多様なフォーマットのデータをそのまま保存できるストレージ構造化・半構造化・非構造化データ構造化データ要件C
7.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイクとは3. 全てのデータを一元的に保存できる容量無制限のストレージ(別々のストレージに保存するとサイロ化していく)HDFSサーバやHadoopクラスターの管理が必要Amazon Simples StorageService(S3)サーバやインフラ管理から解放
8.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.ゴミ溜めになるのではないか?• データと共にメタデータを登録しないと後で活用できない• DWH でデータ・ディクショナリがないと分析できないのと同じ出典:https://www.amazon.co.jp/Data-Lake-Architecture-Designing-Avoiding/dp/1634621174
9.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイクは DWH を拡張する• データウェアハウスに加えてビッグデータ処理なども可能に1. 明細データを捨てずに蓄積2. 多様なフォーマットを保存可能3. 容量無制限なため一箇所に集約DWHBIOLTP ERP CRM LOB SNSデバイス Web センサービッグデータ処理、リアルタイム処理、機械学習データレイク+
10.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.AWSで構築するデータレイクのアーキテクチャ
11.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイク半構造化/非構造化/アーカイブAWSのビッグデータ分析基盤︓ハイレベルアーキテクチャBI 機械学習分析クエリ ビッグデータ処理 リアルタイムダッシュボード/警告通知AWS Cloud相互連携11RedshiftQuickSightEMR SageMakerKinesisGlueS3Athenaデータウェアハウス構造化
12.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイク半構造化/非構造化/アーカイブデータレイクGlueS3
13.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.S3によるデータレイク実現のメリット• 上限無し︓サイジング不要• ⾼い耐久性︓99.999999999%• 安価︓• $0.025/GB/⽉*(スタンダード)• $0.019/GB/⽉*(標準-低頻度アクセス)例)10TBの保存で約2.1万円/⽉**• APIアクセス• 多様な⾔語にライブラリを提供• AWS各種サービスと連携データレイクAmazonEMR(Hadoop)AmazonRedshiftAWSGlueAmazonS3センサーデータ 非構造化ファイルテキストファイルRDBMS* 費用は2019年10月時点での東京リージョンでの価格です** 1USドル = 110円で、標準-低頻度アクセスでの試算AmazonSageMaker
14.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.Amazon S3データ分析EMR RedshiftデータバックアップEC2 RDSStorageGatewayEBSRedshiftETLCloudFrontコンテンツ変換コンテンツ配信ElasticTranscoderデータアーカイブGlacierAWSのデータレイク=Amazon S3AthenaAmazonForecastAmazonPersonalizeAmazonRekognitionAmazonSageMaker機械学習IoTAWS IoTBIQuickSightAWS Glue
15.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイク半構造化/非構造化/アーカイブデータレイクGlueS3
16.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.AWS GlueデータレイクのデータカタログとETL処理データカタログ§ AWS Glue データカタログ︓Redshift Spectrum,Athena, EMRからS3上の半構造データにアクセスする場合のデータカタログとして利⽤・連携可能§ AWS Glue ETL︓分散処理でETLジョブを⾏うフルマネージドでサーバーレスなサービス。コストは利⽤したリソース分だけの⽀払いETL処理16データカタログとは︓データの構造(列、型など)やアクセス⽅法を定義してあり検索などが可能ETL処理とは︓複数のデータストア間でデータ連携する際の取出し(Extract)、変換(Transform)、ロード(Load) 処理
17.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.AWS Glue データカタログテーブル構造をHiveメタストア互換の形式で管理• 列・プロパティ・型• データロケーション(S3のパス)• 更新情報 等クローラーによる自動スキーマ推論とデータカタログ登録• Hiveパーティションを認識し登録を自動化 /mydata/year=2017/month=11/...17/month=12/...
18.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイク半構造化/非構造化/アーカイブAWSのビッグデータ分析基盤︓ハイレベルアーキテクチャBI 機械学習分析クエリ ビッグデータ処理 リアルタイムダッシュボード/警告通知AWS Cloud相互連携RedshiftQuickSightEMR SageMakerKinesisGlueS3Athenaデータウェアハウス構造化
19.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データウェアハウス構造化データRedshift
20.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.Amazon Redshift特徴• 最⼤2PBまで拡張可能• 超並列(MPP)で、列指向型DBエンジンによる⾼速SQL処理• 最⼤128台まで拡張可能• PostgreSQLとの互換性• 使った分だけの利⽤料⾦で従来のデータウェアハウスの1/10のコストで実現フルマネージドのクラウド型データウェアハウスサービスJDBC/ODBCRedshift
21.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.Amazon Redshift Spectrum• S3上に置いたファイルを外部テーブルとして直接参照して⾼速分析処理• Redshift内のデータベースの内部テーブルと組み合わせてSQLでクエリ可能• 多様なファイルフォーマットに対応ü CSV, TSV, Parquet, ORC,RegexSerDe 等S3各種データ(CSV,Parquet等)Spectrum層Redshift
22.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイク半構造化/非構造化/アーカイブAWSのビッグデータ分析基盤︓ハイレベルアーキテクチャBI 機械学習分析クエリ ビッグデータ処理 リアルタイムダッシュボード/警告通知AWS Cloud相互連携RedshiftQuickSightEMR SageMakerKinesisGlueS3Athenaデータウェアハウス構造化
23.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイクビッグデータ処理Athena EMR
24.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.Amazon Elastic MapReduce(EMR)Hadoop/Sparkなどの⼤規模分散処理環境のマネージドサービスü 簡単スタート︓数クリックでセットアップ完了ü 低コスト︓従量課⾦、必⽤な時間だけクラスターを稼働分散処理フレームワーク分散処理基盤簡単に複製リサイズも1クリックAmazonS3AmazonDynamoDBAmazonKinesisAmazonEMR
25.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.EMRFS: S3をHDFSの様に扱う“s3://” と指定するだけでHDFSと同様にS3にアクセス• 計算ノードとストレージを分離できるü コスト⾯でもメリット⼤• クラスタのシャットダウンが可能ü クラスタを消してもデータをロストしない• 複数クラスタ間でデータ共有が簡単• データの⾼い耐久性(S3)EMREMRデータレイクに直接並列でアクセスすることが可能AmazonS3
26.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.Amazon Athena• S3上のファイルにSQLを実⾏可能• PrestoベースでANSI SQL対応• サーバ管理、データロード不要• ⾃動で並列クエリ実⾏• 結果はコンソールにストリーム(動的更新)• 結果はS3にも保存• スキャンしたデータ量に対する課⾦• JDBC/ODBC経由でBIツールから可視化S3に保存したファイルをサーバーレスでインタラクティブに直接クエリ26
27.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイク半構造化/非構造化/アーカイブAWSのビッグデータ分析基盤︓ハイレベルアーキテクチャBI 機械学習分析クエリ ビッグデータ処理 リアルタイムダッシュボード/警告通知AWS Cloud相互連携RedshiftQuickSightEMR SageMakerKinesisGlueS3Athenaデータウェアハウス構造化
28.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイクの代表的なユースケース
29.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.⾼速データ処理の実装理論︓ラムダ・アーキテクチャスピード /バッチレイヤ29http://lambda-architecture.net/newdatabatch layerspeed layermasterdatasetreal-timeviewreal-timeviewserving layerbatch viewbatch viewqueryquery全データの精度の⾼い集計リアルタイムにデータ処理結果のマージバッチ処理の結果を提供
30.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.ラムダ・アーキテクチャのデータレイク実装例Amazon S3AmazonDynamoDBDevicesSensorsAWS IoTAmazon KinesisData StreamsAWSGreengrassAmazon KinesisData FirehoseAmazon KinesisData AnalyticsAmazon KinesisData StreamsデータレイクAWSGlueAmazonEMRAmazonRedshiftAmazonAthenaAmazonSageMakerスピードレイヤバッチレイヤAmazonQuickSight
31.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.ラムダ・アーキテクチャのデータレイク実装例Amazon S3AmazonDynamoDBDevicesSensorsAWS IoTAmazon KinesisData StreamsAWSGreengrassAmazon KinesisData FirehoseAmazon KinesisData AnalyticsAmazon KinesisData StreamsデータレイクAWSGlueAmazonEMRAmazonRedshiftAmazonAthenaAmazonSageMakerスピードレイヤバッチレイヤAmazonQuickSightバッチレイヤへの取込みを待たずにリアルタイムデータを即時に活用(速報値の表示/警告通知など)
32.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.セキュアなデータレイクを数⽇で構築特徴 ( https://aws.amazon.com/jp/lake-formation/ )❏ Amazon S3 バケットからのデータ認識・取込・クレンジング・カタログ化・変換が容易に可能❏ Blueprint による容易なデータロード設定❖ データベースデータのロード• スナップショットデータをロードするバルクロード• 更新データを継続的にロードするインクリメンタルロード❖ CLB/ALB/CloudTrail ログのロード❏ 機械学習による変換で容易に重複データを排除❏ DataLake にアクセスする複数サービスに対し、横断的にセキュリティポリシーを適⽤❏ テーブル、および、カラム粒度の権限付与が可能❏ セルフサービスアクセス化を加速するカタログ管理機能❏ リアルタイム監査とモニタリング価格体系❏ Lake Formation ⾃体の利⽤は無償❏ Lake Formation で利⽤されるサービスにかかる費⽤のみのお⽀払い新しいインサイトの獲得と管理複数サービス横断セキュリティポリシー適⽤データの認識、取込、クレンジング、変換AWS Lake Formation
33.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.Amazonのデータレイク事例
34.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.Amazon のビジネスとデータ活用Amazon Data Warehouse• Amazon はグローバルに様々なビジネスを展開• そこから生まれる大量のデータを分析してビジネス判断
35.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.多様な分析要件と大きなワークロード80,000 ユーザー900,000 ジョブ/日38,000 のデータセット分析ユーザーとユースケースは多種多様
36.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.Amazon のデータウェアハウスの課題
37.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.“Andes” –データレイク・プロジェクト–• Amazonの成長に合わせて拡張可能なエコシステムを提供• オープンなシステムアーキテクチャで、多様なデータ分析の選択肢を提供• AWSを利用してフィードバック、サービス改善に貢献
38.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.“Andes” 以前の DWH のアーキテクチャLegacy DataWarehouseETLM Workflow ServiceExportHosted Compute and StorageExecution DAGDataIngestionData SourcesUsersReportingSystemsSoftwareApplicationsAmazonDynamoDBAmazonAuroraAmazonRedshiftOracle
39.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.“Andes” のアーキテクチャ SynchronizedMetadata, DataAmazonRedshiftAmazonRedshiftAWSGlueAWSGlueAmazonAuroraAmazonDynamoDBBig Data SystemDiscovery ServiceSynchronizersETLM WorkflowServiceExecutionDAGDataIngestionHoot UIData SourcesGlue ETLOrchestrationSpectrumAndes Metadata &Governance ServiceCompletionServiceCustom EMROrchestrationAmazonKinesisAmazon Simple StorageService (S3)AmazonEMRAmazonEMRAmazon S3LOAD参照
40.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.“Andes” 完成(2018年1月移行完了)• PBクラスの DWH を AWS に移行• DWH に加えてビッグデータ処理も可能に動画:https://www.youtube.com/watch?v=PitJL9vOotcスライド:https://www.slideshare.net/AmazonWebServices/under-the-hood-how-amazon-uses-aws-services-for-analytics-at-a-massive-scale-ant206-aws-reinvent-2018
41.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.• 収集と後続処理が分離され、収集側がデータレイクにデータを置くだけで良い構成• セルフサービスを促進するために「発⾒」「登録」層を導⼊セルフサービスを実現するための仕組み収集 蓄積データレイク分析 可視化・応⽤発⾒ 登録Discover Subscribeセルフサービス化
42.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.データレイクポータルによる「発⾒」の実現各種情報を提供• 登録者情報• 詳細情報(登録者が記⼊)• スキーマ• サポートレベル• 評価(今後の実装)部署やデータタイプによる分類検索機能※この図はアイデア検討時のモックアップであり、実際とは異なります
43.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.✔「登録」によるセルフサービスのデータ取得関係者との調整や開発不要欲しいデータを発⾒したら、登録(Subscribe)する登録時にはデータの⾏き先を指定(⾃部⾨のRedshiftやEMR等)⾃動的にコピー処理やメタデータ同期処理が構築され、定期的にフレッシュなデータが供給される✔登録(Subscribe)AmazonRedshiftAmazonEMRデータ定期コピー(バッチ)メタデータ同期(S3へは透過アクセス)AWS Glue
44.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.「登録」モデルの実現とその効果ユーザ調整が可能な設計• 必要なデータ範囲や頻度を設定可能• 独⾃のクエリを登録して、データ連携のタイミングで⾃動実⾏⾃動的なバリデーション(表⾏数チェック、スキーマチェック等)誰が何を使っているか把握できるため、データの削除や変更時にも影響範囲が把握できるという効果ありINSERT INTO ..SELECT ...User QueryWhen ...▼After data copyID = ABC and ...WhereTiming▼ Once a day :3AM
45.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.⾮常に多くのお客様がデータレイク基盤をAWSに構築10,000以上のデータレイクがAWS上で稼働
46.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.AWS Data Lake ハンズオンセミナーのご紹介参考:https://aws.amazon.com/jp/blogs/news/20190405-aws-datalake-handson-seminor/• 目黒の AWS Japan オフィスで不定期開催(無償セミナー)• 2018年から過去9回開催、参加者は100名程度• イベント開催予定:https://aws.amazon.com/jp/about-aws/events/
47.
© 2019, Amazon
Web Services, Inc. or its Affiliates. All rights reserved.Thank you!
Download
[8]
ページ先頭
©2009-2025
Movatter.jp