Movatterモバイル変換


[0]ホーム

URL:


959 views

Serverless analytics on aws

2018/10/5 に開催された Analytics Architecture Night - Tokyo の発表資料です https://analyticsarchitecturenighttoky.splashthat.com/

Embed presentation

Downloaded 32 times
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Makoto Shimura, Analytics Specialist SA2018.10.05Serverless Analytics on AWS
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.自己紹介志村 誠アナリティクススペシャリスト ソリューションアーキテクト• データ分析・機械学習系サービスを担当• 前職はログ解析基盤構築・データ分析等• 好きなサービス• Amazon Athena• AWS Glue• Amazon SageMaker
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Agenda• サーバーレスとは?• AWS のサーバーレス分析サービス• サーバーレス分析のアーキテクチャパターン• 他サービスとの使い分け• 下回りを気にしない機械学習
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.サーバーレスとは?サーバーを気にすることなくアプリケーションを構築し実行
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.コンピューティングの進化データセンタ内の物理サーバデータセンタ内の仮想サーバクラウド上の仮想サーバ
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.コンピューティングの進化データセンタ内の物理サーバデータセンタ内の仮想サーバクラウド上の仮想サーバ・高い使用率・プロビジョニング速度 の改善・改善されたアップタイム・ディザスターリカバリ・ハードウェアの独立性・投資コストと運用コスト のトレード・よりスケール・より早い開発スピード・メンテナンスの削減・より高い可用性と耐障害性
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.いまだ残る制限クラウド上の仮想サーバ・仮想マシンの管理が必要・キャパシティや利用率の管理が必要・ワークロードのサイズを変更が必要・可用性や耐障害性を管理する必要・断続的なジョブを実行するには高コスト
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.サーバーレスへの進化サーバーレスクラウド上の仮想サーバーデータセンター内の物理サーバーデータセンター内の仮想サーバー
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.サーバーは管理しないほうが簡単こういった責任からの開放プロビジョニングと利用可用性と耐障害性スケーリング運用と管理
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.サーバーレスはよりセキュア・パッチが適用されていない サーバーは存在しない・SSH不要 / 不可・すべてのリクエストは認可され, 監査可能
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.サーバーレスな分析とは?下回りを気にせず,やりたいことに集中• データ収集: 設定だけで,あとは自動でデータを収集• データ管理: データのスキーマを自動で登録・更新• ETL: 処理を記述したスクリプトだけで,前処理を実行• クエリ: SQL だけで自由に分析• 可視化: ブラウザから簡単に GUI で可視化
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.AWS のサーバーレス分析サービス
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.AWS の分析サービスAmazon KinesisData Streams収集 管理 ETL 分析・可視化 機械学習AWS GlueAmazon KinesisData FirehoseAmazon EMRAWS GlueAWS DataPipelineAmazon AthenaAmazon RedshiftAmazon KinesisData AnalyticsAmazon ESAmazonQuickSightAmazon SageMaker
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.AWS のサーバーレス分析サービスAmazon KinesisData Streams収集 管理 ETL 分析・可視化 機械学習AWS GlueAmazon KinesisData FirehoseAmazon EMRAWS GlueAWS DataPipelineAmazon AthenaAmazon RedshiftAmazon KinesisData AnalyticsAmazon ESAmazonQuickSightAmazon SageMaker
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Amazon Kinesis Dataフルマネージド型リアルタイム大規模ストリーミング処理KDS: ストリームデータを収集し,後段で各種分析やデータ保存を実施KDF: ストリームを収集し,S3 / Redshift / ES / Splunk に簡単に配信KDA: 上記 2 つからストリームデータを取得して SQL を実施Amazon KinesisData StreamsAmazon KinesisData FirehoseAmazon KinesisData Analytics* Kinesis Processing Unit,1 KPU は 4GB メモリ,1 vCPU,および対応するネットワーク能力を表す
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Amazon Kinesis Dataサーバーレスによってストリームデータの収集・配信・分析のみに集中KDS: 利用シャード数を指定してリソースを確保KDF: データ量に応じて自動でスケールKDA: クエリ実行時のリソースを KPU* として確保Amazon KinesisData StreamsAmazon KinesisData FirehoseAmazon KinesisData Analytics* Kinesis Processing Unit,1 KPU は 4GB メモリ,1 vCPU,および対応するネットワーク能力を表す
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.AWS Glue完全マネージド型 ETL サービス大規模データに対して,Spark / Python ジョブによる ETL を実行データカタログを持ち,入力 / 出力のデータソースを管理定期的にクローラーを走らせることで,データソースのスキーマを更新多段のジョブフローを定義して,スケジュール実行
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.AWS Glueサーバーレスによってデータソースの管理と ETL のみに集中Spark ジョブを実行するためのクラスターを管理・運用する必要なしPython ジョブも同様に実行環境を意識する必要はないジョブ実行時に必要なリソースは,DPU として指定すれば自動で確保クローラーやスケジューラ,ワークフローもすべて Glue が管理* Data Processing Unit,1 DPU につき 16 GB メモリ4 vCPU が割り当てられる
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Amazon Athenaインタラクティブなクエリサービスクエリエンジンとして Presto を用い,S3 上のデータに直接クエリ数十 TB クラスのデータに対しても高速にクエリを実行Glue データカタログと連携しており,すぐに SELECT 文を実行可能BI ツールと連携して,S3 に格納したデータをすぐに可視化
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Amazon Athenaサーバーレスによって SQL クエリの実行のみに集中Presto クラスターは AWS 側で管理クエリ実行時に,使用リソースを指定する必要もないスキャンデータ量のぶんだけ課金** 1TB スキャンにつき 5$ の料金.S3 上にデータが圧縮して置かれている場合,圧縮データサイズに対して課金
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Amazon QuickSight高速な SPICE エンジンと直感的な操作,専門家不要の BIAWS 内外のさまざまなデータソースと簡単に連携わかりやすい UI を持ち,マウスだけで高速な可視化を実行可能セッション単位のリーダーライセンスにより,大きな組織でもコスト効率よく情報を共有することが可能** 1 セッション 30 分で,セッションあたり $0.30.最高 $5 の上限があるので,使わなければ $0 かつ金額も FIX 可能
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Amazon QuickSightサーバーレスによってデータの可視化のみに集中BI サーバ自体を AWS が運用するので,サーバ管理が不要利用ユーザー数が増えても,サーバ増設等を考える必要はないSPICE* にデータを取り込むことで,より高速な動作• Super-fast, Parallel, In-memory, Calculation Engine の略で,QuickSight 内部に腹持ちするデータストアのこと
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.サーバーレス分析のアーキテクチャパターン
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Glue ベースの S3 データレイク• 各種データソースのカタログを Glue で一元的に管理• データカタログは DynamoDB にも対応(7/10)• DX 経由で JDBC 接続可能なオンプレミス DB も,カタログに登録可能• S3 上のデータを Athena / Redshift Spectrum / EMR で分析
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Glue でパーティションの自動更新• 従来は,新しい Athena テーブルのパーティション認識のために,MSCK REPAIRTABLE / ALTER TABLE ADD PARTITION を実行する必要があった• Glue クローラーをスケジュール実行することで,常に最新のパーティション状態を認識させることが可能に• クローラーの設定で InheritFromTable を選択することで,クロール時にパーティション情報が自動でテーブル情報と同じものを使うように
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Glue で低レイテンシの Parquet 変換を実施• CSV / TSV / JSON 等のログファイルを Parquet に変換するために,従来は EMR などを用いる必要があった• Glue なら GUI 操作のみでも Parquet 変換ジョブを作成可能• S3 ファイル追加のイベントトリガーで Lambda を起動して,Glue ジョブを実行すれば,低レイテンシの変換処理が可能に
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Firehose 経由のログにニアリアルタイムでクエリ• Kinesis Firehose は year/month/day/hour という S3 キーの形で,Parquet データフォーマットで出力(5/10)• Parquet データは Athena から高速かつ効率的にクエリを実行可能• ログが置かれたら,すぐに分析クエリを投げることができる
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Step Functions を使ったジョブフローの構築• Step Functions でジョブフローを構築し,その中で Glue ジョブやそのほかのジョブを実行• Athena ETL + 集計クエリのフローも当然可能• 3rd Party スケジューラ製品からジョブをキックすることも可能StartGlue ETLExecuteIs Glue JobFinished ?load to RDSWait 1mYesNoIs loadFinished ?Wait 1mYesNoEndIs loadSucceed ?YesSend SNSnotificationNo
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.DMS によるマスタデータ出力を Athena で分析• RDS 上で利用しているマスタテーブルの更新履歴を,DMS + CDC を使って,S3 に逐次出力• マスタの履歴テーブルを作って,これを取り込むのがベター• Firehose 経由で S3 に送られてくる行動ログデータと JOIN することで,ニアリアルタイムな分析システムを構築
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.他サービスとの使い分け
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.使い分けのポイント• Glue / Athena は,あえて選択肢を絞ったり,チューニングの要素を絞ったりすることで,運用の負荷を下げ,本来の目的(ETL / 分析)に集中できるようにしている• まずはサーバーレス分析サービスでやりたいことが実現可能か,ワークロードをサービスに合わせられるかを考える• それらが無理なときのみ,EMR / Redshift といったサービスの利用を考える
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Glue では対応できないこと• Spark 以外のアプリケーションを使ったジョブの実行• 実行する Spark バージョンの固定• Spark Job executer メモリサイズ等の設定変更• ジョブ実行時のスタートアップタイムのコントロールGlue はサーバーレスの ETL サービスであり利用者側で制御できない部分が存在する
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.EMR + Spark / Hive という選択肢• Hive の既存資産を活用したい場合は EMR を使用• 詳細なチューニングを行うことで,メモリヘビーな Spark ジョブを実行したり,パフォーマンスを向上させたりすることが可能• クラスタを前もって立ち上げておくことで,すぐにジョブを実行させることが可能+
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Athena では対応できないこと• ピークタイミングのノード数追加• Presto のパラメタ設定• 実行する Presto を特定バージョンに固定• 利用料金の固定• 詳細なセキュリティ設定や権限設定Athena はサーバーレスのクエリサービスであり利用者側で制御できない部分が存在する
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Athena が向いていない処理• リトライ機構がなく,データを絞って高速にスキャンするアーキテクチャのため,バッチ処理には向かない• 分析処理でも,大量データを長時間処理するのには向かない• Athena のデフォルトのクエリタイムアウト時間は 30 分(上限緩和可能)ユースケース 適したサービス大規模なデータに対して,フルスキャンを定期的に行う処理 EMRテンポラリテーブルを活用した多段のETL処理 EMR, GlueサブクエリやJOINを駆使した複雑な集計処理 Redshift高頻度なレポーティングのための大量の分析処理 Redshift
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Redshift + Spectrum という選択肢• ホットデータに対する高頻度の重たいワークロードが主体の場合には,Redshiftを使う方が適切.詳細なパフォーマンスチューニングや,WLM/QMR/SQA/Result Caching 等の機能を利用可能• その上で Spectrum を使って,S3 上の大量のコールドデータに対するアクセシビリティを確保• Redshift は VPC に閉じた分析環境の構築,テーブルごとの詳細な権限設定等が可能• 多種多様な BI ツールが対応
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.Presto on EMR という選択肢• マルチデータソースアクセスや,バージョン固定,CTAS,詳細なチューニング等が可能• VPC に閉じた形の利用,Kerberos 認証,また詳細な EMRFS 認可機能を用いてセキュアなアクセスを実現可能• インスタンスフリートやスポットブロックを活用することで,利用時のコストを削減することも可能+
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.下回りを気にしない機械学習
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.機械学習のサイクルにおけるよくある課題開発 & 学習 推論エンジニアがプロダクション環境に構築エンドポイントを作成通常の API サーバA/B テストの仕組みデータサイエンティストが開発環境で作業開発と学習を同じ 1 台のインスタンスで実施Deep Learning であれば GPU インスタンスを使用
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.機械学習のサイクルにおけるよくある課題開発 & 学習 推論エンジニアがプロダクション環境に構築エンドポイントを作成通常の API サーバA/B テストの仕組みデータサイエンティストが開発環境で作業開発と学習を同じ 1 台のインスタンスで実施Deep Learning であれば GPU インスタンスを使用開発• 学習時に合わせたハイスペックのインスタンスで開発もするため,コスト効率が悪い学習• 環境構築が大変なので,開発と同じインスタンスで 1 つのインスタンスを使いまわしがち• 学習用のインスタンスが 1 つしかないため,大量の学習ジョブも1 つずつ順番に実行するしかなく,時間がかかる• 1 ジョブあたりの学習時間を減らすために,分散学習環境を構築するのは,さらに手間がかかって辛い推論• API 予測サーバを使いたいだけなのに,環境構築・管理運用・スケーラビリティ等考えないといけないことが非常に多い
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.SageMaker とはデータサイエンティスト・機械学習エンジニアが機械学習のプロセスを高速に回すためのサービス• 簡単な環境構築• 複数ジョブを同時に実行• 並列分散ジョブを実行• エンドポイントを構築
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.SageMaker が提供するアーキテクチャ開発 学習 推論SageMaker API を叩いてジョブを実行複数ジョブを同時実行分散学習も簡単に実行インスタンスの構築・実行・破棄は自動コンソールから起動主要ライブラリはプリインストール済開発用サンドボックスなのでインスタンスを意識する必要ありSageMaker API からエンドポイント作成オートスケーリングA/Bテストインスタンスの管理運用はほぼ存在しないJupyter Notebook Docker コンテナ Docker コンテナ
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.さまざまなフレームワークやアルゴリズムをサポート1. SageMaker のビルトインアルゴリズムを使う2. AWS がコンテナを用意しているフレームワークを使う1. Tensorflow2. Chainer3. PyTorch4. MXNet3. 機械学習のコードとライブラリを含んだコンテナを作成New!!
AWS 上で構築する機械学習システム
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.サーバーサイドのリアルタイム推論ユーザーの属性や行動履歴に応じた,リアルタイムのコンテンツ推薦KinesisFirehoseS3SageMakerGlueAthena QuickSightAppServers
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.サーバーサイドのバッチ推論EC サイトで商品ページを表示したら,関連するおすすめアイテムを表示KinesisFirehoseS3EMRGlueAthena QuickSightAppServersDynamoDB
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.エッジサイドのリアルタイム推論工場の生産ラインにカメラを設置し,撮影した画像から不良品を判定Camera DeviceDetection AppGPUGreengrass CoreCameraAWS IoTGlueAthena QuickSightS3 SageMakerGreengrass
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.まとめ
© 2018, Amazon Web Services, Inc. or its Affiliates. All rights reserved.まとめ• AWS にはさまざまな分析サービスがあるが,特にサーバーレス分析サービスを活用することで,やりたいことに集中可能になる• まずはサーバーレスの選択肢を考えて,それらがはまらないときに他のサービスを検討する• 機械学習も SageMaker を利用することで,下回りを考えずにシステムを構築できるように
Serverless analytics on aws

Recommended

PDF
Modernizing Big Data Workload Using Amazon EMR & AWS Glue
PDF
Data Lake ハンズオン
PDF
Amazon Kinesis Familyを活用したストリームデータ処理
PDF
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
PDF
クラウド上のデータ活用デザインパターン
PDF
ビックデータ最適解とAWSにおける新しい武器
PPTX
AWSで作る分析基盤
PDF
re:invent 2018 analytics関連アップデート
PDF
Effective Data Lakes - ユースケースとデザインパターン
PDF
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
PDF
AWS Black Belt Tech シリーズ 2015 - Amazon Elastic MapReduce
PPTX
Amazon Athena で実現する データ分析の広がり
PDF
クラウド上のデータ活用デザインパターン
PDF
Amazon S3を中心とするデータ分析のベストプラクティス
PDF
データレイクを基盤としたAWS上での機械学習サービス構築
PDF
やりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまで
PDF
[JAWSBigData#11]Cloudera on AWSと Amazon EMRを両方本番運用し 3つの観点から比較してみる
PDF
[よくわかるクラウドデータベース] CassandraからAmazon DynamoDBへの移行事例
PDF
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
PDF
Apache Kuduを使った分析システムの裏側
PDF
Amazon Elastic MapReduce with Hive/Presto ハンズオン(講義)
PDF
MySQL 開発最新動向
PDF
大規模データに対するデータサイエンスの進め方 #CWT2016
PPTX
[CWT2017]Infrastructure as Codeを活用したF.O.Xのクラウドビッグデータ環境の変化
PDF
先行事例から学ぶ IoT / ビッグデータの始め方
PDF
[db tech showcase Tokyo 2017] AzureでOSS DB/データ処理基盤のPaaSサービスを使ってみよう (Azure Dat...
PDF
DBワークロードのAWS化とデータベースサービス関連最新情報
PDF
re:Growth2019 Analytics Updates
PDF
AWS Black Belt Techシリーズ AWS Data Pipeline
PDF
20180619 AWS Black Belt Online Seminar データレイク入門: AWSで様々な規模のデータレイクを分析する効率的な方法

More Related Content

PDF
Modernizing Big Data Workload Using Amazon EMR & AWS Glue
PDF
Data Lake ハンズオン
PDF
Amazon Kinesis Familyを活用したストリームデータ処理
PDF
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
PDF
クラウド上のデータ活用デザインパターン
PDF
ビックデータ最適解とAWSにおける新しい武器
PPTX
AWSで作る分析基盤
PDF
re:invent 2018 analytics関連アップデート
Modernizing Big Data Workload Using Amazon EMR & AWS Glue
Data Lake ハンズオン
Amazon Kinesis Familyを活用したストリームデータ処理
Amazon Redshift パフォーマンスチューニングテクニックと最新アップデート
クラウド上のデータ活用デザインパターン
ビックデータ最適解とAWSにおける新しい武器
AWSで作る分析基盤
re:invent 2018 analytics関連アップデート

What's hot

PDF
Effective Data Lakes - ユースケースとデザインパターン
PDF
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
PDF
AWS Black Belt Tech シリーズ 2015 - Amazon Elastic MapReduce
PPTX
Amazon Athena で実現する データ分析の広がり
PDF
クラウド上のデータ活用デザインパターン
PDF
Amazon S3を中心とするデータ分析のベストプラクティス
PDF
データレイクを基盤としたAWS上での機械学習サービス構築
PDF
やりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまで
PDF
[JAWSBigData#11]Cloudera on AWSと Amazon EMRを両方本番運用し 3つの観点から比較してみる
PDF
[よくわかるクラウドデータベース] CassandraからAmazon DynamoDBへの移行事例
PDF
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
PDF
Apache Kuduを使った分析システムの裏側
PDF
Amazon Elastic MapReduce with Hive/Presto ハンズオン(講義)
PDF
MySQL 開発最新動向
PDF
大規模データに対するデータサイエンスの進め方 #CWT2016
PPTX
[CWT2017]Infrastructure as Codeを活用したF.O.Xのクラウドビッグデータ環境の変化
PDF
先行事例から学ぶ IoT / ビッグデータの始め方
PDF
[db tech showcase Tokyo 2017] AzureでOSS DB/データ処理基盤のPaaSサービスを使ってみよう (Azure Dat...
PDF
DBワークロードのAWS化とデータベースサービス関連最新情報
PDF
re:Growth2019 Analytics Updates
Effective Data Lakes - ユースケースとデザインパターン
Kinesis + Elasticsearchでつくるさいきょうのログ分析基盤
AWS Black Belt Tech シリーズ 2015 - Amazon Elastic MapReduce
Amazon Athena で実現する データ分析の広がり
クラウド上のデータ活用デザインパターン
Amazon S3を中心とするデータ分析のベストプラクティス
データレイクを基盤としたAWS上での機械学習サービス構築
やりたいことから考えるMicrosoft Azure 上の データストアの選び方とデータサイエンティスト向け活用法。KVSからDWHまで
[JAWSBigData#11]Cloudera on AWSと Amazon EMRを両方本番運用し 3つの観点から比較してみる
[よくわかるクラウドデータベース] CassandraからAmazon DynamoDBへの移行事例
Hadoop/Spark で Amazon S3 を徹底的に使いこなすワザ (Hadoop / Spark Conference Japan 2019)
Apache Kuduを使った分析システムの裏側
Amazon Elastic MapReduce with Hive/Presto ハンズオン(講義)
MySQL 開発最新動向
大規模データに対するデータサイエンスの進め方 #CWT2016
[CWT2017]Infrastructure as Codeを活用したF.O.Xのクラウドビッグデータ環境の変化
先行事例から学ぶ IoT / ビッグデータの始め方
[db tech showcase Tokyo 2017] AzureでOSS DB/データ処理基盤のPaaSサービスを使ってみよう (Azure Dat...
DBワークロードのAWS化とデータベースサービス関連最新情報
re:Growth2019 Analytics Updates

Similar to Serverless analytics on aws

PDF
AWS Black Belt Techシリーズ AWS Data Pipeline
PDF
20180619 AWS Black Belt Online Seminar データレイク入門: AWSで様々な規模のデータレイクを分析する効率的な方法
PDF
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
PDF
Amazon Game Tech Night #22 AWSで実現するデータレイクとアナリティクス
PDF
データ活用を加速するAWS分析サービスのご紹介
PDF
20200617 AWS Black Belt Online Seminar Amazon Athena
PDF
20210330 AWS Black Belt Online Seminar AWS Glue -Glue Studioを使ったデータ変換のベストプラクティス-
PDF
AWS Black Belt - AWS Glue
PDF
AWS Glueを使った Serverless ETL の実装パターン
PPTX
[20220126] JAWS-UG 2022初頭までに葬ったAWSアンチパターン大紹介
PDF
AWSの様々なアーキテクチャ
PDF
Serverless services on_aws_dmm_meetup_20170801
PDF
ビッグデータサービス群のおさらい & AWS Data Pipeline
PDF
Developers.IO 2019 Effective Datalake
PPTX
Security Operations and Automation on AWS
PDF
【IVS CTO Night & Day】AWSにおけるビッグデータ活用
PDF
Data discoveryを支えるawsのbig data技術と最新事例
PPTX
20170803 bigdataevent
PPTX
Stream processing on AWS
PDF
AWS Summit Chicago 2016発表のサービスアップデートまとめ
AWS Black Belt Techシリーズ AWS Data Pipeline
20180619 AWS Black Belt Online Seminar データレイク入門: AWSで様々な規模のデータレイクを分析する効率的な方法
[CTO Night & Day 2019] AWS で構築するデータレイク基盤と amazon.com での導入事例 #ctonight
Amazon Game Tech Night #22 AWSで実現するデータレイクとアナリティクス
データ活用を加速するAWS分析サービスのご紹介
20200617 AWS Black Belt Online Seminar Amazon Athena
20210330 AWS Black Belt Online Seminar AWS Glue -Glue Studioを使ったデータ変換のベストプラクティス-
AWS Black Belt - AWS Glue
AWS Glueを使った Serverless ETL の実装パターン
[20220126] JAWS-UG 2022初頭までに葬ったAWSアンチパターン大紹介
AWSの様々なアーキテクチャ
Serverless services on_aws_dmm_meetup_20170801
ビッグデータサービス群のおさらい & AWS Data Pipeline
Developers.IO 2019 Effective Datalake
Security Operations and Automation on AWS
【IVS CTO Night & Day】AWSにおけるビッグデータ活用
Data discoveryを支えるawsのbig data技術と最新事例
20170803 bigdataevent
Stream processing on AWS
AWS Summit Chicago 2016発表のサービスアップデートまとめ

More from Amazon Web Services Japan

PDF
202201 AWS Black Belt Online Seminar Apache Spark Performnace Tuning for AWS ...
PDF
202202 AWS Black Belt Online Seminar AWS SaaS Boost で始めるSaaS開発⼊⾨
PDF
マルチテナント化で知っておきたいデータベースのこと
PPTX
20220409 AWS BLEA 開発にあたって検討したこと
PDF
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介
PDF
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート
PDF
202205 AWS Black Belt Online Seminar Amazon VPC IP Address Manager (IPAM)
PDF
202204 AWS Black Belt Online Seminar AWS IoT Device Defender
PDF
202202 AWS Black Belt Online Seminar Amazon Connect Customer Profiles
PDF
202203 AWS Black Belt Online Seminar Amazon Connect Tasks.pdf
PDF
202202 AWS Black Belt Online Seminar AWS Managed Rules for AWS WAF の活用
PDF
202205 AWS Black Belt Online Seminar Amazon FSx for OpenZFS
PDF
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ
PDF
パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介
PDF
202204 AWS Black Belt Online Seminar Amazon Connect Salesforce連携(第1回 CTI Adap...
PDF
Amazon QuickSight の組み込み方法をちょっぴりDD
PDF
Infrastructure as Code (IaC) 談義 2022
PDF
202204 AWS Black Belt Online Seminar Amazon Connect を活用したオンコール対応の実現
PDF
Amazon Game Tech Night #24 KPIダッシュボードを最速で用意するために
PDF
202111 AWS Black Belt Online Seminar AWSで構築するSmart Mirrorのご紹介
202201 AWS Black Belt Online Seminar Apache Spark Performnace Tuning for AWS ...
202202 AWS Black Belt Online Seminar AWS SaaS Boost で始めるSaaS開発⼊⾨
マルチテナント化で知っておきたいデータベースのこと
20220409 AWS BLEA 開発にあたって検討したこと
SaaS テナント毎のコストを把握するための「AWS Application Cost Profiler」のご紹介
Amazon Game Tech Night #25 ゲーム業界向け機械学習最新状況アップデート
202205 AWS Black Belt Online Seminar Amazon VPC IP Address Manager (IPAM)
202204 AWS Black Belt Online Seminar AWS IoT Device Defender
202202 AWS Black Belt Online Seminar Amazon Connect Customer Profiles
202203 AWS Black Belt Online Seminar Amazon Connect Tasks.pdf
202202 AWS Black Belt Online Seminar AWS Managed Rules for AWS WAF の活用
202205 AWS Black Belt Online Seminar Amazon FSx for OpenZFS
機密データとSaaSは共存しうるのか!?セキュリティー重視のユーザー層を取り込む為のネットワーク通信のアプローチ
パッケージソフトウェアを簡単にSaaS化!?既存の資産を使ったSaaS化手法のご紹介
202204 AWS Black Belt Online Seminar Amazon Connect Salesforce連携(第1回 CTI Adap...
Amazon QuickSight の組み込み方法をちょっぴりDD
Infrastructure as Code (IaC) 談義 2022
202204 AWS Black Belt Online Seminar Amazon Connect を活用したオンコール対応の実現
Amazon Game Tech Night #24 KPIダッシュボードを最速で用意するために
202111 AWS Black Belt Online Seminar AWSで構築するSmart Mirrorのご紹介

Serverless analytics on aws

  • 1.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Makoto Shimura, Analytics Specialist SA2018.10.05Serverless Analytics on AWS
  • 2.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.自己紹介志村 誠アナリティクススペシャリスト ソリューションアーキテクト• データ分析・機械学習系サービスを担当• 前職はログ解析基盤構築・データ分析等• 好きなサービス• Amazon Athena• AWS Glue• Amazon SageMaker
  • 3.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Agenda• サーバーレスとは?• AWS のサーバーレス分析サービス• サーバーレス分析のアーキテクチャパターン• 他サービスとの使い分け• 下回りを気にしない機械学習
  • 4.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.サーバーレスとは?サーバーを気にすることなくアプリケーションを構築し実行
  • 5.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.コンピューティングの進化データセンタ内の物理サーバデータセンタ内の仮想サーバクラウド上の仮想サーバ
  • 6.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.コンピューティングの進化データセンタ内の物理サーバデータセンタ内の仮想サーバクラウド上の仮想サーバ・高い使用率・プロビジョニング速度 の改善・改善されたアップタイム・ディザスターリカバリ・ハードウェアの独立性・投資コストと運用コスト のトレード・よりスケール・より早い開発スピード・メンテナンスの削減・より高い可用性と耐障害性
  • 7.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.いまだ残る制限クラウド上の仮想サーバ・仮想マシンの管理が必要・キャパシティや利用率の管理が必要・ワークロードのサイズを変更が必要・可用性や耐障害性を管理する必要・断続的なジョブを実行するには高コスト
  • 8.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.サーバーレスへの進化サーバーレスクラウド上の仮想サーバーデータセンター内の物理サーバーデータセンター内の仮想サーバー
  • 9.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.サーバーは管理しないほうが簡単こういった責任からの開放プロビジョニングと利用可用性と耐障害性スケーリング運用と管理
  • 10.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.サーバーレスはよりセキュア・パッチが適用されていない サーバーは存在しない・SSH不要 / 不可・すべてのリクエストは認可され, 監査可能
  • 11.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.サーバーレスな分析とは?下回りを気にせず,やりたいことに集中• データ収集: 設定だけで,あとは自動でデータを収集• データ管理: データのスキーマを自動で登録・更新• ETL: 処理を記述したスクリプトだけで,前処理を実行• クエリ: SQL だけで自由に分析• 可視化: ブラウザから簡単に GUI で可視化
  • 12.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.AWS のサーバーレス分析サービス
  • 13.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.AWS の分析サービスAmazon KinesisData Streams収集 管理 ETL 分析・可視化 機械学習AWS GlueAmazon KinesisData FirehoseAmazon EMRAWS GlueAWS DataPipelineAmazon AthenaAmazon RedshiftAmazon KinesisData AnalyticsAmazon ESAmazonQuickSightAmazon SageMaker
  • 14.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.AWS のサーバーレス分析サービスAmazon KinesisData Streams収集 管理 ETL 分析・可視化 機械学習AWS GlueAmazon KinesisData FirehoseAmazon EMRAWS GlueAWS DataPipelineAmazon AthenaAmazon RedshiftAmazon KinesisData AnalyticsAmazon ESAmazonQuickSightAmazon SageMaker
  • 15.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Amazon Kinesis Dataフルマネージド型リアルタイム大規模ストリーミング処理KDS: ストリームデータを収集し,後段で各種分析やデータ保存を実施KDF: ストリームを収集し,S3 / Redshift / ES / Splunk に簡単に配信KDA: 上記 2 つからストリームデータを取得して SQL を実施Amazon KinesisData StreamsAmazon KinesisData FirehoseAmazon KinesisData Analytics* Kinesis Processing Unit,1 KPU は 4GB メモリ,1 vCPU,および対応するネットワーク能力を表す
  • 16.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Amazon Kinesis Dataサーバーレスによってストリームデータの収集・配信・分析のみに集中KDS: 利用シャード数を指定してリソースを確保KDF: データ量に応じて自動でスケールKDA: クエリ実行時のリソースを KPU* として確保Amazon KinesisData StreamsAmazon KinesisData FirehoseAmazon KinesisData Analytics* Kinesis Processing Unit,1 KPU は 4GB メモリ,1 vCPU,および対応するネットワーク能力を表す
  • 17.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.AWS Glue完全マネージド型 ETL サービス大規模データに対して,Spark / Python ジョブによる ETL を実行データカタログを持ち,入力 / 出力のデータソースを管理定期的にクローラーを走らせることで,データソースのスキーマを更新多段のジョブフローを定義して,スケジュール実行
  • 18.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.AWS Glueサーバーレスによってデータソースの管理と ETL のみに集中Spark ジョブを実行するためのクラスターを管理・運用する必要なしPython ジョブも同様に実行環境を意識する必要はないジョブ実行時に必要なリソースは,DPU として指定すれば自動で確保クローラーやスケジューラ,ワークフローもすべて Glue が管理* Data Processing Unit,1 DPU につき 16 GB メモリ4 vCPU が割り当てられる
  • 19.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Amazon Athenaインタラクティブなクエリサービスクエリエンジンとして Presto を用い,S3 上のデータに直接クエリ数十 TB クラスのデータに対しても高速にクエリを実行Glue データカタログと連携しており,すぐに SELECT 文を実行可能BI ツールと連携して,S3 に格納したデータをすぐに可視化
  • 20.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Amazon Athenaサーバーレスによって SQL クエリの実行のみに集中Presto クラスターは AWS 側で管理クエリ実行時に,使用リソースを指定する必要もないスキャンデータ量のぶんだけ課金** 1TB スキャンにつき 5$ の料金.S3 上にデータが圧縮して置かれている場合,圧縮データサイズに対して課金
  • 21.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Amazon QuickSight高速な SPICE エンジンと直感的な操作,専門家不要の BIAWS 内外のさまざまなデータソースと簡単に連携わかりやすい UI を持ち,マウスだけで高速な可視化を実行可能セッション単位のリーダーライセンスにより,大きな組織でもコスト効率よく情報を共有することが可能** 1 セッション 30 分で,セッションあたり $0.30.最高 $5 の上限があるので,使わなければ $0 かつ金額も FIX 可能
  • 22.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Amazon QuickSightサーバーレスによってデータの可視化のみに集中BI サーバ自体を AWS が運用するので,サーバ管理が不要利用ユーザー数が増えても,サーバ増設等を考える必要はないSPICE* にデータを取り込むことで,より高速な動作• Super-fast, Parallel, In-memory, Calculation Engine の略で,QuickSight 内部に腹持ちするデータストアのこと
  • 23.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.サーバーレス分析のアーキテクチャパターン
  • 24.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Glue ベースの S3 データレイク• 各種データソースのカタログを Glue で一元的に管理• データカタログは DynamoDB にも対応(7/10)• DX 経由で JDBC 接続可能なオンプレミス DB も,カタログに登録可能• S3 上のデータを Athena / Redshift Spectrum / EMR で分析
  • 25.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Glue でパーティションの自動更新• 従来は,新しい Athena テーブルのパーティション認識のために,MSCK REPAIRTABLE / ALTER TABLE ADD PARTITION を実行する必要があった• Glue クローラーをスケジュール実行することで,常に最新のパーティション状態を認識させることが可能に• クローラーの設定で InheritFromTable を選択することで,クロール時にパーティション情報が自動でテーブル情報と同じものを使うように
  • 26.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Glue で低レイテンシの Parquet 変換を実施• CSV / TSV / JSON 等のログファイルを Parquet に変換するために,従来は EMR などを用いる必要があった• Glue なら GUI 操作のみでも Parquet 変換ジョブを作成可能• S3 ファイル追加のイベントトリガーで Lambda を起動して,Glue ジョブを実行すれば,低レイテンシの変換処理が可能に
  • 27.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Firehose 経由のログにニアリアルタイムでクエリ• Kinesis Firehose は year/month/day/hour という S3 キーの形で,Parquet データフォーマットで出力(5/10)• Parquet データは Athena から高速かつ効率的にクエリを実行可能• ログが置かれたら,すぐに分析クエリを投げることができる
  • 28.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Step Functions を使ったジョブフローの構築• Step Functions でジョブフローを構築し,その中で Glue ジョブやそのほかのジョブを実行• Athena ETL + 集計クエリのフローも当然可能• 3rd Party スケジューラ製品からジョブをキックすることも可能StartGlue ETLExecuteIs Glue JobFinished ?load to RDSWait 1mYesNoIs loadFinished ?Wait 1mYesNoEndIs loadSucceed ?YesSend SNSnotificationNo
  • 29.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.DMS によるマスタデータ出力を Athena で分析• RDS 上で利用しているマスタテーブルの更新履歴を,DMS + CDC を使って,S3 に逐次出力• マスタの履歴テーブルを作って,これを取り込むのがベター• Firehose 経由で S3 に送られてくる行動ログデータと JOIN することで,ニアリアルタイムな分析システムを構築
  • 30.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.他サービスとの使い分け
  • 31.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.使い分けのポイント• Glue / Athena は,あえて選択肢を絞ったり,チューニングの要素を絞ったりすることで,運用の負荷を下げ,本来の目的(ETL / 分析)に集中できるようにしている• まずはサーバーレス分析サービスでやりたいことが実現可能か,ワークロードをサービスに合わせられるかを考える• それらが無理なときのみ,EMR / Redshift といったサービスの利用を考える
  • 32.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Glue では対応できないこと• Spark 以外のアプリケーションを使ったジョブの実行• 実行する Spark バージョンの固定• Spark Job executer メモリサイズ等の設定変更• ジョブ実行時のスタートアップタイムのコントロールGlue はサーバーレスの ETL サービスであり利用者側で制御できない部分が存在する
  • 33.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.EMR + Spark / Hive という選択肢• Hive の既存資産を活用したい場合は EMR を使用• 詳細なチューニングを行うことで,メモリヘビーな Spark ジョブを実行したり,パフォーマンスを向上させたりすることが可能• クラスタを前もって立ち上げておくことで,すぐにジョブを実行させることが可能+
  • 34.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Athena では対応できないこと• ピークタイミングのノード数追加• Presto のパラメタ設定• 実行する Presto を特定バージョンに固定• 利用料金の固定• 詳細なセキュリティ設定や権限設定Athena はサーバーレスのクエリサービスであり利用者側で制御できない部分が存在する
  • 35.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Athena が向いていない処理• リトライ機構がなく,データを絞って高速にスキャンするアーキテクチャのため,バッチ処理には向かない• 分析処理でも,大量データを長時間処理するのには向かない• Athena のデフォルトのクエリタイムアウト時間は 30 分(上限緩和可能)ユースケース 適したサービス大規模なデータに対して,フルスキャンを定期的に行う処理 EMRテンポラリテーブルを活用した多段のETL処理 EMR, GlueサブクエリやJOINを駆使した複雑な集計処理 Redshift高頻度なレポーティングのための大量の分析処理 Redshift
  • 36.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Redshift + Spectrum という選択肢• ホットデータに対する高頻度の重たいワークロードが主体の場合には,Redshiftを使う方が適切.詳細なパフォーマンスチューニングや,WLM/QMR/SQA/Result Caching 等の機能を利用可能• その上で Spectrum を使って,S3 上の大量のコールドデータに対するアクセシビリティを確保• Redshift は VPC に閉じた分析環境の構築,テーブルごとの詳細な権限設定等が可能• 多種多様な BI ツールが対応
  • 37.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.Presto on EMR という選択肢• マルチデータソースアクセスや,バージョン固定,CTAS,詳細なチューニング等が可能• VPC に閉じた形の利用,Kerberos 認証,また詳細な EMRFS 認可機能を用いてセキュアなアクセスを実現可能• インスタンスフリートやスポットブロックを活用することで,利用時のコストを削減することも可能+
  • 38.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.下回りを気にしない機械学習
  • 39.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.機械学習のサイクルにおけるよくある課題開発 & 学習 推論エンジニアがプロダクション環境に構築エンドポイントを作成通常の API サーバA/B テストの仕組みデータサイエンティストが開発環境で作業開発と学習を同じ 1 台のインスタンスで実施Deep Learning であれば GPU インスタンスを使用
  • 40.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.機械学習のサイクルにおけるよくある課題開発 & 学習 推論エンジニアがプロダクション環境に構築エンドポイントを作成通常の API サーバA/B テストの仕組みデータサイエンティストが開発環境で作業開発と学習を同じ 1 台のインスタンスで実施Deep Learning であれば GPU インスタンスを使用開発• 学習時に合わせたハイスペックのインスタンスで開発もするため,コスト効率が悪い学習• 環境構築が大変なので,開発と同じインスタンスで 1 つのインスタンスを使いまわしがち• 学習用のインスタンスが 1 つしかないため,大量の学習ジョブも1 つずつ順番に実行するしかなく,時間がかかる• 1 ジョブあたりの学習時間を減らすために,分散学習環境を構築するのは,さらに手間がかかって辛い推論• API 予測サーバを使いたいだけなのに,環境構築・管理運用・スケーラビリティ等考えないといけないことが非常に多い
  • 41.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.
  • 42.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.SageMaker とはデータサイエンティスト・機械学習エンジニアが機械学習のプロセスを高速に回すためのサービス• 簡単な環境構築• 複数ジョブを同時に実行• 並列分散ジョブを実行• エンドポイントを構築
  • 43.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.SageMaker が提供するアーキテクチャ開発 学習 推論SageMaker API を叩いてジョブを実行複数ジョブを同時実行分散学習も簡単に実行インスタンスの構築・実行・破棄は自動コンソールから起動主要ライブラリはプリインストール済開発用サンドボックスなのでインスタンスを意識する必要ありSageMaker API からエンドポイント作成オートスケーリングA/Bテストインスタンスの管理運用はほぼ存在しないJupyter Notebook Docker コンテナ Docker コンテナ
  • 44.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.さまざまなフレームワークやアルゴリズムをサポート1. SageMaker のビルトインアルゴリズムを使う2. AWS がコンテナを用意しているフレームワークを使う1. Tensorflow2. Chainer3. PyTorch4. MXNet3. 機械学習のコードとライブラリを含んだコンテナを作成New!!
  • 45.
  • 46.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.サーバーサイドのリアルタイム推論ユーザーの属性や行動履歴に応じた,リアルタイムのコンテンツ推薦KinesisFirehoseS3SageMakerGlueAthena QuickSightAppServers
  • 47.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.サーバーサイドのバッチ推論EC サイトで商品ページを表示したら,関連するおすすめアイテムを表示KinesisFirehoseS3EMRGlueAthena QuickSightAppServersDynamoDB
  • 48.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.エッジサイドのリアルタイム推論工場の生産ラインにカメラを設置し,撮影した画像から不良品を判定Camera DeviceDetection AppGPUGreengrass CoreCameraAWS IoTGlueAthena QuickSightS3 SageMakerGreengrass
  • 49.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.まとめ
  • 50.
    © 2018, AmazonWeb Services, Inc. or its Affiliates. All rights reserved.まとめ• AWS にはさまざまな分析サービスがあるが,特にサーバーレス分析サービスを活用することで,やりたいことに集中可能になる• まずはサーバーレスの選択肢を考えて,それらがはまらないときに他のサービスを検討する• 機械学習も SageMaker を利用することで,下回りを考えずにシステムを構築できるように

[8]ページ先頭

©2009-2025 Movatter.jp