ablog

不器用で落着きのない技術者のメモ

2020-01-01から1日間の記事一覧

Spark on EMR から Glue Catalog を参照する

AWS

Spark on EMR から Glue Catalog を参照してみたメモ。 前提 Glue カタログにすでにデータベースとテーブルは存在するものとする。 設定 EMRクラスターを作成する際に [ソフトウェア設定]で Spark にチェックを入れ、 [AWS Glue Data Catalog の設定 (オプシ…

Spark UI で Glue ジョブの結果を確認する手順

S3 に Spark event log 用のパス(例: s3://spark-ui-tokyo-ya/eventlog)を作成し、Glueジョブの[モニタリングオプション]-[Spark UI] にチェックを入れ、[Amazon S3 prefix for Spark event logs]にその S3 のパスを指定し、CloudFormation で Spark Histo…