ablog

不器用で落着きのない技術者のメモ

2018-11-25から1日間の記事一覧

Hive on EMR で S3 Select を有効化してI/O量を削減する

AWS

Hive on EMR で S3 Select を有効化すると、I/O量が削減され、実行時間が短縮することを確認した*1。 検証結果 通常 hive> select count(tax_region) from sh10.json_sales★ where tax_region = 'US'; Query ID = hadoop_20181125201846_ceb61407-d775-4399-…