2020-03-15 メモ Hadoop HDFS Apache Impalaパフォーマンスチューニング #dbts2018 from Cloudera Japan Effective Data Lakes - ユースケースとデザインパターン from Noritaka Sekiyama Amazon S3 Best Practice and Tuning for Hadoop/Spark in the Cloud from Noritaka Sekiyama Apache Hadoopエコシステムにおける、異なるファイル形式とストレージエンジンのパフォーマンス比較 [翻訳記事] 小さなファイルが大きな問題を引き起こす:Hadoopクラスターでのスモールファイルの予防と対処について Amazon Athena のパフォーマンスチューニング Tips トップ 10 | Amazon Web Services ブログ Impalaのパフォーマンスガイドラインとベストプラクティス(翻訳) - Qiita hadoop - Is Snappy splittable or not splittable? - Stack Overflow