ablog

不器用で落着きのない技術者のメモ

EMR で s3-dist-cp が見つからない

事象

  • アプリケーションバンドル "Spark" で作成したEMRクラスター(6.10.0)で s3-dist-cp が見つからない。
[hadoop@ip-10-5-143-241 ~]$ s3-dist-cp
-bash: s3-dist-cp: command not found

原因

  • Hadoop がインストールされてないため。

解決策

  • アプリケーションバンドルで "Custom" を選択し、Spark と Hadoop を選択する。