Apache Arrow東京ミートアップ2019 - connpass に参加してきた。
カラムナの会のメンバーとしては要チェックな Apache Arrow。圧縮有無は Parquet との大きな違い。圧縮するとIO量は減るけどCPUでのオーバヘッドが増えるので、IOレイテンシとのトレードオフ。どちらが速いかはIOレイテンシと帯域幅に依存する。って何年か前に海外さんがArrowを選択した理由として聞いたなw いずれにしても汎用性が高いのでストレージに保存できるインメモリデータマートとして活用範囲が広がりそう。
イントロダクション
- by 須藤功平/@ktou/株式会社クリアコード
TensorFlowとApache Arrowの連携
- by 石崎一明/@kiszk/日本アイ・ビー・エム株式会社/Apache Sparkコミッター
TensorFlowとBigQuery Storage APIとApache Arrowの連携評価事例
- by 漆山和樹/@KUrushi_ml/SENSY株式会社/Researcher(ML Engineer or Data Scientist)
懇親会
- 写真は懇親会に入る前の講師紹介