ablog

不器用で落着きのない技術者のメモ

2023-04-09から1日間の記事一覧

Amazon Redshift でゾーンマップがあってもソートキーが必要な理由

AWS

Amazon Redshift はゾーンマップで 1MB ブロックの最小値と最大値を保持しているので、クエリのフィルタ条件などに合致しないブロックを読み飛ばすことができる。ソートキーでソートされていないと同じ値のデータがあちこちのブロックに散らばるため、ソート…

Amazon Redshift で結合キーでKEY分散 vs EVEN 分散

AWS

計測 EVEN分散 =# select count(l_orderkey) from lineitem join orders on o_orderkey = l_orderkey and l_shipdate > '1996-01-01'; count ------------ 7518747994 (1 row) Time: 150000.148 ms (02:30.000) クエリID取得 =# select pg_last_query_id(); …