ablog

不器用で落着きのない技術者のメモ

飛び番を探す Perl ワンライナー

$ cat hoge.tsv
HG00001 2009/08/10 ...
HG00002 2009/08/10 ...
...
HG00024 2009/08/10 ...
HG00026 2009/08/10 ...

みたいなデータがあったとして、1列目の数値部分が連続していない箇所を探す Perl ワンライナー

$ perl -lane 'BEGIN{%h=();$b=0;}$h{substr($F[0],2,)}=$.;END{map{$b++;print $b if($b!=$_);$b=$_;} sort keys %h;}' hoge.tsv
00025
...