ablog

不器用で落着きのない技術者のメモ

2013-02-11から1日間の記事一覧

SJISのWebページをスクレイピングしてCSVに保存すると文字化けする

WWW::Mechanize や Web::Scraper を使って Shift-JIS のWebページをスクレイピングして CSV に保存しようとすると、「Wide character in print at ...」とエラーメッセージが出力されて文字化けするので、【Perl 文字化け解決】Wide character in print atと…

WWW::Scraper で JavaScript を使ったWebサイトへのアクセスを自動化する

Perl で WWW::Mechanize や Web::Scraper を使ってWebサイトをスクレイピングしたことはあるが、画面遷移に JavaScript を使っている場合、どうすればよいか調べてみた。 例えば以下のように JavaScript を使ってリンクしている場合。 <a href="javaScript:next(2)">次へ</a> WWW::Scripter と…