仕事で使いたいのもあってCodePlexのHtml Agility Packを使ってみた。
基本的にはとりあえず今必要な機能は十分備えていて特別使いづらいわけでもないので結構お勧めできるかも。
このページで書いているようなコードを書いてみて使ったわけですがxpath使ってノードたどったりとなかなか良いです。
xpathで候補を抽出してLINQでさらに抽出なんてやってみたりもしました。ちゃんとLINQがつかえるわけですね。よしよし。
さて、解析する分にはもう十分なのですがそもそもターゲットになっていたページがスクリプトで動的にlink作ったりする類でして。
例のようにWebClient使ってたんですがWebClientじゃ動的にはページが作れないと。(知らないだけ?)
そこでWebRequestとかも使ってみたんですが結局同じ、当たり前ですけど。
さてさて、結局出した答えはSHDocVwでページを読み込んでブラウザコントロールにページの文字列吐かせてHtml Agility Packで解析でした。
なんだ。結局SHDocVwでCOM使うんじゃん・・・
投稿日時 : 2009年12月24日 19:34