東方算程譚

Oriental Code Talk ── επιστημηが与太をこく、弾幕とは無縁のシロモノ。

目次

Blog 利用状況

ニュース

著作とお薦めの品々は

著作とお薦めの品々は
東方熱帯林へ。

あわせて読みたい

わんくま

  1. 東京勉強会#2
    C++/CLI カクテル・レシピ
  2. 東京勉強会#3
    template vs. generics
  3. 大阪勉強会#6
    C++むかしばなし
  4. 東京勉強会#7
    C++むかしばなし
  5. 東京勉強会#8
    STL/CLRによるGeneric Programming
  6. TechEd 2007 @YOKOHAMA
    C++・C++/CLI・C# 適材適所
  7. 東京勉強会#14
    Making of BOF
  8. 東京勉強会#15
    状態遷移
  9. 名古屋勉強会#2
    WinUnit - お気楽お手軽UnitTest

CodeZine

  1. Cで実現する「ぷちオブジェクト指向」
  2. CUnitによるテスト駆動開発
  3. SQLiteで組み込みDB体験(2007年版)
  4. C++/CLIによるCライブラリの.NET化
  5. C# 1.1からC# 3.0まで~言語仕様の進化
  6. BoostでC++0xのライブラリ「TR1」を先取りしよう (1)
  7. BoostでC++0xのライブラリ「TR1」を先取りしよう (2)
  8. BoostでC++0xのライブラリ「TR1」を先取りしよう (3)
  9. BoostでC++0xのライブラリ「TR1」を先取りしよう (4)
  10. BoostでC++0xのライブラリ「TR1」を先取りしよう (5)
  11. C/C++に対応した、もうひとつのUnitTestFramework ─ WinUnit
  12. SQLiteで"おこづかいちょう"
  13. STL/CLRツアーガイド
  14. マージ・ソート : 巨大データのソート法
  15. ヒープソートのアルゴリズム
  16. C++0xの新機能「ラムダ式」を次期Visual Studioでいち早く試す
  17. .NETでマンデルブロ集合を描く
  18. .NETでマンデルブロ集合を描く(後日談)
  19. C++/CLI : とある文字列の相互変換(コンバージョン)
  20. インテルTBBによる選択ソートの高速化
  21. インテルTBB3.0 によるパイプライン処理
  22. Visual C++ 2010に追加されたSTLアルゴリズム
  23. Visual C++ 2010に追加されたSTLコンテナ「forward_list」
  24. shared_ptrによるObserverパターンの実装
  25. .NETでマンデルブロ集合を描く(番外編) ── OpenCLで超並列コンピューティング
  26. StateパターンでCSVを読む
  27. 状態遷移表からStateパターンを自動生成する
  28. 「ソートも、サーチも、あるんだよ」~標準C++ライブラリにみるアルゴリズムの面白さ
  29. インテルTBBの同期メカニズム
  30. なぜsetを使っちゃいけないの?
  31. WPFアプリケーションで腕試し ~C++でもWPFアプリを
  32. C++11 : スレッド・ライブラリひとめぐり
  33. Google製のC++ Unit Test Framework「Google Test」を使ってみる
  34. メールでデータベースを更新するココロミ
  35. Visitorパターンで遊んでみたよ
  36. Collection 2題:「WPFにバインドできる辞書」と「重複を許す検索set」
  37. Visual C++ 2012:stateless-lambdaとSQLiteのぷち拡張
  38. 「Visual C++ Compiler November 2012 CTP」で追加された6つの新機能

@IT

  1. Vista時代のVisual C++の流儀(前編)Vista到来。既存C/C++資産の.NET化を始めよう!
  2. Vista時代のVisual C++の流儀(中編)MFCから.NETへの実践的移行計画
  3. Vista時代のVisual C++の流儀(後編) STL/CLRによるDocument/Viewアーキテクチャ
  4. C++開発者のための単体テスト入門 第1回 C++開発者の皆さん。テスト、ちゃんとしていますか?
  5. C++開発者のための単体テスト入門 第2回 C++アプリケーションの効率的なテスト手法(CppUnit編)
  6. C++開発者のための単体テスト入門 第3回 C++アプリケーションの効率的なテスト手法(NUnit編)

AWARDS


Microsoft MVP
for Visual Developer - Visual C++


Wankuma MVP
for いぢわる C++


Nyantora MVP
for こくまろ中国茶

Xbox

Links

記事カテゴリ

書庫

日記カテゴリ

くだらんことやってますのん

ケッタイなこと頼まれましてね。
えとね、たとえばこんな数枚のWeb-pageがあったとするやないですか。

 clip1 とかclip2 とか。

最初のページのURLあげるから、

「リンクを次々に辿りながらtable内の<td>~</td>を拾って一本の表を仕立ててくれ」

ってんですよ。

listview

こんな感じで。

つまりこの、HTMLを解析しぃのページ上のリンクをつつきぃの、そゆこと自動でやってくれと。


んで僕が目を付けたのが selenium てゆー Web-アプリのTestTool.
seleniumはブラウザ上での人の操作を記録し、play-backしてくれます。

面白いことに、このseleniumを外から(.NETやらJavaやらPHPやらRubyやらで)

リモコン操作できるんす。

こいつを使ってページを渡り歩き、seleniumが読みだしたHTMLをパーサで解析してます。
.NET Frameworkには出来合いのHTMLパーサがなさげ(よね?)なので、
「すまんけどXHTMLなページ限定」と念を押してXML-domパーサ使いました。
”GET”ボタン押すと↓こんなのが動きます。 40行で書けちゃったですよ。

  1. private void btnGET_Click(object sender, EventArgs e)  
  2. {  
  3.     string serverURL = "localhost";  
  4.     int     serverPort = 4444;  
  5.     string targetBrowser = "*firefox";  
  6.     string targetURL = "http://www1.c3-net.ne.jp/episteme/";  
  7.     selenium = new Selenium.DefaultSelenium(serverURL, serverPort, targetBrowser, targetURL);  
  8.     selenium.Start();  
  9.  
  10.     selenium.Open("/episteme/CodeZine/trial.html");  
  11.     while ( true ) {  
  12.         StringBuilder builder = new StringBuilder("<?xml version='1.0' ?>");  
  13.         // 得られたHTMLから<body>~</body>を抽出し、<html>~</html>ではさむ  
  14.         builder.Append("<html>");  
  15.         string html = selenium.GetHtmlSource();  
  16.         int startpos = html.IndexOf("<body");  
  17.         int endpos = html.IndexOf("/body>") + 6;  
  18.         builder.Append(html, startpos, endpos - startpos);  
  19.         builder.Append("</html>");  
  20.         // XHTMLをXMLパーサで解析  
  21.         XmlDocument document = new XmlDocument();  
  22.         document.Load(new StringReader(builder.ToString()));  
  23.         // <tr>~</tr> を抽出し、その中の<td>~</td>で行を構成する  
  24.         foreach ( XmlNode row in document.DocumentElement.GetElementsByTagName("tr") ) {  
  25.           ListViewItem item = null;  
  26.               bool first = true;  
  27.               foreach (XmlNode node in row.ChildNodes) {  
  28.                    if (node.Name != "td") break;  
  29.                    if (first) item = new ListViewItem(node.InnerText)   
  30.                    else item.SubItems.Add(node.InnerText);  
  31.                    first = false;  
  32.               }  
  33.               if ( item != null ) lstTable.Items.Add(item);  
  34.          }  
  35.          // HTML中に"これでおしまい"を見つけたら終了。  
  36.          if (selenium.IsTextPresent("これでおしまい")) break;  
  37.          // さもなくば "こちら"が示すリンクに飛ぶ  
  38.          selenium.Click("link=こちら");  
  39.          selenium.WaitForPageToLoad("30000");  
  40.      }  
  41.      selenium.Stop();  

投稿日時 : 2010年1月23日 6:46

コメントを追加

# re: くだらんことやってますのん 2010/01/23 9:05 うつせみ(虚蝉)

いやいや、面白いです。
というか、ちょうどこういうネタを探そうとしてたんで助かりました。

# re: くだらんことやってますのん 2010/01/23 10:03 みきぬ

> .NET Frameworkには出来合いのHTMLパーサがなさげ(よね?)なので、

標準ライブラリにはないですね。
記憶を頼りに発掘してみますた。

http://www.atmarkit.co.jp/bbs/phpBB/viewtopic.php?topic=45902&forum=7

http://www.atmarkit.co.jp/bbs/phpBB/viewtopic.php?topic=45032&forum=7

# re: くだらんことやってますのん 2010/01/23 11:39 επιστημη

> 助かりました。

それはなにより。んでもってマージされた表をまた別のフォームに突っ込んでくれて言われてます。マンドクセー

> 標準ライブラリにはないですね。

ですよねぇ。なので暇みつけてJavaにportしよーかと。
JavaならアリモノのEvent-drivenパーサが付いてくるんで楽っす♪

# GLtAsHDucIFkY 2014/07/19 3:07 http://crorkz.com/

MXsKJl Thanks-a-mundo for the blog.Thanks Again.

# JQJllOVRytoq 2014/08/28 2:59 http://crorkz.com/

YbfCmU Spot on with this write-up, I actually assume this web site needs far more consideration. I'll probably be again to learn much more, thanks for that info.

# KlUoNFBDOzOry 2014/09/03 21:29 https://www.youtube.com/watch?v=cTkBiqmO3cs

Thanks for the good writeup. It in truth was a amusement account it. Glance complicated to more brought agreeable from you! However, how can we communicate?

# ehuEBWXWsLnncGbY 2014/09/06 20:14 http://www.investleaks.com

There is perceptibly a bundle to know about this. I think you made some good points in features also.

# YHeigvGCTtYfwH 2014/09/09 9:50 http://vender-por-internet.net/

you could have a great weblog here! would you like to make some invite posts on my blog?

# tZGcFCkjEY 2014/09/09 17:52 http://Viralfusion.com

It's best to take part in a contest for the most effective blogs on the web. I will suggest this web site!

# nCAYcZmBUrAaruJh 2014/09/14 8:49 http://www.needpeep.com/

whoah this blog is great i really like reading your articles. Keep up the good paintings! You understand, a lot of people are searching around for this info, you can help them greatly.

# zGlXGGeukTOWE 2014/09/16 16:29 http://easycreditrepairs.wordpress.com/

Thanks for the post. Keep writing.

# OmBLcFNrwicqxStZIlF 2014/09/18 16:56 http://discovolante514.info/story/21224

b8TV7y Hey, thanks for the blog post. Fantastic.

タイトル
名前
URL
コメント