Out of Memory

ごめん、忘れてた。

目次

Blog 利用状況

ニュース

2008年7月1日
Microsoft MVP for Developer Tools - Visual C++ を再受賞しました。
2008年2月某日
MVPアワードがVisual C++に変更になりました。
2007年10月23日
blogタイトルを変更しました。
2007年7月1日
Microsoft MVP for Windows - SDKを受賞しました!
2007年6月20日
スキル「ニュース欄ハック」を覚えた!
2006年12月14日
記念すべき初エントリ
2006年12月3日
わんくま同盟に加盟しました。

カレンダー

中の人

aetos

顔写真

埼玉を馬鹿にする奴は俺が許さん。

基本的に知ったかぶり。興味を持った技術に手を出して、ちょっと齧りはするものの、それを応用して何か形にするまでは及ばずに飽きて放り出す人。

Microsoft MVP for Windows SDK July 2007 - February 2008, Microsoft MVP for Visual C++ February 2008 - June 2009
Microsoft MVP for Windows SDK
July 2007 - February 2008
Microsoft MVP for Visual C++
February 2008 - June 2009

アクセサリ

あわせて読みたい

e-Words

アフィリエイト

記事カテゴリ

書庫

日記カテゴリ

XMLの比較と差分

2つのXML文書を比較することを考える。
この場合、テキストの Diff のように単純には行かない。

当然ながら、2つの要素にまたがるような部分を差分として検出してしまうのは失格だ。
差分はそれだけでも、妥当なXMLフラグメントでなければならない。

加えて、属性の順番はどうでもいいとか、[追記]名前空間プリフィクスは違っても名前空間URIが同じなら同じ要素とみなすとか、[/追記]意味のある空白とない空白を見分けるとか、要素の順番もどうでもいいとか、いやよくないとか、そういうことも気にしなければいけない。

と、どこかからの受け売り。

投稿日時 : 2008年7月23日 15:59

Feedback

# re: XMLの比較と差分 2008/07/23 16:03 さかもと画伯


>>と、どこかからの受け売り


恐らく私ですねぇー。

何かよこせください。

# re: XMLの比較と差分 2008/07/23 16:08 シャノン

おk、じゃあ、自腹切って俺に Wii を買って来るという超光栄な任務を遂行する権利を与えましょう。

# re: XMLの比較と差分 2008/07/23 16:21 ネタ好き未記入

その通りですね。こういう場合は、ちゃんとルールを決めておいてからXSLTで出力して、その出力結果にDiffしたらいいのかな?

# re: XMLの比較と差分 2008/07/23 16:52 さかもと画伯


あっ!

私Wii持ってるっ!

私Wii持ってるっ!

私Wii持ってるっ!


大事なこt(ry

# re: XMLの比較と差分 2008/07/23 17:01 THREE-ONE

Canonical XML というそれ専用の規格があります。
XML の正規化というやつです。

# re: XMLの比較と差分 2008/07/23 17:03 THREE-ONE

あ、でも要素の順番に意味があるかないかはユーザーにしかわからないですので、それは自分でなんとかする必要があります。

# re: XMLの比較と差分 2008/07/23 17:05 シャノン

> ちゃんとルールを決めておいてからXSLTで出力して、その出力結果にDiffしたらいいのかな?

欲を言えば元のテキストで比較したいですね。

> Canonical XML というそれ専用の規格があります。

あれはハッシュを算出するための正規化であって、Diff を取りやすくするためのものではないですよね。

> 要素の順番に意味があるかないかはユーザーにしかわからないですので、

スキーマがあればわかります。

# re: XMLの比較と差分 2008/07/23 17:06 シャノン

> 私Wii持ってるっ!

はい。3回も言っていただいたおかげで、それを俺に譲りたいという熱意は大変よく伝わりました。
つきましては、このページの右上の「連絡をする」よりメールアドレスを教えていただければ、送り先を連絡しますので、送料元払いでお願いいたします。
なお、代金引換は受け付けません。

タイトル  
名前  
Url
コメント