Out of Memory

本ブログは更新を停止しました。Aerieをよろしくお願いいたします。

目次

Blog 利用状況

ニュース

2009年3月31日
更新を停止しました。引き続きAerieを御愛顧くださいませ。
2009年2月3日
原則としてコメント受付を停止しました。コメントはAerieまでお願いいたします。
詳細は2月3日のエントリをご覧ください。
2008年7月1日
Microsoft MVP for Developer Tools - Visual C++ を再受賞しました。
2008年2月某日
MVPアワードがVisual C++に変更になりました。
2007年10月23日
blogタイトルを変更しました。
2007年7月1日
Microsoft MVP for Windows - SDKを受賞しました!
2007年6月20日
スキル「ニュース欄ハック」を覚えた!
2006年12月14日
記念すべき初エントリ
2006年12月3日
わんくま同盟に加盟しました。

カレンダー

中の人

αετο? / aetos / あえとす

シャノン? 誰それ。

顔写真

埼玉を馬鹿にする奴は俺が許さん。

基本的に知ったかぶり。興味を持った技術に手を出して、ちょっと齧りはするものの、それを応用して何か形にするまでは及ばずに飽きて放り出す人。

書庫

日記カテゴリ

そんなことを気にしたいんじゃないのに…

最近、XMLに興味を持っています。いろいろと面白い使い方が出来そうです。

さて、皆さん、XML を書く際の文字コードは何を使いますか?
UTF-8 が多いでしょうか。
UTF-8 は日本語に優しくないので、俺は最近は UTF-16 を使っています。
あるいは、Shift-JIS とか ISO-2022-JP なんてのが好きな方もいらっしゃるかも。
ただ、そういった日本語ローカルな文字コードは、海外のアプリでは受け付けられない可能性も低くないと思いますから、やはりここは Unicode ファミリーのいずれかにしておくのが良いのではないでしょうか。

が、Unicode なら何でもいいかというと、そういうわけでもありません。
実際、いろいろと相性があるものです。
UTF-8 しか受け付けないもの、BOM がついていると受け付けないもの、ついていないと受け付けないもの…

XML を使うことの大きな利点のひとつに、パーサが成熟しているという点があると思います。
XML よりも JSON や YAML の方がコンパクトだから優れているという主張も見受けられるのですが、JSON は JavaScript で使うことに特化したフォーマットなので、JavaScript との相性は XML 以上に良いのですが、それ以外には XML ほど汎用的ではありません(YAML はよく知らないのでコメントを控えます)。
汎用的なパーサが成熟しているために、XML を扱うアプリケーションの開発者は、XML を読み書きする泥臭いコードに頭を悩ませる必要がありません。
シリアライズされた形式のことを考えることなく、メモリ上での抽象表現(XML Information Set)だけを相手にすればよいのです。

だというのに。
日本語ローカルな文字コードならわからないでもないですが、世界に名だたる Unicode でさえ、BOM の有無なんていう些細なことで処理できないですって?
鼻で笑いたくなる馬鹿馬鹿しさです。
どうして、海外の Web サービスに読み込ませるのに、UTF-8 と UTF-16、それぞれで BOM ありとなしなんていう4通りを、この俺が試さなきゃならないんです?
そんなザマで、XML を活用しているなんて、よく言えたもんです。

投稿日時 : 2008年7月15日 11:25

Feedback

# re: そんなことを気にしたいんじゃないのに… 2008/07/15 12:17 なにかと黒い龍

UTF-8ですな。BOMで悩みたくないので。
UTF-8Nとか分けてBOMつけたがるやつは異常。BOMなしUTF-8。これが一番。

# re: そんなことを気にしたいんじゃないのに… 2008/07/15 23:38 なちゃ

BOMなしのUTF-8が読めないパーサってあるんでしょうか…?

# re: そんなことを気にしたいんじゃないのに… 2008/07/16 1:00 シャノン

Vista のメモ帳は UTF-8 で保存すると強制的に BOM をつけてくれるようです。
まぁ、テキストデータ一般では BOM が必要でも、XML に限れば必要ないのかもしれませんが。

> BOMなしのUTF-8が読めないパーサってあるんでしょうか…?

それがないとして、何の解決にもならないのです。
「BOMなしのUTF-8しか読めないパーサ」なんて、XMLパーサを名乗ることを認めません。

# re: そんなことを気にしたいんじゃないのに… 2008/07/16 1:01 HiJun

男なら黙ってEUC...ウソです。ごめんなさい。

私も、何気にBOMなしのUTF-8を多用しています。

# re: そんなことを気にしたいんじゃないのに… 2008/07/17 15:10 なにかと黒い龍

シャノンさんが認めないのはどうぞおすきに。
XMLってUTF-8がでふぉであとオプションでしょ?UTF-8ってBOMなしがでふぉでしょ?
たぶんそういうの作ってXMLパーサ名乗ると思う。シャノンさんは認めてくれないだろうけどw

# re: そんなことを気にしたいんじゃないのに… 2008/07/17 15:20 シャノン

> XMLってUTF-8がでふぉであとオプションでしょ?

UTF-8 と UTF-16 が必須であとはオプションです。

> UTF-8ってBOMなしがでふぉでしょ?

XML に限ればそう言えなくも無いですが、UTF-8 一般に対してはそんなことはないです。

# そんなXML processorは窓から投げ捨ててしまえ 2008/07/18 11:25 FloralCompany.log

ネタ元-> そんなことを気にしたいんじゃないのに... のコメント欄 &g...

タイトル  
名前  
Url
コメント