つぎに結合文字
4b309930がかと濁音
0d000a00はCRLF
4c30が普通の"が"です
それぞれリトルエンディアンなのでひっくり返っているので、注意。
String.Normalizeを掛けると、結合文字が1文字に変換されます。
ただし懇親会でも言っていたようにNormalizeしたものを保存するべきか、元のまま保存するべきかはよく検討してください。
またすべての結合文字が結合結果としてあるわけではないので、Normalizeで変換されない結合文字もあるはずですが、詳細な.NETひいてはWindowsの実装は闇の中です。
おそらくSilverlightのCLRでは結果が異なるでしょうし、monoにおいてもの異なることが考えられます。
このあたりを見るとさらに理解は深まるかとおもいます。
http://blog.antenna.co.jp/PDFTool/archives/2006/01/
NFCとかNFDとかは今回あえて説明はしていませんので、調べてください。
また、Normalizeをかけると、二度と元には戻せないということも知っておいてください。
合同にある文字は1組とは限りません。
JISにあるけどUnicodeにない文字のかまると言っていたか+半濁音は
JISCに行って
http://www.jisc.go.jp/index.html
JIS検索
JISX0213を検索
JISX0213_07.pdfに記載されています。JISCは秘密主義なのかなんなのか、直接リンクできないようなシステムづくりに熱心でいらっしゃるので、探してみてください。
あるんじゃないと言っていたあ+濁音はなかったです。
疑問符、感嘆符のバリエーションは結構あります。
