C#とC++/CLIとVBと.NETとWindowsで戯れる
Unicodeにはご存じの通り結合文字というのがあります。Combining Character
この結合文字は基底文字にたいして修飾というイメージで適用されます。
さてそんな結合文字ですが、どうやら完全な結合文字の一覧はないのではないかと思われます。
結合文字がありえる近くのリストってのはあるから、そこから抜きだすか。
投稿日時 : 2008年1月30日 13:11
全貌を把握している人はいないのではないかと思えますね
完全かどうかは知らないけど、 ↓これ?(馬鹿でかいので注意) http://www.unicode.org/Public/UNIDATA/NormalizationTest.txt
Unicodeの結合文字はNormalizationとイコールではない
> 完全な結合文字の一覧はない ISO/IEC 10646には附属書Bとして結合文字のNormativeな一覧が載せられていますし、Unicode 5.0ではD52にGeneral CategoryがMc, Mn, Meの文字すべてと明記されていますけど? 自分が知らないのとないのを一緒にしないでください。
こんなところに返答しても見ないと思うけど、ありがとう。 http://www.unicode.org/charts/symbols.html にちゃんと記載されていないことを言ってたんだけどね。
re: 【文字コード】日本語って難しい
Powered by: Copyright © 中博俊