C#とC++/CLIとVBと.NETとWindowsで戯れる
サロゲートペアはU+12345 と5ケタになっている文字のことで、IME2007のIMEパッドでUnicode追加多言語面、追加漢字面、15面、16面となっているところです。
これらの文字はString.Lengthで2となります。
Charにした場合、たとえば先頭10文字をサムネイル表示するとして、処理した場合に10文字目は化けます。
もちろんフォントの関係で化けていませんが、理論的にはサロゲートペアの上位ビットだけは無しですから。やってはいけないsubstringということになります。
投稿日時 : 2007年5月19日 14:08
まじめな処理は.NET Frameworkのstringxに任せたいと考える根性なしPGなのでサロゲートペアや結合文字はとりあえずそのまま保持をしたいと思うんですがこういったサロゲートかどうかはコードから見るしかないんでしょうか? UCS-2文字と拡張面でsplitみたいな関数があればなぁ。
re: サロゲートペア用メソッド
http://blogs.wankuma.com/naka/archive/2007/05/19/77383.aspx#77384
ちなみに間違っていたというか、言い回しが・・・ >サロゲートペアはU+12345 と5ケタになっている文字のことで 5桁以上になっている の間違いです。ハイ
http://imrdsoacha.gov.co/silvitra-120mg-qrms
Powered by: Copyright © 中博俊