中の技術日誌ブログ

C#とC++/CLIと
VBと.NETとWindowsで戯れる
 

目次

Blog 利用状況

ニュース

自己紹介

東京でソフトウェアエンジニアをやっています。
お仕事大募集中です。
記事執筆や、講師依頼とかでも何でもどうぞ(*^_^*)
似顔絵 MSMVPロゴ
MSMVP Visual C# Since 2004/04-2013/03

記事カテゴリ

書庫

日記カテゴリ

00-整理

01-MSMVP

プログラマにおくるサロゲートペア

サロゲートペアはU+12345 と5ケタになっている文字のことで、IME2007のIMEパッドでUnicode追加多言語面、追加漢字面、15面、16面となっているところです。

これらの文字はString.Lengthで2となります。

Charにした場合、たとえば先頭10文字をサムネイル表示するとして、処理した場合に10文字目は化けます。


もちろんフォントの関係で化けていませんが、理論的にはサロゲートペアの上位ビットだけは無しですから。やってはいけないsubstringということになります。

投稿日時 : 2007年5月19日 14:08

コメントを追加

# re: プログラマにおくるサロゲートペア 2007/05/19 17:57 黒龍

まじめな処理は.NET Frameworkのstringxに任せたいと考える根性なしPGなのでサロゲートペアや結合文字はとりあえずそのまま保持をしたいと思うんですがこういったサロゲートかどうかはコードから見るしかないんでしょうか?
UCS-2文字と拡張面でsplitみたいな関数があればなぁ。

# re: サロゲートペア用メソッド 2007/05/19 22:09 中の技術日誌ブログ

re: サロゲートペア用メソッド

# re: プログラマにおくるサロゲートペア 2007/05/19 22:09 中博俊

http://blogs.wankuma.com/naka/archive/2007/05/19/77383.aspx#77384

# re: プログラマにおくるサロゲートペア 2007/05/19 22:10 中博俊

ちなみに間違っていたというか、言い回しが・・・
>サロゲートペアはU+12345 と5ケタになっている文字のことで
5桁以上になっている
の間違いです。ハイ

# iJPiRrgzTfqdXay 2022/04/19 10:19 johnansaz

http://imrdsoacha.gov.co/silvitra-120mg-qrms

タイトル
名前
URL
コメント