Ognacの雑感

木漏れ日々

目次

Blog 利用状況

書庫

ギャラリ

名前付きブロックの文字一覧

.net FrameWorkのRegex には ブラケット[:alpha:]は使えません。代わりに、名前付きブロック p{IsCombiningHalfMarks} などで代用します。
0x0000から0xFFFF までが名前でグループ化されています。

Regex.isMatch("p{isKatakana]")  などでマッチする文字を表示するようにしてみました。
http://www.ognogn.com/Regex/Regex_char_NameBlock.aspx

isHiragana や isKatakana を表示すると(0x3040~) 想像できるキャラクタの前と後ろに"・"文字があったりします。
コード体系と実感覚の文字とは少しズレがあるようです。
表示文字で制限を加えるときは、p{isKatakana} でチェックするより[ァ-ヾ]のように明示的にチェックしたほうが良いようです。
(尚、このページは、サロゲート文字は省いてます。0xD800~0xDFFF)

投稿日時 : 2008年9月2日 1:36

Feedback

No comments posted yet.
タイトル
名前
Url
コメント