正規表現の文字クラスの略記法 \d と \s と \w がいつのまにかアレレなことになっていたのでメモ。(1
- Perl 5.8 以降で正規表現を使うには use utf8 が必須。
- use utf8 では \d と \s と \w の文字クラスの内容が Unicode のカテゴリーに基づいている。
- InDesign(Boost)も同様。
PCRE や Ruby は変わりなし。(2- 参考資料:perldoc の perlrecharclass
- 参考資料:Programming Perl の 5.4. Character Classes
ちょっと詳しく見ていきます。 *以降、Perl = use utf8 の Perl
続きを読む →