2008年2月15日金曜日

 

【Perl】Shift-JISでの日本語マッチング【正規表現】

※追記:2010/01/11
CPANが使える環境であり、新たにプログラムをモダンPerlで開発するならば以下のモジュールをする。
コメント有難うございます。
Sjis - search.cpan.org

基本的なこと。


$match = 'ゆめ';
$str = 'あけがらすゆめのあわゆき';
if ($str = ~/\Q$match\E/)  {
   print '夢見つかった!';
}

Perl では Shift-JIS の正規表現マッチングで日本語を扱う時、思い通りに行かない事がある。文字コードの解釈の問題。 なので、日本語パターンを「\Q」「\E」で囲む。それでもダメなときもあるらしい。 EUC-JP だとまだまし。

ラベル: ,


コメント:
use Sjis;
 
Sjis
http://search.cpan.org/dist/Sjis/

のことですね?これはとっても便利です。
これからのスクリプトはこれで書きます。
 
コメントを投稿

登録 コメントの投稿 [Atom]



この投稿へのリンク:

リンクを作成



<< ホーム

This page is powered by Blogger. Isn't yours?

登録 投稿 [Atom]

Google