日本語文字コードの変換がとっても楽チンにできるPerlモジュールが「Jcode.pm」。これが活用されているフリーCGIは結構あります。
Perl 5.8.0以降では、Encodeモジュールが標準搭載されて、文字コードの変換が標準でできるようになったので、Jcode.pmを使う必要はなかったりするんですけども、フリーCGIの場合、Perl 5.8.0未満の環境で実行されるかも知れない可能性を考えて、(もしくは最初に作った時期がPerl 5.8.0リリース以前だったかで)Jcode.pmが使われてるCGIはたくさんあります。
# もっと古いCGIだと、jcode.pl が使われてるかも知れません。jcode.pl はJcode.pmの前のもので、Perl 4でも動きます。
さて、Jcode.pmを使うのはとっても簡単。
まず、Jcode.pmを使えるようにするには、Perlソースに以下の1行を書きます。
これだけ。んで、例えば、変数$str1に変換したい元の文字列が格納されているとすると、次のように書くだけで、望みの文字コードに変換した結果が変数$str2に入ります。
上記の場合は、元々UTF-8だった文字列をSHIFT-JISに変更したい場合。
文字コードの指定には、"jis"、"sjis"、 "euc"、"ucs2"、"utf8"が使えます。
で、実は、次のようにも書けます。
この書き方は、jcode.pl と同じ書き方です。第2引数が欲しい(変換後の)文字コード。第3引数が元の文字コードです。なんとなく、感覚的に順序が逆のような感じもするので注意が必要です。(^^;) 上記は、UTF-8な文字列をSHIFT-JISに変換してるのであって、SHIFT-JISをUTF-8にしてるわけではありません。
Perl 5.8.0以降で実行することを前提にするなら、標準のEncodeモジュールを使うことでも変換できます。
としておいて、
と書けば、変数$strに格納されているUTF-8な文字列が、SHIFT-JISに変換されます。(変数$strの中身が書き換えられます。)
まあ、配布するCGIを書くんなら、Jcode.pmを使っとけばいいんではないかと。
標準のEncodeモジュールは日本語以外も扱えますけど。
参考:
◇Jcode.pm
◇日本語 Perl ガイド
=== 追記 ===
モジュール名は Jcode です。JCode とかじゃないので気を付けましょう。(^^;;;
大文字なのは J だけです。あとは小文字。
これを間違えると、「そんなモジュールはねえ!」と怒られますので…。(笑)
…誰も間違えないか。^^;;;
私はこれを間違えて、ずいぶん煮詰まっちゃったよ。
=== さらに追記 ===
(メモ) Perl 5.8.x における日本語コード変換のメモ
この日記へのコメントはお気軽に! コメント数:2件
疾風さん、こんにちは。
この第2引数と第3引数、感覚的に逆ですよね?やっぱり。(笑)
投稿者 にしし : 2006年05月07日 00:04
コメント数: 2件
$str2 = Jcode::convert( $str1 , "sjis", "utf8" );
このことで、ず~と悩んでいました。
引数が逆だったんですね。
タイムリーな情報感謝です。
投稿者 疾風 : 2006年05月06日 20:07