昨夜撮った写真がとっても良かったので、ここに掲載。
かわいー!
Whisker 0.9.1
Whisker を 0.9.1 にアップデートしました。
→ downloadのページ
(ヘルプをまだ書いてないので、使い方は前の記事をお読みください)
- 改行コード判別を追加
- EUC-JPとMacJapaneseからUnicodeへの変換に、piconv ではなくMacOSのコンバーターを使用するように変更
- BE/LEの表記分け
- その他微調整
「PerlではなくMacOSのコンバーターを使用」は、NAOIさんの記事で触れられている euc-jp.ucm の問題で、Perl で ECU-JP から Unicode へ変換すると「﨑髙」が「紾𣴎」に文字化けしたりすることが判明したんですね。そこで文字化けしない変換方法にしたということです(ついでにMacJapaneseも)。
「BE/LEの表記分け」は説明が大変なので、いずれヘルプで説明する…かもしれません。
新作 Whisker を公開
Whisker 0.9.0 を公開! → downloadのページ
新作ですよん。
テキストファイルのエンコーディングを推測するソフトです。
深沢さんのツイートで「BOMの検出」とか「テキストエンコーディングの推測」をざっとやるソフトがありそうでないことが分かりまして、作ってみました。
作ったばかりでベータ版扱いです。Helpもまだ書いてないので、ここで使い方を説明します。
使い方
- テキストファイルを本体アイコンにドラッグ&ドロップします(複数一括可)。
- ウインドウが表示され、そこに結果が表示されます(ウインドウへのドラッグ&ドロップも可)
- 結果表示のリストをダブルクリックするとコンテクストメニューが表示されます。該当するエンコーディングを選択すると Unicode へ変換してテキストエディットの新規ウインドウに文字をセットします。注:テキストエディットで開くわけではありません
「Guess(推測)」は Perlくんの Encode::Guess にやってもらっています。結構よく間違えます。テキストエンコーディング推測の正解率なんて、そんなもんです。 当たっていたらラッキーくらいが丁度いいんです。(1
コンテクストメニューでの Unicode への変換は piconv(Perlくんの分身)を使っています。メニューに「Shift JIS」がありませんけど「CP932」「MacJapanese」のどちらかを選んでください。Windows環境で作られたファイルなら CP932 でおおむね正解です。
- というほど実はそんなにひどくはないんですけど。 [↩]
あけましておめでとうございます
昨年はツイッターにのめりこみすぎてしまいました。ハマりやすい性格なので困ったものです。
今年は軸足をこっちのブログに戻したいと思います。