最近のCPAN活動

最近のCPAN活動ぱわふるPythonも少しやっていましたが、文字列処理はPerlのほうが強力で完全に乗り換える気にはなりません。おそらく、前処理はPerlでやって、統計解析やグラフ描画はPythonでやるのが一番楽だと思います。

Lingua::JA::NormalizeText
日本語正規化モジュール。2000万ツイート文を正規化しても問題が発生しなかったので Ver. 0.50 に上げました。コードに変化はありません。

Lingua::JA::KanjiTable
常用漢字と人名用漢字のユーザ定義文字プロパティを提供するモジュール。2015年1月7日に人名用漢字に「巫」が追加されたのでアップデートしました。

Lingua::JA::DocumentFrequency::AozoraBunko
青空文庫での文書頻度を返すモジュール。たまに欲しくなるので新規にアップロードしました。

他の言語をやればやるほどにCPANを素晴らしく思います。


コメントを残す

メールアドレスが公開されることはありません。