カテゴリー別アーカイブ: Python

置換🔞のベンチマーク🐍

re.comileを変数に入れるかどうかでは、正規表現が単純なためか、意外と変わらない模様です。

出力:

peeweeで既存のSQLite3のデータベースを扱う🐍

ほぼ下のURLに書いてある通りですが、生成されたモデルファイル内の「SqliteSequence」クラスと「UnknownField」クラスを削除する必要がありました。

https://peewee.readthedocs.org/en/latest/peewee/quickstart.html#working-with-existing-databases

データベースは、自分で設計したデータベースに青空文庫の全作品をダウンロードして格納したものを使いました。

モデルファイルの作成は以下のような感じ:

データベースから情報を取得するスクリプトは以下のような感じ:

アウトプット:

(青空文庫のすべての作品はNDCというもので分類されています。)

Python勉強メモ#5「homura と madoka で形態素の頻度を数えよ」

あらかじめ「pip」とかで「homura」と「madoka」を入れておきましょう。

まずはダウンローダーの「homura」で形態素解析済みの青空文庫のデータをダウンロード。

適当に解凍したら「madoka」(Pythonの辞書より省メモリかもしれないデータ構造を提供するライブラリ)で形態素をカウントです。
(Madokaの詳細: http://s-yata.github.io/madoka/index.ja.html

出力された頻度(推定値)は以下のようになりました。

実際の頻度は以下の通り。

Python勉強メモ#3「Unicodeブロック:Hiragana のコードポイントとその文字の順序付き辞書を作り、すべて出力せよ」

ワイの書いたコード↓

出力↓

Python勉強メモ#2「Unicodeブロック:Hiragana の文字をすべて出力せよ」

出力:

ちなみにPerlで書くと↓のようになります。

16進数を「0x」で表現できる点はPythonのほうが好きです。
Perlでも「0x」使えました。(汗)

追記:
Python版はリスト内包表記のほうがいいですかね。

これでもいけますね。