ナンクロ用の漢字検索プログラム へ青空文庫から新たにデータを追加した。
今回追加したのは、有島 武郎やアンデルセンらの作品で約60作。

この作業をやっていて初めて 有島 武郎 という人を知った。
なんか明治時代の小説家にありがちなパターンな人生というか、
男前で、英語の教師をしたりして、命懸けの恋愛をして、
最期は自殺する、という人生。彼はそんな人生を送った人の1人。

自殺するのは嫌だけれど、死ぬ程の恋愛ってどんなのだろうかと
ちょっと興味はある。
でも小説家は女性がらみじゃなくても自殺しそうだから、
普通の人なら死ぬ程の恋愛じゃなくても自殺するのかも。
あくまで勝手なイメージというか、偏見だけど。

俺は男前でない時点で、このレールには乗れない。
残念だ。
2007.09.15 Sat l Python ナンクロ l COM(0) TB(0) l top ▲
Python の正規表現で、以前に出てきた表現を使うには、
グループを使うとよい。

たとえば "(?P<a>.).(?P=a)." という正規表現は、
"一日一善" にはマッチするけれど、"一日千秋" にはマッチしない。

今日は勢いでナンクロの自動ソルバーを作り始めてみた。
ナンクロの自動ソルバーを作るためには
データベースから言葉を拾ってくる必要がある。
そのために正規表現を使って検索しようと思ったんだけれど、
うまくいかない。

たとえば番号のならびが [1] [2] [1] [3] になっているときに、
ここに入る四字熟語は
(条件1.) 3種類の漢字を使っていて
(条件2.) 1文字目と3文字目が同じになる
必要がある。ところが "(?P<a>.).(?P=a)." という正規表現を
使って検索すると(条件1)を満たさない熟語までマッチしてしまう。
つまり、欲しいのは「一日一善」みたいな四字熟語だけなのに、
「一歩一歩」みたいな四字熟語も拾ってきてしまう。
正規表現を "(?P<a>.)(?P<b>.)(?P=a)(?P<c>.)"にしてみても
もちろんダメで、困ってしまった。

しかたがないので、この部分は正規表現をあきらめて
自分で作ったのだけれど、なんかいい方法はないのだろうか。
2007.09.12 Wed l Python ナンクロ l COM(0) TB(0) l top ▲
芥川龍之介の作品153作を、ナンクロ用漢字検索に追加してみた。 これで他の著者もあわせて約400作が登録されたことになった。 そのかいあってか、ナンクロ10月号の漢字の問題は、なんとか全部解答できた。 さぁ、明日は月曜日だけど、飲もうか。
2007.09.02 Sun l Python ナンクロ l COM(0) TB(0) l top ▲
また今夜も飲みにいくので、プログラムをする暇もない。
ましてパズルをやる暇もない。

御存知ない方も多いと思いますが、世の中には「全漢字ナンクロ」というものもありまして、
これが私が最近やってるパズルなんですけどね。
たとえばこういうのです。

私は漢字を書くのが苦手で、このブログに四字熟語なんて、たぶん1回も出てきてないし、
四字熟語どころか、そもそもパソコンが変換してくれなかったら、
このブログに漢字は1文字も出てこないでしょう。
ってのは言い過ぎですけど、それくらい漢字が苦手なので、
それを克服するためにやってみてます。

でもまぁ、当然すぐに挫折しちゃったんですけど、
それでもなんとか最後までやるために、こういうのを作りました。

http://puzzle.rulez.jp/kanji/view.html
裏では例の Tempita を使ってるので、酔っ払ってても簡単に作れました。
今もだいぶ酔っ払ってますけど。
Django は使われていません。

じゃぁ。

ちょっと元気なので追記
データベースには、芥川龍之介の作品約200作を青空文庫から持ってきて、
そこから漢字の並びを抽出したものを使っています。
だから「或」を含む3字の熟語を検索すると「或阿呆」が一番に出てきたりします。
とはいえ、このデータベースだけでは全漢字ナンクロを解くには不十分なので、
これからもちょっとずつ拡充していく予定です。

それから、携帯でも簡単にチェックできるのは便利でいいなぁ。
電車の中でも全漢字ナンクロができる。
2007.08.31 Fri l Python ナンクロ l COM(0) TB(0) l top ▲