htmlSQLを使ったWebスクレイピングのサンプルを公開

htmlSQLでプロ野球速報をWebスクレイピングして携帯のフルブラウザで見られるようにする実験 [ゼロと無限の間に:Sandbox]

今回は自分で作ったライブラリではなくて、有名ライブラリの使用例のソースコードを公開。

htmlSQLはなかなか便利。div要素がうまく取得できないのは難点だけど、そこはバッドノウハウで切り抜ける。

次は何をスクレイピングしようかな 🙂

Todo.php バージョンアップ (0.2.2) フッターにリンク追加など

—-

PHP 1ファイルのみでDB不要のTODO管理ツール – Todo.php [ゼロと無限の間に:Sandbox]

—-

変更点

  • フッターに、当サイトへのリンク(powered by Todo.php)を追加
  • 左側のカテゴリ追加のテキストボックスを少しだけ広くした

—-

もうそろそろフィックスしたいけど細かい修正もしたくなるものだ。

PHP x APIs にZend_Framework1.5やPEARの新しいAPIラッパーを追加

PHP x APIs – Web Service API用のPHPライブラリまとめ [ゼロと無限の間に:Sandbox]

いつの間にかZend Frameworkが1.5になっていた。新しいWebサービスAPI用パッケージが追加されていたので、こっちのリストにも追加した。(全部日本ではなじみが無いサービスだけど。)

また、PEARのWebサービスAPI用パッケージも色々追加した。これまで日本であまり知られていないサービスはリストに入れない方が見やすくなると思って入れてなかったが、この際だからなんとなく入れてしまった。

Todo.php バージョンアップ (0.2.1) 微調整

PHP 1ファイルのみでDB不要のTODO管理ツール – Todo.php [ゼロと無限の間に:Sandbox]

変更点

  •  左側のカテゴリ一覧の幅を広げた
  • JavaScriptの文字コード指定を無くした

前者は、使っていて狭く感じるようになったから。以前はカテゴリ名は英数字記号のみだったので狭くても良かったが、日本語を入れられるようにしたら狭く感じるようになった。

後者は自分にとってはあってもよいけど、人によっては邪魔になるだろうから。 無くて困る人だけ付けるというやり方が正しいのでしょう。

Todo.php バージョンアップ(0.2.0) カテゴリ名日本語対応、PHP5.2未満でも使えるかな?

PHP 1ファイルのみでDB不要のTODO管理ツール – Todo.php [ゼロと無限の間に:Sandbox]

主な変更点

  • カテゴリ名として日本語等のマルチバイト文字が使えるようになった
    • カテゴリ名はそのままデータファイルのファイル名になるので、使用するサーバOSに合わせてファイル名の文字コードを指定する。 (Todoクラスの定数FILE_NAME_ENCODINGで。)
    • mail2todoを使う場合はカテゴリ名は英数字にしておいた方がよい。
    • 余談だが、これまでもカテゴリ名の正規表現チェックを変更すれば(環境によっては)マルチバイト使えた。
  • カテゴリ名を変更できるようになった
  • DateTimeオブジェクトの使用をやめた
    • これでPHPのバージョンが5.2未満でも使えるようになった、かな?(未確認 🙁 )
    • まだまだPHP5.2未満だった人も多いのだね
  • IE6で状況によっては新カテゴリを追加できないバグを解消
    • styleのfloatが覆いかぶさるなんて...
  • IE6じゃなくても状況によっては新カテゴリを追加できないバグを解消
  • カテゴリ名チェックでエラーの場合にエラーメッセージを表示
  • データファイルの拡張子をcsvからtxtに変更
    • バージョン0.1.xからのバージョンアップする場合、全てのデータファイルの拡張子を変えるか、定数DATA_EXTを旧バージョンに合わせて”csv”にしないとデータを引き継げない。
    • タブ区切りってCSVと言わないんだって知ったので。
  • カテゴリ名にマルチバイトを入力された場合、起こる(かもしれない)誤判定を解消
  • $_REQUEST[‘update’]に伴うCSRFの脆弱性を解消