Webスクレイピングは手強かった

htmlSQLを使ったWebスクレイピングのサンプルが雨天中止の試合がある場合に期待通りに動作しないことが判明。

原因は、雨天中止の場合のスコア一覧の内容が想定と違ったこと。雨天中止の場合、先発投手は表示しないけどスコア詳細ページへのリンクは表示するようだ。

それでも動くようにPHPを修正。全ての試合詳細ページを1つずつ見ていき、該当チームのページがあるか確認するようにする。

合わせて、全チームの試合状態(試合前、試合終了、雨天中止など)も取得する。そうしないとデイゲームの日なんかに中止なのか試合前なのか分からない。

これでうまく動くかな?

コメントを残す

メールアドレスが公開されることはありません。

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください