吾未知足 唯修身爾

一日一哩を目標としています

MENU

540日目 晴れ

静養がてら、先週ちょっと格闘したwebスクレイピングと今日も格闘する。先週はseleniumをRで動かそうとして上手くいかなかったので、今日はpythonで実行してみることにした。なお、pythonをインストールするところから。

私はこれまでpythonはほとんど使わずにきたが(なので文法も全く慣れないが)、昨日、中学生の子供が、(これまではスクラッチで遊んでいたようだが、)最初の本格的な(?)PC言語としてpythonをインストールして使い始めたようなので、私のPCにも入れておこうと思ったことも重い腰を上げた要因。

もっとも、最近のバージョンはpythonと同時にpipもインストールされるようで、環境構築はすごく簡単になっていた。

それで、pythonインストール後は早速seleniumを試す。今回はきとんとchromeを立ち上げることができた。そして、結構長い時間格闘したが、あるウェブサイトのドロップダウン形式の検索について、こちらが指定した条件で検索を行い、その検索結果をprint表示するところまでは自動で行えるようになった。

ただ、今は1回の検索を自動で行うコードのため、こちらが指定する検索条件をfor文か何かで色々変えてみて、都度結果を取得するようにできれば完成になる。(結果もprint表示ではなく、何らかのファイルに格納する必要がある)

しかし、検索条件の選択、検索実行、結果表示、結果取得といったプロセスの間に一定の間隔(数秒~10秒くらい)をあける必要があるようで、間隔が短いと思わぬエラーが出る。そのため、自動で何百回という検索を実行できたとしても、実行時間は結構かかりそうである。

まあ趣味なので適当にやろうと思うが、今日はよい気分転換になった。pythonと格闘していたら遅くなったので、ワークアウトは夜に屋外を2kmほどランニングしたのみ。平日とあまり変わらない。