C#7の星空周遊

愛知県の山とベランダで星空撮影

ブログ記事の管理と過去記事検索の容易化

雨で出かける事も無いので、自分の書いたブログ記事を簡単に検索できるようにしようと考えてみた。自分の場合ブログ投稿記事数はヤフー時代含めて430件近くあり、ブログ記事であの天体は以前いつごろ載せたかなどは記憶便りなので、ブログのアーカイブから探すとやたら時間がかかる。ハードティスクに保存したデータのキーワード検索の方が幾らか早いが、撮影条件となると元データを探し当てるかブログ記事で探すとなるので面倒だ。Webデータは、Webスクレイピング(サーバー内のデータを探しまくって集める処理)と言う方法でデータ抽出しExcelに保存とかテキスト保存などがやれる。このスクレイピングでの天体写真ブログデータ抽出にはどのWebツールやアプリが良いか調べてみた。ハードティスク内のデータ検索を効率よくやる方法はその後考えてみようと思う。
・Webスクレイピングツールでは、Google Chrome拡張機能として追加できるScrapeやWeb Scraperは扱い易いらしい。
・アプリソフトではOctoparseが優秀らしいが、基本は有料のビジネスソフトなので無料だと制限はあるがやってみないとどの程度か?
・制限なしはPythonライブラリのBeautiful Soupがあるが、ある程度プログラムの補正が必要らしく動かすには相当時間が要りそうだ。
手始めにGoogleのScraperとWeb Scraperから試してみることにした。