読者です 読者をやめる 読者になる 読者になる

或阿呆のブログ

Pythonを好んで使っているプログラマです。Ruby,Perl,PowerShell,VBAなどでもたまに書いています。おバカなことが大好きです。

スクレイピングは役に立つ

お礼の言葉をいただいちゃった

お礼の言葉は嬉しい。仕事の対価は、お金だけじゃないと思う。誰かの役に立っているということが対価。それが強烈なモチベーションになる。

元記事(アルク英辞郎 on the Webのページをスクレイピングしてみた。 #Python #WebScraping)

oneshotlife-python.hatenablog.com

スクレイピングは問題があるが役に立つ技術

当投稿をポストしたときも、とある読者の方から批判の言葉をいただいた。

> http://www.alc.co.jp/policy/other/
>
> ・「英辞郎 on the WEB」のメタサーチや、検索結果画面の改変を伴う利用は、許諾なく行うことを禁じます。

> 弊社以外の第三者により定義されたユーザースタイルシートの利用や、ブラウザのプラグインやアドオン・プログラムおよびそれを利用したスクリプト、スクレイピングなどの技術を利用し、「英辞郎 on the WEB」エンジンを無断で利用し、または画面構成部品を無断で改変するもの。

利用規約(http://www.alc.co.jp/policy/other/)に上記のことが記されているので利用に当たっては少なくとも許可を取る必要があるものと思われます.

ご批判はもっともなんだけど、ちょっと違うかなと思う。商用利用として、アルクのサイトを使うというのはもちろん問題だと思う。なので、アドオンやbookemarkletを作成して配布するには配慮が必要となろう。が、スクレイピングの技術を普及させる上で、その実装方法を提示することは私にとって大事なことだ。その題材として、アルクのサイトを使わせていただくことは、必ずしも問題があるとは思わない。一応、アルクも、Webサイトを公開している以上、こういった変わったユーザーも出てくるというくらいは、想定しているであろうし、その程度でブロックされたり裁判を起こしたりはしないだろうと思う。

スクレイピングを普及させるには

著作権の問題や、威力業務妨害(Webサイトに過度の負担をかける)など、留意するべき事項はあるが、その難しい問題を乗り越えてでも活用するだけの魅力はある。批判されることもあるだろうけど、折れずに続けていきたい。情熱を理解してもらうことが重要。お金儲けや嫌がらせのためにスクレイピングをやっているわけではない。スクレイピングがインターネット技術の発展に寄与すると思っているからやっている。そこだけはわかっていただきたい。