2020.03.05
Webスクレイピングとは?
Webスクレイピングは、RPAの自動化で多くの業務に必要とされる機能です。
Webスクレイピング(Web scraping)とは、Webサイトから、データを抽出してくれる技術手法のことです。Web harvesting、web estractionと表現されることもあります。人が、Webページの情報をコピー&ペーストする行為と同じですが、それをコンピュータの自動処理で行えるため、気の遠くなるような大量のデータをWeb上から取得することができます。
Webスクレイピングは、一般的にWebクローラーとWebスクレイパーの2つの部分で機能します。
Webクローラーは、Google社の「Googlebot」のように、インターネットを巡回して、リンクをたどってWebサイトの情報を収集し、自動的にコンテンツのインデックス作成と検索を行うプログラムのことを指します。
そして、Webスクレイパーは、Webページから必要なデータを正確かつ迅速に抽出するように設計された専用ツールです。
Webスクレイピングを行う為のツールは、オープンソースの無償のものから、有償で販売されているものまで、いろいろなものが入手可能です。
RPAで業務を自動化する場合、この
Webスクレイピングは様々な場面で活躍します。事務的な業務の中でも、
クラウドアプリケーションが多くなってくると、複数のWebサイトにログインして、情報を入力したり、表示された情報を転記したりする作業が多くなります。それを、いちいち業務担当者が、コピー&ペーストしたり、検索して情報集めしている場合、
Webスクレイピングを利用することで、担当の負荷も減り、正確性も増します。
多くのRPAツールは、Web関連業務の自動化を推進するためにも、このスクレイピング機能に長けています。有料のツールでなくても、Seleniumなどのオープンソースのソフトウェアを活用して、Pythonなどの汎用プログラミング言語で、自社でコーディングして
Webスクレイピングを実行することも可能です。
また、WebクローラーとWebスクレイパーの専用ツールを使用すれば、その多くはプログラミングしなくても、
Webスクレイピングが可能なので、うまく
RPAツールと組み合わせることで業務の自動化が可能になります。
クラウドで行う業務が多くなる傾向の中、業務の改変や、新規業務には、この
Webスクレイピングを上手く取り入れて業務の効率化を図っては如何でしょうか?
[タグ]
RPA 用語
[関連]