Webサイトの歴史がわかるWayback Machine


自分の会社が過去にどんな事業を行っていたのか、その時のホームページについて時間を巻き戻して見てみたいと思ったことはありませんか?

過去のWebサイトの内容は、htmlソースやcssなどサイト内に関連するファイルのその時点のバックアップがあれば、ローカルやテスト環境にリストアすることで閲覧は可能です。但し、何年も前のバックアップファイルとなれば、年代順にすべてバックアップファイルが保管されていることは極めてまれで、存在していたとしてもリストアにかかる手間が多過ぎて、実際に過去のホームページを見るという行為は非常に困難なことに思えます。
ところが、Wayback Machineのサイトに行けば、誰でも簡単に見たいURLを入力し、カレンダーからスナップショットのアーカイブデータが取られている日時を指定するだけで、その時のホームページの内容を表示することができます。
しかも、無料で使用できるサービスです。なぜなら、運営元のInternet Archiveは、アメリカのサンフランシスコに本部がある非営利団体で、運営資金は寄付でまかなわれているためにこんな凄いことが実現できています。

2001年にサービスを開始したとのことですが、なぜか選択できるアーカイブデータのカレンダーは、1996年からあります。これは、後の1999年にAmazon傘下になったAlexa Internetが、やはりサンプランシスコで1996年に設立され、Wayback Machineの元データを提供していたからのようです。ちなみに、AmazonといえばAI技術のスマートスピーカーAlexaが有名ですが、これは、2014年にすでに世に出ていたので、Alexa Internetが名前の由来ではないようです。とは言え、Alexaという名前が、アレクサンドリア図書館を連想させると主張されているので、インターネットの図書館をコンセプトに事業をしているAlexa Internetのデータ提供を受けていたInternet Archive社に因縁めいたものを感じます。ちなみにWayback Machineのアーカイブデータのコピーは新アレクサンドリア図書館にも保存されているとのことです。

Wayback MachineのWebアーカイブデータは、もともとAlexa Internetのデータ提供に頼っていた頃は公開まで半年から1年を要していたようですが、2010年後半からは独自のクローニングを開始して、その後の技術革新によって 現在では、数時間ほどで公開できるようになったとこのことです。
とはいえ、カレンダーから選択できるようになっても、必ずしもすべてのページが正確に閲覧できるわけではありません。特にAlexa Internetの元データにはhtmlしか含まれていないので画像でも表示が問題となりますが、それ以降であっても動画やJavascriptなど、上手く表示できない要因は多そうです。
このWayback Machineは、自動でWebページのアーカイブを行ってくれているのですが、どんなタイミングのサイクルで取得しているかは、サイトによっても違っていますし、まったく規則性がわかりません。そのため、自身で「Save Page」の機能を使って保存する機能があり、その場合は、直ぐに見れるようになるので、Web関係者にとっては、とてもありがたいサービスです。

Wayback Machineは、世界中のほとんどのホームページについて、お願いしなくてもアーカイブをとっておいてくれるので、同業他社のページの変遷や、取引先や関係会社の歴史を調べたりなど用途は多くの分野で考えられ、必要な人にとってはとても手軽で満足のいくサービスです。 過去のWebページについても、ブラウザの機能を使ってhtmlのソースコードを見ることができるので、昔のコーデイングを知ることもできます。
ただ、過去の情報であっても著作権については利用の仕方を十分注意すべきでしょう。


Wayback Machineで、過去のホームページに出会える


バックアップ , Web開発