キャッシュの更新はリクエストできなくなりました。GoogleからWayback Machineへ。 / いがわ

.

Memo

キャッシュがGoogleからWayback Machineへ。削除や拒否の方法。

キャッシュの更新リクエストができない?

キャッシュの更新はリクエスト不可に。

キャッシュの更新はできない。

Google Search Consoleのサイドバーから「削除」の画面に進むと、「キャッシュの更新はリクエストできなくなりました。スニペットの更新は引き続きリクエストできます。」と表示がされていることがある。

これは、長らくGoogleの検索結果にあった「キャッシュ」の機能が、2024年1月末ころに廃止されたことに伴うことと思われる。

スニペットの更新はできる。

Google検索上部に表示される、「強調スニペット」の更新リクエストは今後も可能。

スニペットが表示されるかどうかは、Googleによって判断。)

URLの削除依頼もできる。

インデックスから削除したいページは、これまで通りURLを送ることによって、削除リクエストが可能。


そもそもキャッシュとは?

キャッシュの種類。

ブラウザ、サーバー、Google、Wayback Machineなど。

Webデザインで使われる「キャッシュ」とは、主に下記のものがある。

ブラウザのキャッシュ。

ページの表示速度を向上させるために、ブラウザが画像やHTML、CSSなどのファイルを一時的に保存する。

削除したい場合は、ブラウザの履歴などから削除可能。

Chromeでの削除の例。

MacのChromeの場合は、「履歴」>「全履歴を表示」>「閲覧履歴データを削除」と進み、「キャッシュされた画像とファイル」にチェックを入れて、「データを削除」をクリック。

スーパーリロードの例。

CSSのキャッシュは、スーパーリロードのショートカットで無視することもできる。

ChromeやFirefox、Edgeの場合は、

  • Win:「Ctrl + F5」 or 「Shift + F5」 or「Ctrl + Shrft + R」
  • Mac:「Command + Shrft + R」

Safariの場合は、

  • Mac:「Cmd」 +「Option」 +「R」

などで、サーバーから直接読み込める。

バージョンなどで異なる可能性あり。)

サーバーのキャッシュ。

サーバーの負荷を軽減するために、頻繁にアクセスされるデータを一時的に保存する。

削除したい場合は、サーバーのコントロールパネルやFTP接続から可能。

Googleのキャッシュ。

GooglebotがWebページをクロールする際にその情報を一時的に保存し、検索結果で利用されており、過去のページ表示が参照可能だった。

2024年1月頃に廃止。)

Internet ArchiveのWayback Machineのキャッシュ。

非営利団体の「Internet Archive」が、Wayback Machineというデジタルアーカイブにより、Web上の多くのサイトが保存されている。

キャッシュとは?ブラウザ、サーバー、Google、Wayback Machineを見る猫。


キャッシュの更新はリクエストできなくなりました〜。というメッセージ。

Googleキャッシュの更新依頼が不可となった。

Googleのキャッシュは過去の産物へ。

Googleのキャッシュは上記の通り、現在は廃止されている。

では、Search Consoleの「キャッシュの更新はリクエストできなくなりました。」というメッセージは何を意味するのか?

これは、Googleがキャッシュを保存することが廃止されため、必然的にGoogleが内部的に保持していたページ情報の更新リクエストを受け付けなくなったと思われる。


Googleのキャッシュから、Wayback Machineのキャッシュへ。

Internet ArchiveのWayback Machine。

Wayback Machineのキャッシュの更新リクエストは不可。

2024年9月に、GoogleはInternet Archive(インターネットアーカイブ)と連携し、Wayback Machine(ウェイバックマシン)のキャッシュへのリンクを設置。

これで以前のように、Webサイトの過去の表示を参照できる。

そのため、サイトの更新内容をGoogleに素早く反映させるためには、Search ConsoleのURL検査ツールでインデックス登録をリクエストするか、サイトマップを送信することが効果的。


Wayback Machineに、サイトをアーカイブされたくない場合。

Internet ArchiveのWayback Machineは拒否できる。

Internet ArchiveのWayback Machineを拒否する設定方法。
robots.txt

もっともシンプルな方法。ただし、robots.txtには強制力がなく、無視されることもある。

User-agent: ia_archiver
Disallow: /
HTML

この方法は、2024年10月からGoogleが「noarchive」を無視することとなっている。

Wayback Machineには有効かもしれない。

<meta name=“robots” content=“noarchive”>
.htaccess

現時点では、下記の.htaccessでの記述が効果的。

バックアップをとってから行った方が無難。)

BrowserMatchNoCase ia_archiver bad_bot
Order Deny,Allow
Deny from env=bad_bot

上記の方法で拒否する場合でも、すでにアーカイブされている可能性もあるため、Internet Archiveへ問い合わせが必要になるかも。

キャッシュの更新はリクエストできなくなりました。GoogleからWayback Machineを眺めるにゃんこ。以上、参考になれば幸いです。


Webデザインは実務数年、職業訓練校講師数年、フリーランス数年、計15年以上のキャリアがありますが、一気にがぁっと書いているので「です・ます調」ではありません。(元々はメモ書きでした。) 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ訂正いたします。 写真は主にUnsplashPixabayのフリー素材を利用させていただいております。その他の写真や動画もフリー素材やパブリックドメイン、もしくは自前のものを使用しております。

井川 宜久 / Norihisa Igawa
デザイナー、ディレクター、講師、コーチ / 井川宜久

CSS 関連メモ。


免責事項について

  • 記事ページ(Memosのページ)は当初は文字通りメモ書きでした。その後、修正や更新をしております。
  • 事実や経験、調査や検証を基にしていますが、万一なにかしら不備・不足などがありましたらすみません。お知らせいただければ早急に対応いたします。
  • 一個人のポートフォリオサイトですので、万一損害・トラブル等が発生した場合でも、一切の責任を負いかねます。