Sitemaps

サイトマップ(Sitemaps)について



サイトマップは、ウェブマスターがサーチエンジンに自サイトの URL を効率的に伝えるための仕組みです。このツールは、サイト内に存在するすべての URL をリスト化し、XML ファイルという形式で提供します。サイトマップを活用することで、ウェブマスターは各 URL に対して、最終更新日や更新頻度、他の URL との相対的な重要度といった情報を追加することができます。これにより、サーチエンジンはクロールを行う際にこの情報を基に、サイトの構造を理解しやすくなります。

特に、サイトマップは以下のような点で有用です:

1. 隠れたコンテンツへのアクセス:ユーザーがブラウザのインターフェースを使って直接たどり着けないようなページも、サイトマップを通じてサーチエンジンに通知することができます。

2. リッチコンテンツの処理Ajax、Silverlight、Flash などのリッチなコンテンツを多く使用している場合、サーチエンジンが通常のクロールで理解できない内容をサイトマップで補足できます。

サイトマップの利用は、Google や Bing、Yahoo!Ask.com といった主要なサーチエンジン群によってサポートされており、サイトマップを登録することで、これらのエンジンに最新のページ情報を効率的に伝えられます。

歴史



サイトマップの発端は 2005 年 6 月に遡ります。当時、Google がウェブ開発者がサイト内のリンクリストを提供するためのツールとして、Sitemaps 0.84 という仕様を発表しました。2006 年には GoogleMSN、Yahoo の 3 社がサイトマッププロトコルの共通対応を発表し、スキーマバージョンは Sitemaps 0.90 に変更されました。以降も、Ask.comIBM が対応を宣言し、さらには各州政府がサイトマップを利用する計画を発表するなど、サイトマップは広く認知されるようになりました。このプロトコルは「Crawler-friendly Web Servers」という論文のアイデアに基づいています。

ファイル形式



サイトマップを生成する際、主に XML フォーマットで提供する必要があります。ファイルの文字コードは UTF-8 に統一され、要求される URL のリストを含む形式については、テキストファイルでも作成可能です。さらに、これらのファイルは gzip 形式で圧縮されることがあり、サイズを小さくして帯域幅を節約することができます。

サイトマップ・インデックス



ウェブサイトが巨大で多くの URL を含む場合、サイトマップ・インデックスを使用することで複数のサイトマップを管理できます。この方法では、各サイトマップファイルのサイズが最大 10MB または 50,000 URL までという制限があり、サイトマップ・インデックスはこれらを効率的にグループ化する手法です。特に、サブドメインを持つサイト群でも便利です。

その他の形式と登録方法



サイトマッププロトコルでは、単なる URL リストをテキストファイルにしたものもサイトマップとして利用できます。また、フィード配信を用いて新たに追加された URL をサーチエンジンに通知することも可能ですが、最近作成された URL のみを扱うため、その他の URL については通常の方法に従う必要があります。直接サーチエンジンにサイトマップを登録する際には、Ping を使って更新情報を通知し、報告を受け取る方法があります。この方式では、サーチエンジンによって異なる手順が存在しますため、注意が必要です。

制限事項



サイトマップファイルには、1ファイルにつき最大 50,000 URL または 10MB という制限があります。さらに、XML フォーマットを用いる際には、特定の文字(アンパサンドやクォートなど)をエスケープする必要があります。サイトマップの管理では、robots.txt を利用して、その位置を示すことが可能です。このファイルには、サイトマップインデックスも含まれ、これにより多数のサイトを持つ場合でも効率的に管理できます。このように、サイトマップはウェブサイト運営において非常にバランスの取れた役割を果たしています。

もう一度検索

【記事の利用について】

タイトルと記事文章は、記事のあるページにリンクを張っていただければ、無料で利用できます。
※画像は、利用できませんのでご注意ください。

【リンクついて】

リンクフリーです。