XMLサイトマップの話、最近よく考えるんだよね。みんな「SEOのためにやっとけ」くらいに思ってるかもしれないけど、これ、ちゃんとやるとクロール効率がマジで変わる。でも、ただ作って置いとくだけじゃ、正直あんまり意味ないんだよな。
結論から言うと、大事なのは「正直さ」と「整理整頓」
いきなりだけど、もう結論から。XMLサイトマップでGoogleに好かれるコツは、たった2つに絞られると思ってる。それは「`lastmod`タグで正直な更新日を伝えること」と、「サイトマップインデックスファイルを使って、サイトの構造を分かりやすく整理してあげること」。
昔は`priority`(優先度)とか`changefreq`(更新頻度)とか、いろいろ設定項目があったけど、正直なところ、今のGoogleはほとんど見てない。 Googleの公式ドキュメントにも「
じゃあ、具体的にどうすんの?実践ポイント
理屈は分かったけど、じゃあどうやるんだって話だよね。特にページ数が多いサイト。例えばECサイトとか、ブログ記事が何千とあるようなサイトだと、1個のサイトマップじゃ無理が出てくる。URLが5万件、ファイルサイズが50MBっていう上限があるからね。
サイトマップインデックスで「仕分け」する
ここで出てくるのが「サイトマップインデックスファイル」。 これ、何かっていうと、複数のサイトマップファイルをまとめるための「目次」みたいなファイル。 例えば、ECサイトなら「商品ページ用のサイトマップ」「ブログ記事用のサイトマップ」「会社概要とかの固定ページ用のサイトマップ」みたいに、コンテンツの種類ごとにファイルを分ける。そして、それらをサイトマップインデックスファイルで一つにまとめるんだ。
なんでこんな面倒なことをするかって? Search Consoleで見たときに、どのタイプのページがどれくらいインデックスされてるか、エラーが出てないか、すごく分かりやすくなるから。 「商品ページのサイトマップだけ、なんかインデックス数が少ないな…」みたいに、問題の切り分けがしやすくなる。これは大規模サイトほど効果絶大。
一番大事な `lastmod` タグの正しい使い方
さっきも言ったけど、`lastmod`が肝。 これはページの最終更新日時を示すタグで、W3C Datetime形式で書く必要がある。 例えば、フッターのコピーライト年号を更新しただけ、みたいな軽微な変更は「更新」に含めちゃダメ。 Googleが言ってる「重要な更新」っていうのは、本文の内容を大きく書き換えたり、構造化データを追加したりした場合のこと。 これを守って、本当に更新したページの`lastmod`だけを正確に書き換える。そうすれば、Googlebotも「お、このページは新しい情報があるな。見に行こう」って効率的にクロールしてくれるようになるんだ。逆に、中身が変わってないのに日付だけ毎日更新するようなやり方は、絶対にやめたほうがいい。
よくある間違いと、その対処法
良かれと思ってやってることが、実は逆効果ってことも多いんだよね、サイトマップは。
- `noindex`のページを含めちゃってる: `noindex`って「インデックスしないで」っていうお願いなのに、サイトマップにそのURLを入れるのは矛盾してる。クロールさせたい、インデックスしてほしいURLだけを載せるのが基本。
- リダイレクト元や404ページが残ってる: サイトマップは常に最新の状態に保つのが理想。 削除したページやURLを変更したページがいつまでも残ってると、クローラーが無駄足を踏むことになる。クロールバジェットの無駄遣い。
- `priority`と`changefreq`にまだこだわってる: さっきから言ってるけど、もうここは気にしなくていい。 WordPressのプラグインとかだと設定項目が残ってたりするけど、労力の割に効果はほぼないと思っていい。それより`lastmod`の正確性に時間をかけたほうが100倍マシ。
海外のSEO情報、例えばGoogle Search Centralのドキュメントを見ると、すごくシンプルに「`lastmod`が正確なら使うよ」「`priority`は無視するよ」って書いてある。 でも、日本の古いブログ記事とかだと、まだ「`priority`を適切に設定しましょう」なんて書いてあることもあるから注意が必要だね。 結論は、本家Googleの言うことを信じるのが一番。
サイトのタイプ別・サイトマップ戦略
全部のサイトが同じ戦略でいいわけじゃない。ニュースサイトと、企業のコーポレートサイトじゃ、更新のされ方が全然違うからね。
この違いを意識してサイトマップの分け方や更新の仕組みを考えると、もっと効率が上がるはず。
| サイトマップ戦略 | メリット | デメリット・注意点 | おすすめのサイト |
|---|---|---|---|
| 単一の静的サイトマップ | 一番シンプル。作るのが簡単。 | 更新が手動だから、正直めんどくさい。ページの追加や削除を忘れがち。500ページ以下の小規模サイトじゃないと厳しいかも。 | 数ページのコーポレートサイト、個人ブログなど |
| CMSによる動的サイトマップ | 記事を公開・更新したら自動で`lastmod`も更新してくれて超楽。WordPressプラグインとかがこれ。 | プラグイン任せだと、低品質なページまで全部含んじゃうことがある。意図しないURLが入ってないか定期的なチェックは必要。 | ブログ、中小規模のWebメディアなど |
| サイトマップインデックス活用 | 大規模サイトの管理がしやすい。 コンテンツタイプ別に分割すれば、Search Consoleでの分析も捗る。 | 設計がちょっと複雑になる。分割のルールを最初にちゃんと決めないと、後でぐちゃぐちゃになる。 | 数千〜数万ページ以上のECサイト、大手ニュースサイト、多言語サイトなど |
まとめ:サイトマップはGoogleへの「丁寧な案内状」
結局のところ、XMLサイトマップって、Googlebotっていうお客さんに対して、「うちのサイトには、こんなに素敵なページがありますよ。最後に更新したのはこの日です。どうぞ見ていってください」って渡す、すごく丁寧な案内状なんだと思う。
案内状が古かったり、存在しない部屋(404ページ)に案内したり、重要じゃないページばかりをアピールしてたら、お客さんも「もういいや」ってなっちゃうよね。だから、「正直に」「分かりやすく」最新の情報を伝える。ただそれだけ。でも、それが一番難しいし、一番効果があるんだよな。
あなたのサイトのサイトマップ、今どうなってる?もし何年も放置してるなら、一度見直してみる価値は絶対あると思うよ。もしかしたら、クローラーがあなたのサイトの素晴らしいコンテンツを見逃してるかもしれないからね。
