About the Robots META tag
目次 |
About the Robots <META> tag の日本語訳。
要約
HTML の <META> タグを使うことで、ロボットにページをインデックスさせないようにしたり、ページ内のリンクをフォローしない(リンクをたどらない)ようにさせたりすることができます。
例:
<html> <head> <titile>...</title> <meta name="robots" content="noindex, nofollow"> </head>
robots <META> タグを使うにあたり、次の2点に注意してください。
- ロボットは <META> タグを無視することができます。特に、Webサイトの脆弱性をスキャンするマルウェアロボットや、スパマーによるメールアドレスの収集時には無視されるでしょう。
- NOFOLLOW は、ページ内のリンクのみに適用されます。ロボットは、同じリンクを NOFOLLOW の無い他のページで(おそらく別サイトで)見つけるかもしれないので、アクセスして欲しくないページへアクセスすることがあります。
NOFOLLOW と rel="nofollow" 属性を混同しないこと。
rel="nofollow" 属性とは?
rel="nofollow" は HTML の <a> タグに設定できる属性で、Google によって考案され、他でも採用されています。Google が検索結果にランク付けする時、rel="nofollow" のリンクはページランクを得ません。結果、コメントスパム(スパマー)への利益がなくなります。
公式 Google ブログの Preventing comment spam をご覧ください。
ランキングに影響が出るだけで、Google のロボットはフォロー先をたどりインデックスします。これは <META> タグの NOFOLLOW とは異なることを意味します。
詳細
/robots.txt と同じく robots META タグはデファクト・スタンダードとなっています。1996年の非公式な会議で配布された distributed indexing workshop と議事録に始まります。
META タグは、the HTML 4.01 specification, Appendix B.4.1 で説明されています。
残りのページには robots <META> タグの使い方と簡単な例が記されています。詳しくは FAQ をご覧ください。
robots meta タグの書き方
記述場所
他の <META> タグと同じく HTML ページの HEAD セクションに下記のように記述します。ロボットはサイト内の全てのディープリンクにアクセスするので、サイト内のすべてのページに記述する必要があります。
記述内容
NAME 属性は ROBOTS にしなければなりません。
CONTENT 属性は INDEX, NOINDEX, FOLLOW, NOFOLLOW のようにいくつかあります。複数指定する場合はカンマ区切りで指定しますが、意味のある組み合わせはわずかです。robots <META> タグを記述しない場合、デフォルトは INDEX, FOLLOW になります。
<META NAME="ROBOTS" CONTENT="NOINDEX, FOLLOW"> <META NAME="ROBOTS" CONTENT="INDEX, NOFOLLOW"> <META NAME="ROBOTS" CONTENT="NOINDEX, NOFOLLOW">