インデックスされたくないページ等に使用する関連するmetaタグ一覧です。
対象のページのheadに埋め込むことで検索エンジンのインデックスをコントロールできますので、そのページにリンクが付いているかどうかに関わらず検索結果から削除することができます。
metaでインデックスを操作するときの注意点も交えながら見ていきましょう。
メタタグでインデックス操作
metaタグを使いこなせば、自分のWEBサイトの重要なページを守ったり、思わぬ露出を防ぐことができます。
使い方はそれぞれですが、ただ記述するだけではなく細かい注意点にも配慮しましょう。
metaでインデックス拒否
<meta name="robots" content="noindex">
検索エンジンはnoindexタグが記述されていても、ロボットによるクロールはされます。
また、noindexタグが記述されたページにもPageRankが付きます。
なので、インデックス許可するとすぐにページのポテンシャルをそのままに表示されます。
サイトのテスト段階でまだ検索エンジンからの流入を避けたい時に利用したりできますね。
metaでリンク先クロール拒否
<meta name="robots" content="nofollow">
ページ内リンクをロボットにクロールさせたくない場合に用いるmetaタグです。
上記のインデックス拒否のページの親ページ内で利用したりもできますね。
個別のリンクの場合aタグにつけるrel=nofollow属性がありますが、metaタグではページ内全てが対象となります。
metaでキャッシュ拒否
<meta name="robots" content="noarchive">
常に最新情報の掲載を行うページに利用するのが一般的です。
検索エンジンの検索結果に表示される「キャッシュの表示」という部分を出したくない場合にも利用できます。
キャッシュから過去の情報が残ってしまうような場面では必須のmetaタグになりますね。
metaタグで複数の指定をする方法
<meta name="robots" content="index,follow">
このようにカンマ区切りで複数の命令を検索エンジンに伝えることができます。
きれいなコードが書ければ、検索エンジンにも自分の気持ちが上手に伝えられますね。
まとめ
最も重要なのはmetaをロボットに認識させる必要がありますので、対象のページのクロールをrobot.txtなどでブロックしてしまわないようにしましょう。
robot.txtによって対象のファイルのmetaが読み込めずにインデックスから中々削除されないといったヘチマな経験をしてしまいましたので、皆さんはそんな初歩的な間違いをしませんようにお祈り申し上げます。
今日も知識欲は止まらない。