Home > 雑記 > googlebotだと思われているかもしれない

googlebotだと思われているかもしれない

ツールバー

最近知ったのですが、インターネットエクスプローラーでグーグルツールバーをインストールしている場合、そのブラウザでどこかのページにアクセスした場合のそのブラウザ情報に「GoogleT5」という文字がくっつくようです。

インターネットでどこかのページにアクセスするとき、インターネット閲覧ソフトはそのソフトが何かという情報を吐き出します。
一番よく使われているインターネットエクスプローラーのバージョン6だったら「Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1;....」といった情報を持ってアクセスします。
ぼくの携帯でどこかのページにアクセスした場合は「KDDI-SA3C UP.Browser/6.2_7.....」などといった情報を吐き出します。

これらの情報をユーザーエージェント情報と言いますが、これはホームページを作る際のプログラムを書く人にとっては便利な情報です。

たとえばユーザーエージェント情報の中に「UP.Browser」という文字列が含まれたらau用に作られたページや絵文字を表示させることができるのです。
また、「DoCoMo」「UP.Browser」「SoftBank」などの文字を含まなかったらそのページをパソコンなどの端末と判断して、QRコードしか表示しないページを作成したりもするわけです。

さらに携帯以外の端末の時も使うことがあります。
利用者の多い検索エンジンサイトに「Yahoo」や「Google」というサイトがありますが、ここでの検索結果は、googleやyahooのシステムが自動でいろんなサイトにアクセスして蓄えた情報が検索結果として表示されます。
この自動でアクセスするシステムのユーザーエージェント情報は「Yahoo! Slurp」とか「Googlebot/2.1」という文字列が含まれます。
これにより人間ではないアクセスであることがわかるのです。

そこでプログラマは、人間以外のアクセスの場合はセキュリティも考えてそれ専用のプログラムを書いたりするのです。
「このページはgoogleはアクセスできない」とか「人間に対して出す情報をYahoo! Slurpには出さない」とか。

この場合、googleと判断する文字列は「google」とか「googlebot」とかになります。
「googlebot」という言葉の中にも「google」という文字列が含まれるため、「google」という文字列を拾うだけでもgoogleからのアクセスであると判断できます。

と、今まではそれでよかったのですが、、、
グーグルツールバーの最新版をブラウザにインストールすると
「Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1; SV1; GoogleT5;....」
と吐き出すようになったのです。

これで困るのは、自分は人間なのに、「google」という文字列が含まれているため、検索エンジンだと判断されてしうまうこともあるのです。

なので、もしかしたら気付かないけど知らないうちにgoogle用のページを観ていることもあるかもしれません。
それから、ショッピングの時、「カートに商品を入れた状態で会員ページにログインしたらカートから商品が消えてしまった」というのはこれが原因だということもあります。

まぁ、でも、これを気をつけないといけないのは、ページを作る側のプログラマさん。
一部のお客様からの購入が出来なくなってるのかもしれないってことですかね~。

ところで、世の中の生身の人間はなんらかのユーザーエージェントを吐き出しているのでしょうか。
「オーラ」のような何か。

家族構成であったり、性格であったり。
すっごいお金持ちで性格の良い人は「Kanemochi2.0(okanemochi de seikakumo good)」って感じとか。

このお金持ちと出会うためには、自分の頭の中のプログラムに「okanemochi」という文字列を、、、、、
う~ん、もっと書きたいけど、どんどんわけのわからない世界に入っていってしまいそうなので、やめておきます。笑。

DMM.com AKB48 LIVE!! ON DEMAND

Comments:6

阿須奈呂 08-10-07 (火) 20:47

さっぱり分かりません^^;
アクセス解析と同じ?
IPとは違うのでしょうか?

?だらけです・・・笑

karu 08-10-08 (水) 12:21

>阿須奈呂さん
アクセス解析でもIPアドレスとかでもないです~。
ブラウザが自分の情報を名乗るわけです。
すごーく簡単なプログラムを書いてみましたが
http://karu.jp/c/aaa.cgi
↑ここにアクセスするとユーザーエージェントとIPアドレスを表示するようにしてあります。それらの情報を解析するのがアクセス解析です~。
なので、ユーザーエージェントの中に「DoCoMo」って単語を見つけたらドコモからのアクセスですってプログラムに判断させることができるのです。
ちなみにユーザーエージェントは偽装することもできますので、正しいとは限りません。
テストに出ますからね~。しっかり覚えておくようにしてください。って何の?笑

阿須奈呂 08-10-08 (水) 17:48

いまだもってさっぱり・・・笑
ブラウザが名乗るのですね^^
テストに出ると・・・…φ(◎◎ヘ) ホォホォ…
偽装はProxyを使うという事?

karu 08-10-08 (水) 18:14

>阿須奈呂さん
Proxyではないです。いろいろ方法はあるかと思いますが、自分のブラウザ情報なので、たとえばレジストリをいじるとかそんな感じでしょうか。
Firefoxにはそんなプラグインもあったような、、。
IEから観てるのに、ユーザーエージェントを「Mozilla/5.0 (Nintendo FamilyComputer2005)」とかにするとか。ただの自己満足で、メリットよりもデメリットのほうが多いような気もしますが。笑。

文章長くなってすみません。

阿須奈呂 08-10-09 (木) 18:53

ChromeはFirefoxとは違うんですか?
さとしさん、一度PC教室開きましょう^^

karu 08-10-10 (金) 12:38

>阿須奈呂さん
Google ChromeはGoogle Chromeで、FirefoxはFirefoxですよ!としか答えれないです。笑。Google Chromeがもっと完璧なら良いのですが、サイトによってはまだまだ崩れるのでぼくはFirefoxです~。オンラインの銀行とか困ったときだけIEです。笑

あなたからの優しい適当なコメント待ってます
名前などの入力内容を保存しますか?
 ←書き終わったら送信ボタンをポチッ。(初投稿の方やPCによっては、承認後表示です)

Trackbacks:0

Trackback URL for this entry
http://karu.jp/w/293.html/trackback
Listed below are links to weblogs that reference
googlebotだと思われているかもしれない from karu.jp

この記事に関連しているかもしれないAmazon商品

Home > 雑記 > googlebotだと思われているかもしれない

検索
Feeds
Meta

ページの一番上に