- TOP
- Web
: AddType application/x-httpd-php.html
こちらを.httpaccessに書き加えることにより、index.htmlをPHPとして認識させ作動させることが可能。
現在モバイルSEOのテスト用にDocomoのDOCTYPE宣言を入れたxhtmlのページを泳がせているんですが、
ログを見ていたらクローラーの中でこんなやつがいました。
- IP: 209.191.126.182
- HOST: cr06.wap.search.mud.yahoo.com
- UA: lwp-trivial/1.41
HOSTからしてどうやらYahooのモバイルクローラー?(wapってあるし。でも情報が少ないからなんとも)
しかしUAが違うしなあ...と思って調べていたら、
このUAはperlがページを取得した時に残されるもの(LWP::Simple)とのこと。
mixiのRSS fetcherも以前はこれだったとか、そうでないとか。
とにかくこのクローラー、ひたすらrobots.txtとサイトマップをセットで拾っていきます。
Whois見ても本物のYahooの様なので、ちょい様子見で。
よくあるPHPコード
fopenを使って1行目だけ抜き取る場合はこれで良い。
ただ、ポインタ?なので処理的に重そう。
$fp= fopen("text.xml", "r");
$lines = fgets($fp);
fclose($fp);
そこでこれ、これでX行目だけ抜き出せる。
$hoge = file("text.xml");
print "$hoge[ X ]"

















