Webサーバーアクセス制限を更に強化

これまで、googlebotを許可するためにAS15169を許可していた。

Googlebot (AS15169)

echo “? - Fetching Googlebot ranges (AS15169)…”

whoisの出力を直接一時ファイルにリダイレクト

timeout 60 whois -h whois.radb.net -- ‘-i origin AS15169’
| grep -Eo ‘([0-9]{1,3}.){3}[0-9]{1,3}/[0-9]+’ » “$TMP_IPLIST” || true

これだと、下記のようにbc.googleusercontent.comからのスキャンを通してしまう・・・

162.15.169.34.bc.googleusercontent.com - - [18/Dec/2025:16:27:32 +0900] “GET //wp-includes/wlwmanifest.xml HTTP/1.1” 404 501 “-” “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4240.193 Safari/537.36”
162.15.169.34.bc.googleusercontent.com - - [18/Dec/2025:16:27:32 +0900] “GET //xmlrpc.php?rsd HTTP/1.1” 404 500 “-” “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4240.193 Safari/537.36”
162.15.169.34.bc.googleusercontent.com - - [18/Dec/2025:16:27:32 +0900] “GET / HTTP/1.1” 200 897 “-” “Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4240.193 Safari/537.36”

そこで、googlebotのみを許可すべく、スクリプトの該当箇所を下記のように変更。

Googlebot (official bot-only ranges)

curl -s https://developers.google.com/search/apis/ipranges/googlebot.json
| grep -oE ‘“ipv4Prefix”[[:space:]]:[[:space:]]"[^"]+"’
| sed -E ’s/."([^"]+)"./\1/’ » “$TMP_IPLIST” || true

サーチボットとしては他に、BingとAppleを通している。

これを実施してから、12時間経過でサーチボット以外のアクセスが皆無・・・
サーチボット専用サイトだ(笑)

頭がおかしいとしか思えない、付きまといの様なアクセス、無差別スキャン等を完全排除し、「ノイズ除去」するとこうなるわな・・・