防止机器扫描网站,被恶意全字匹配拦截域名的方法(JS挑战)

首先我们得知道机器扫描的原理

模拟一个真实的客户端一直向服务器发送访问请求,
一个完整的域名请求可以理解为-- 用户访问域名—域名解析ip地址—如果上境外ip地址就会从境外出口防火墙—服务器。

例如你在服务器上进行 curl https://66cto.cn 返回的页面就是你的网站的首页代码。

假如你的服务器无法在境内访问,或者说你进行 curl 域名 返回的为 tcp 无法链接或者被重置,那么应该是被运营商拦截了。

从上面的链路我们可以知道,你的域名如果能在国外正常访问,中国境内无法访问,可能是由于境外出口防火墙将你的域名加入黑名单,注意这不是说一级域名加入黑名单,而且一串完整的类似 https://66cto.cn 这样的url加入黑名单。

那么根据近期的大量域名被拉入境外防火墙黑名单,猜测可能是由爬虫机器对网站抓代码,并且针对网站的代码或者特征代码,进行匹配,从而实现将url加入黑名单。

全文请查看:https://blog.66cto.cn/index.php/archives/125/