突破基于 HTTP_REFERER 的防盗链措施

2008-06-25

比较郁闷就是某些「小气」的网站，会加上防盗链的功能（特别本人在看 Google Reader 时）。其实防盗链这个技术并不复杂，目前基本就是在服务器端判断 HTTP_REFERER 的位置，如果不是来自本站自身，则拒绝输出（详细）。

那么如果考虑突破防盗链的措施，就需要考虑在 HTTP_REFERER 上面做手脚了。PHP 脚本中对应的变量是 $_SERVER['HTTP_REFERER'] ，它存储了 HTTP_REFERER 的值。

由于直接访问目标 URL 资源已经被上述防盗链的措施给屏蔽，所以我们需要个类似网关的玩意去获取。说白了就是编写已经包装过的 HTTP 头的 PHP 脚本。

下面是简单的函数实现：

function getRemoteFile($url, $refer = '') {
    $option = array(
            'http' => array(
                'header' => "Referer:$refer")
            );
    $context = stream_context_create($option);
    return file_get_contents($url, false, $context);
}

这是个比较简单的函数，其功能就是伪造 Referer （使用 stream_context_create 函数）然后获取对方的数据（使用 file_get_contents，需要开启 allow_url_fopen ）。

如果想「复杂」一点，可以使用 sockets 扩展，这不在这里的讨论范围以内。

另外，再提供个获取主机名的正则函数

function getHost($url) {
    $result = preg_match('/^http:\/\/([\d|\w|\.]+)\//', $url, $matches);
    if (sizeof($matches) >= 2)  {
        return $matches[1];
    } else {
        return null;
    }
}

再进一步的扩展，可以封装成脚本，然后譬如调用

http://127.0.0.1/proxy.php?url=http://i.am/img

就可以获取那些开启防盗链措施的链接了（再发挥下，使用 Javascript 将图片链接全部替换）。

joyqi

2008-06-25 00:29

防盗链只能针对浏览器这样的客户端，对可以伪造http头的就没有意义了，迅雷，快车一类的都会自动伪造referer。
王智勇

2008-06-25 01:37

感觉这样等于通过服务器中转了一下，对服务器的压力会很大。
锐风

2008-06-28 01:25

@王智勇

确实这样. 所以从不这么用.
手气不错

2008-07-22 04:56

@智勇考虑下，如果是某些采集程序呢？
gently

2008-09-10 06:57

这个东西在小偷程序中较为实用，不过用sockets完全可以模拟任何客户端，哇哈哈
xLight

2008-09-25 23:43

parse_url

無標題文檔

突破基于 HTTP_REFERER 的防盗链措施

分类

搜索

文章