常见问题
文件说明
包含文件
Log文件夹需要写入权限,Cache文件夹需要写入、读取、删除权限(*v4.1新增),其他文件均需要读取权限
sh_LimitLink.ini - 程序数据文件夹位置配置文件。
IIS5.1:放在“%SystemRoot%\system32”目录下
IIS6.0:放在“%SystemRoot%\system32\inetsrv”目录下
fisheep.dll - 主程序
Config.ini - 配置文件
具体设置方法请查看该文件中的说明
UnLimitIP.txt - 不限制IP列表
每行一个,支持127.0.0.1、127.0.0.*、127.0.0.1-127.0.0.3三种格式
127.0.0.*格式表示127.0.0IP段所有的IP地址
127.0.0.1-127.0.0.3格式表示127.0.0.1、127.0.0.2、127.0.0.3三个IP地址
LimitIP.txt - 限制IP列表
同UnLimitIP.txt
Log - 日志文件夹
Action - 行为模块文件夹 *v3.1开始支持
支持将模块放入该文件夹下不同的文件夹中,以便分类。
Cache - 缓存文件夹 *v4.1开始支持
Return.html - 拦截返回页面 删除则不使用 *v4.3开始支持
Code.html - 验证码页面 删除则不使用 验证码功能 *v4.3开始支持
行为分析详细介绍
程序对每个IP与Action文件夹下的每个模块进行匹配,如果匹配则进行相应的操作(拦截、不处理、不限制)。
一个模块由至少一个以上的步骤组成,由上之下进行匹配。一个步骤由至少一条规则组成,也是由上至下进行匹配。如果步骤的每个规则都匹配,则这个步骤则匹配,所有步骤匹配后执行设置的操作。
模块参数
优先级:模块匹配优先顺序。 *v4.0开始支持
执行操作:当整个模块匹配时执行的操作
开始步骤:一个IP自开始访问开始,第一个请求为第一步,第二个请求为第二步。当和模块设置的开始步骤相同则开始进行匹配。
支持格式:
1 说明:当访客第一次请求时模块就开始匹配。(推荐)
0 说明:不论是第几次请求模块一直进行匹配,直到匹配为止。(不推荐)
2-10 说明:当访客第二次到第十次请求时一直进行匹配
错误格式:包含负数、0-10
日志:
类型:日志缓存根据此进行分类,当总数达到设置的最小写入日志时写入该类型日志。
文件:日志写入的文件名(可为空,为空时为“类型_日期.Log”)
内容:当模块匹配时要写入的内容。支持变量
匹配次数:整个步骤需要匹配的次数。*v4.3开始支持
有效时间:当模块匹配时,执行状态有效时间。(单位:秒)*v4.3开始支持
支持格式:
-1 说明:使用程序默认有效时间。(Config.ini中的Dateline参数)
0 说明:执行操作只对当前请求有效。
大于0 说明:执行操作在该时间内均有效。
时间限制:
不限制:不对匹配所花时间进行限制。
小于:当整个模块完成匹配所花的时间小于设置则匹配。
等于:当整个模块完成匹配所花的时间等于设置则匹配。
大于:当整个模块完成匹配所花的时间大于设置则匹配。
步骤
唯一标识:用于读取步骤参数(不重要,不重复即可)
匹配次数:该步骤匹配需要的次数。如果在匹配次数范围内则一直匹配到不匹配的情况再匹配下一个步骤。
支持格式:
0 说明:该步骤不限制匹配次数。
1 说明:该步骤需匹配一次
0-10 说明:该步骤可匹配次数在0次和10次之间均可
错误格式:包含负数
日志:见模块的日志介绍
规则
参数:服务器变量名
比较:与规则进行比较
规则:使用正则表达式和服务器变量进行匹配比较(可为空)
安装步骤
点击下载安装配置教程
1.把程序解压到一个目录下
2.修改sh_LimitLink.ini中的程序地址为解压的地址
3.将sh_LimitLink.ini放到相应的目录下,并设置相应权限(设置文件夹权限)
IIS5.1:放在“%SystemRoot%\system32”目录下
IIS6.0:放在“%SystemRoot%\system32\inetsrv”目录下
4.进行配置Config.ini、LimitIP.txt、UnLimitIP.txt(可使用默认,跳过此步)
4.将模块添加到Action文件夹下
6.在IIS的ISAPI筛选器中添加fisheep.dll(具体方法参见网站帮助)
7.如在Windows2003或Windows2008中需对程序数据所在文件夹配置相应权限(设置文件夹权限)
验证码功能
验证码是区分机器人有效的方法。鱼羊防采集v4.3开始支持验证码功能。
当某个IP的行为匹配设置的模块,该模块设置的“执行操作”为验证码时,程序就需要IP进行验证码进行身份验证,判断是否为机器人。当输入正确的验证码后则放行。
验证码设置 Config.ini文件中的Code各项参数
Length:验证码位数 0-24,当为0时则不启用验证码功能。
Width:验证码图片宽度(单位:像素)
Height:验证码图片高度(单位:像素)
验证码功能说明
当某个IP需要进行验证码验证的时候。这个IP除“/Code.bmp”请求外,所以的请求均返回Code.html文件中的数据。
可以根据Code.html文件进行修改验证码输入页面。注意:网页中不能引用除“/Code.bmp”之外的本站资源。
当程序要求输入验证码时,如果正确输入验证码后,即可对该IP放行。但如果同一个验证码(每一分钟换一次验证码)连续3次输入错误,或者在3分钟内没有输入验证码,则拦截该IP。
被拦截IP持续时间
v4.3之前版本
当IP被拦截或者不限制后这种状态一直会持续到IIS重启。
当IIS重启后会读取缓存数据,如果数据在一天加数据清理时间这个范围内均做为有效数据读入。
v4.3之后版本
状态一直持续到设置的时间为止(Config.ini文件中的Dateline参数,或为模块设置的“有效时间”参数。单位:秒)。
无法启动程序
添加ISAPI后显示插件未启动,同时程序文件夹下Log文件夹无任何新文件生成
sh_LimitLink.ini 未设置好程序路径或未放到相应的位置
程序所在文件夹Everyone没有读写权限
最后写入日志为“IP未经授权”
该IP未得到授权,或者授权已过期
最后写入日志为“程序启动失败”
1.程序因授权失败导致无法正常运行
2.服务器不是直接连接外网
最后写入日志为“请求授权信息”
电脑无法向服务器请求数据造成。
注意:更新替换文件后,记得给新文件配置权限。
日志支持的变量
{TIME} 当前服务器时间
{DATE} 当前服务器日期
{S(服务器变量名)} IIS的服务器变量
提示:程序是先将内容转换成大写再进行替换其中的变量。
如
{S(SERVER_NAME)} 服务器名
{S(HTTP_REFERER)} 来路
{S(REMOTE_ADDR)} 客户端IP
对SEO的影响
根据收集的IP对蜘蛛进行放行后,对SEO并未任何影响。因为程序是对访客进行筛选过滤来实现防采集的,而非对网页进行加密。对SEO只有有利的影响,保护了网站内容,避免内容大量采集而造成的重复,对网站权重有增无减。
鱼羊防采集v3.1.x
v3.1.x不同于v3.0.x,v3.1.x使用全新的方法进行访客行为分析,并根据设置进行相应的操作(如拦截等)。如果搜索引擎蜘蛛符合你所设置的模块当然也会执行相应的操作,未避免这种情况你可以收集搜索引擎蜘蛛的IP,将之加入到不限制IP列表中便可。
鱼羊防采集v3.0.x
程序根据访问数据可分析出是否人为访问,但需要分辨出是否为搜索引擎的蜘蛛就有点困难了。
如何封锁采集器,而对蜘蛛放行?!
前期放宽非人为访问的权限,收集蜘蛛的IP,当收集的蜘蛛IP完整时提高访问权限。便可不对SEO有影响并做到封锁采集器。
在此欢迎大家共享一下自己的日志或分享一下已知的蜘蛛IP。
重启程序
右键选择应用程序池,并选择“回收”便可重启程序。

IIS5安装方法及问题
安装方法参考安装步骤
添加ISAPI筛选器步骤:
1.打开“Internet 信息服务”
2.打开网站属性
3.选择“ISAPI 筛选器”
4.点击“添加”
5.在“筛选器属性”对话框中的“筛选器名称”中输入“fisheep”
6.点击“浏览”在程序存放目录中选择“fisheep.dll”
全部“确定”便添加完成
流程图



IIS6安装方法及问题
安装方法参考安装步骤
添加ISAPI筛选器步骤:
1.打开“Internet 信息服务(IIS)管理器”
2.打开需要使用防采集系统的网站属性
3.选择“ISAPI 筛选器”
4.点击“添加”
5.在“筛选器属性”对话框中的“筛选器名称”中输入“fisheep”
6.点击“浏览”在程序存放目录中选择“fisheep.dll”
全部“确定”便添加完成
流程图


IIS7安装方法及问题
因无IIS7环境,欢迎各位网友提供测试环境。
无法读取IP的问题
在WindowsXP+IIS5.1和Windows2003+IIS6.0时发现一个问题:程序无法读取IP,而程序基于IP来统计数据,所以出现无法读取IP时程序不进行处理!
对于此问题目前先收集资料再做进一步处理。
设置文件夹权限
1.打开程序所在文件夹的属性对话框
2.选择添加用户
3.添加EveryOne或“Internet 来宾帐户 (计算机名\IUSR_计算机名)”,并设置为完全控制
流程图


