Email:xpjco@foxmail.com
精准采集官网-精准客源-邀请码代理-十年专注目标客户资源数据采集
当前位置:网站首页 > 行业资讯 正文 行业资讯

爬虫技术违法吗?

fctime.cn 2021-12-04 行业资讯 245 ℃ 0 评论

先说结论,技术无罪,有罪的是人反爬虫爬虫技术本身是不违法的,但是如果利用爬虫技术做损害他人利益的事情就是违法的了。

具体的法律条文,我也记不大清了,目前对于爬虫技术的使用界限没有一个特别明确的规定,按照我之前咨询律师得到答案,大概就是关乎这三个方面:采集途径、采集行为、使用目的反爬虫

通过什么途径爬取数据,这个是更需要重视的一点反爬虫。总体来说,未公开、未经许可、且带有敏感信息的数据,不管是通过什么渠道获得,都是一种不合法的行为。

采集行为上使用技术手段应该懂得克制反爬虫,一些容易对服务器和业务造成干扰甚至破坏的行为,容易违法

还有就是使用目的,就算你通过合法途径采集的数据,如果对数据没有正确的使用,同样会存在不合法的行为反爬虫。一种情况是公开收集的数据,但没有遵循之前告知的使用目的。比如有些网站上标明内容不得用于商业行为,还有未经授权不得转载的,些都是有法律明文保护,所以要注意使用。

更后反爬虫,结合实际情况,给几点建议吧

1、爬虫访问频次要控制反爬虫,别把对方服务器搞崩溃了

虽然你爬取的信息都是公开的反爬虫,也不涉及公民隐私,爬取的数据也不用于违法获利,只是自己弄着玩,但是如果你的爬虫太疯狂了,一分钟请求1万次,导致对方服务器应接不暇,不能处理正常业务了,对不起,你这种属于违法行为,这种爬虫等同于进行黑客攻击了,你让人家不能正常工作了,损害了对方的利益

2、 涉及到个人隐私的信息你不能爬

其实这很好理解,你希望你自己的电话号,身份证号,家庭住址,工作单位,行踪轨迹这些隐私信息被别人用爬虫抓取么?当然不希望,别人抓了你的这些信息,你肯定想去报警对不对,让警察去抓那个坏蛋,ok,你不要去做那个坏蛋反爬虫。

3、 突破网站的反爬措施反爬虫,后果很严重

正规的网站都会在根目录下放置 robots.txt反爬虫,这里就规定了哪些能爬,哪些不能爬,谁可以爬,比如知乎的robots.txt,人家希望搜索引擎来爬它,其他的,一概不接受

不过呢反爬虫,知乎并没有做特别严厉的反爬措施,这就是说,如果你偷偷的爬一点东西,不影响它的正常服务,它也懒得找你麻烦,但对于那种反爬特别严重的,例如淘宝,你更好别去爬,如果你真的利用你的高智商突破了淘宝的反爬措施,那么恭喜你,你已经违法了

4、 不要用爬取的数据做不正当竞争

比如你把大众点评的评论数据都爬下来了,然后自己搞了一个xx点评,这肯定不行,人家辛辛苦苦的积累的数据,你轻轻松松的弄下来,直接拿来主义,跟人家搞竞争,你不违法谁违法反爬虫。

5、 付费内容反爬虫,你不要抓

既然是付费内容,说明这东西价值很高,付费才能看,你弄下来了,你想干啥?你私自传播,就对网站造成了潜在损失反爬虫。

6、更后一条反爬虫,突破网站反爬措施的代码,更好不要上传到网上

你技术很牛逼反爬虫,能突破网站的反爬措施,你把这些代码发布到网上,比如github,你自己没做啥坏事,可是想做坏事的人利用了你的代码,入侵了网站,那么,这种情况下,你也是有责任的,这个听起来有点冤,但确实存在这样的风险,所以,更好还是不要这么干

本文标签:爬虫技术爬虫

版权说明:如非注明,本站文章均为 精准采集官网 原创,转载请注明出处和附带本文链接

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

搜索
«    2022年5月    »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
标签列表
最新留言
友情链接
  • 精准采集APP,精准人脉大师
  • 订阅本站的 RSS 2.0 新闻聚合
Copyright © 2016-2021 fctime.cn 精准采集 DJY团队. Powered By Z-Blog,xpjco@foxmail.com Some Rights Reserved.
精准采集   精准客源

赞助广告×