`
fantasy0707
  • 浏览: 36266 次
  • 性别: Icon_minigender_1
  • 来自: 兰州
社区版块
存档分类
最新评论

百度广告机器人

阅读更多
   你在百度上搜索“传智播客”和“java培训”,就会看到一些广告链接,只要你随手点击一下这些广告链接,就会消耗广告发布商的费用,广告发布商必须为这次点击付出相应的广告费。一些人想通过点击竞争对手在百度上的广告链接,来达到消耗竞争对手的广告经费和打击竞争对手之目的,这种点击真的能够给竞争对手带来很大的经济损失吗?其实,这样的随手点击对广告发布商根本就造成不了很大的影响,这就好比一个商家在大街上派发宣传单,肯定有很多传单是浪费了,只要不是派单人员把整包宣传单直接扔到垃圾桶,这就在商家接受范围之中,商家最终的广告宣传效果还是能达到其预期目标的。


    有人也许会想到反复点击竞争对手的广告来消耗掉竞争对手的很多广告费用,让竞争对手的广告计划落空!这种想法显然过于简单了,因为这种想法不仅你有,很多人都有过,百度当然也会考虑到,并采取了一些技术手段予以防范。即使你采用动态拨号方式上网、不断重新拨号改变IP地址,一台计算机在一天之内对同一个广告链接无论点击多少次,百度后台对此都只收取1或2次的点击费用。
    对Web网站开发技术比较了解的人都应该清楚,百度之所以能够识别出是否是来自同一台计算机的访问,这依赖的技术必然是Cookie,所以,我们只要清除掉浏览器的Cookie,再加上动态拨号改变IP的方式重复百度的搜索和点击搜索结果页面中的广告链接,百度就会把这些广告点击当作是来自多台计算机,就会对每次点击进行计费。如果采用人工方式来重复这些动作,只要坚持不懈,一定能给竞争对手带来较大的广告经济损失,但是,你给竞争对手造成这些损失时,自己也要花费大量的精力,仔细算一笔帐,你就会发现这完全是一种“杀敌三千,自损一万”的玩法,最后的赢家只有百度。


   由于“传智播客”已经成了“java培训”和“.net培训”领域里的著名品牌,每天通过百度搜索“传智播客”的网友很多,于是,一些精明的培训机构就打起了借力“传智播客”推销自己的主意,在百度上购买了“传智播客”这个关键字的广告,大家现在在百度上搜索“传智播客”,仍然能够看到一些培训机构的广告链接。这犹如一个竞争对手在自家门口派发宣传单,要是线下,可能早就打起仗了,但是,这是在互联网上,彼此不照面,人家是“光脚的不拍穿鞋的”,那些不知名的培训机构就想赖着那些有名气的培训机构,你能奈他如何?难道真的就没有反制手段了吗?传智播客的专家们经过开会讨论研究,决定为了自卫,委托我来研究和制作“百度广告点击机器人”,或者叫着“百度广告自动点击工具”。经过八天的艰苦努力和大量的测试验证,一个完美的“百度广告点击机器人”终于完工了,其中很多时间都花费在了测试和等待结果上,因为百度后台并不是在点击发生时立即计费,而是每次查询某个关键字的点击费用时,它只统计1个小时前发生的点击量,为了看到百度后台是否对“百度广告点击机器人”触发的点击进行了计费,我们在百度上专门做了一些研究用的推广关键字,每次修改程序和运行后都必须等待1个小时以上才能去验证结果,只有百度后台确实扣除了我们这些关键字的广告费后,我们才能确定“百度广告自动点击工具”程序确实成功了,并且还必须进行高强度的测试,才能确认我们的“百度广告点击机器人”是否具有实用价值和有多大的威力,前前后后的实验测试就花掉了我们好几百元的广告费。


    通过对“百度广告点击机器人”的研制和测试,我们肯定了百度广告在防止恶意点击上做得还是非常牛x的,即使使用我们的“百度广告点击机器人”,我们也无法在短时间内消耗掉那些挑衅竞争伙伴们的大量广告费,因为百度统计计费并不是实时的,它是统计某个关键字在上一个小时内发生的点击总量,如果这个点击总量很大,远远超出以往的同比时间段的统计数,百度后台就会按照某种算法将超出的点击量扣除掉。我们只能调低“百度广告点击机器人”的点击频率,但是,点击频率调得太低,这个“百度广告自动点击工具”就没有什么实用价值了,如果点击频率调得太高,就会被百度认为是恶意点击而作废,白白辛苦了半天!这个点击频率到多少才合适,显然要花费大量时间和拿自己的广告费做试验才能得到,所以,我们的“百度广告自动点击工具”虽然程序上是完全测通了,但是由于百度对某个关键字在单位时间内发生的点击总量的限制,导致这个“百度广告自动点击工具”无法实现我们的初衷,这不是我们的“百度广告点击机器人”无能,而是百度后台做得实在太智能了,真是“魔高一尺、道高一丈”啊,即使你能同时号召一千个人去点击百度上的某个广告链接,那也是徒劳,因为百度会将此作废!总之,“百度广告点击机器人”是诞生了,但是,我们不可能用“百度广告自动点击工具”来给恶意竞争队友的广告推广计划造成致命打击,顶多也就是当着小偷小摸来用,并且每次不能偷得太多,一多就被百度发现而前功尽弃了。


    通过对“百度广告点击机器人”的研制和测试后,我们公司反而对百度后台产生了充分信任,不再担心在百度上投放广告会招致大量恶意点击,而是可以放心大胆地在百度上做广告推广。现在,我们的“百度广告点击机器人”基本上算是被束之高阁了,但是,我们的努力和辛苦不能白费,在研究和编写“百度广告点击机器人”程序的过程中,非常有挑战和趣味性,其中涉及了大量的技术细节和技巧,我想把这些技术细节和技巧都向大家讲解出来,不知道大家有多少人对此感兴趣,也不知道这种做法是否违法?


   下面罗列出“百度广告点击机器人”程序的实现原理和技术细节:
   (1)使用HttpClient开源工具包访问某个关键字在百度上的搜索URL,例如,http://www.baidu.com/s?wd=%B4%AB%D6%C7%B2%A5%BF%CD。
   (2)使用HttpParser开源工具包分析百度对某个关键字返回的搜索结果页面,从中分别提取出左侧和中间的广告链接。
   (3)使用HttpClient开源工具包访问提取出的广告链接,并将访问到的各个链接的结果内容保存为html文件,以便确认确实得到了广告链接的网页。这里要共享第(1)步的Cookie信息和第一步的url地址作为referer,才能被百度认为是同一个浏览器的访问。
   (4)重复1、2、3步骤,而不能直接重复访问第3步的地址,因为百度每次都在改变某个关键字的广告链接的url地址,也就是说某个广告链接的地址是一次性的,访问过后就必须重新搜索关键字和在新结果页面中获取新的广告链接地址。
   (5)上面的程序写完了,运行效果从表面上看来非常完美,但是,百度是否真的为这种模拟点击访问进行了计费呢?我们在百度上为itcast网站购买一些偏门的关键字广告,可以肯定这些偏门的关键字几乎没有人点击,然后运行我们的“百度广告点击机器人”,让其点击几次我们的广告链接,过两个小时后去看百度后台是否进行了计费。结果发现我们虽然从搜索结果页面中得到了广告链接地址,也访问到了广告链接地址对应的广告页面,但百度并没有为此计费,看样子,我们把百度想得太简单了哦!
   (6)继续努力,加油!搬出Http协议工具HttpWatch,看访问广告链接地址时,浏览器倒底向服务器传递了什么样的信息,由于这些超链接使用了target="_blank"属性,单击这些超链接总是会打开新窗口,开启的HttpWatch无法监测新窗口的HTTP消息。换用FireFox及FireBug插件进行监测,依然无果!最后只能搬出更专业、更强大的网络工具了,找到一个叫EffeTech HTTPSniffer的工具,总算到了广告链接地址的HTTP消息,原来浏览器最终访问的广告链接地址并不是在搜索结果页面中的<a href=""/>标签的href属性指定的原始地址,而是在这个地址后面附加了一个特殊信息,例如,网页中的超链接标签的代码为href="http://www.baidu.com/baidu.php?url=xxxxxxxxxx" ,而浏览器实际发出去的请求路径为“http://www.baidu.com/baidu.php?url=xxxxxxxxx&ck=645.0.125.295.105.383.115.2563”,多了一个ck的参数!这个ck参数是怎么附加上去的呢?
   (7)这一定是我们在浏览器中点击广告链接地址时,触发了javascript函数,javascript函数修改了超链接地址而附加上去的!我们自己的“百度广告自动点击工具”程序在访问广告链接地址时,也必须附加上ck=645.0.125.295.105.383.115.2563这个参数,才能模拟出用户点击超链接的效果。ck参数后面的值并不是固定的,而是通过某种算法计算出来的,我们也必须用java程序写出这么一个算法的工具方法吗?还是先去看看这个javascript函数是怎么写的吧!查看百度搜索结果页面中的javascript源码,全部排在一行,太难读了,看来百度成心不想让我们读懂啊!没关系,把这些代码拷贝到myeclipse下的js文件中,使用ctl+shift+f进行格式化处理,代码排得整整齐齐了,这种使用工具软件的雕虫小技在关键时刻也能帮上大忙啊!
   (8)大概读懂了其中所有javascript函数的作用和主要代码,对函数内部的细节算法则暂时忽略不计,读人家的代码,一定要分清楚那些是必须了解的,哪些是可以忽略不计的。是将这些javascript函数移植成对应的java代码,还是用java代码来直接调用这些现有的javascript函数呢?后者显然要方便和容易得多。java代码能够调用javascript代码吗?模模糊糊记得java6好像提供了这么一个新功能,赶紧在网上搜索和确认一下,果然可以,打开java6的帮助文档,现学现用java如何调用javascript。然后对百度搜索结果网页中的javascript代码略作修改,改变成适合java代码调用,主要是原来的javascript中使用了一些变量来记录鼠标按下,鼠标弹起,鼠标点击的坐标和时间,对这些变量设置一些差不多的模拟值即可。
   (9)再次运行修改后的“百度广告点击机器人”,让其点击几次我们的广告链接,过两个小时后去看百度后台是否进行了计费。结果发现我们的程序确实修改了广告链接地址,也访问到了广告链接地址对应的广告页面,但百度还是没有为此计费,郁闷啊!想放弃,毕竟忙乎了好几天,就这样无果而终吗?不甘心啊,鼓足勇气,继续研究和实验下去,对自己说加油,就当着玩吧!
   (10)再次搬出sniffer,使用baidu搜索“传智播客”关键字,并点击其中一个广告超链接,使用sniffer整个过程,看浏览器倒底向服务器发出了哪些请求信息,以及每个请求消息的组成格式,发现在百度上搜索某个关键字时,结果页面中还通过javascript代码隐藏了一个不知道做什么用的<img/>标签,这些标签并不显示真正的图片,而只是引用了百度服务器端的一个程序而已,这就是百度在搜索结果页面留下的水印或暗号,必须先有这个<img/>水印访问,后面的点击访问才能有效?不管三七二十一,试试再说!“百度广告点击机器人”程序,在发出搜索关键字的访问请求和获得结果页面后,再生成这个<img/>标签的链接地址和发出访问请求。再次运行修改完的“百度广告点击机器人”程序,让其点击几次我们的广告链接,过两个小时后再去看百度后台是否进行了计费。结果看到百度的计费效果了!终于成功了!你也许会问,看到的这些计费效果是不是一种巧合,正好外面有些网友通过百度搜索了这些关键字和点击了广告链接呢?看到的计费效果真的是我们的“百度广告点击机器人”程序点击出来的吗?这个问题问得好,我们只要通过itcast站点首页上的站点访问统计工具进行比对,就可以知道结果,如果是正常的浏览器搜索关键字点击过来的,浏览器在解析推广站点首页时还会访问页面上嵌入的站点访问统计工具用的<img>标签,网站首页嵌入的站点访问统计工具就会将访问过程记录下来,而我们的“百度广告点击机器人”程序并不解析推广站点首页的内容,网站首页的站点访问统计工具就不会对它进行记录。所以,如果百度进行了计费,而网站首页的站点访问统计工具没有进行记录,这就肯定是“百度广告点击机器人”点击的结果。为了严谨起见,再使用“百度广告点击机器人”程序测试几下,发现确实每次都计费了。
   (11) 使用“百度广告点击机器人”完成几次点击,这仅仅只能说明程序逻辑是通过了,但并不能确认其是否具有实用价值和对竞争对手是否有震慑力,必须让“百度广告点击机器人”程序在一小时内完成至少50次左右的点击量,才能给竞争对手的广告推广计划造成重创。为了确认这一计划是否可行,首先必须拿自己做试验,豁出去几百元的广告费,让“百度广告点击机器人”程序以每秒50的强度进行点击,看几个小时候到底能消耗我们多少广告费用。结果几个小时忙乎下来,百度后台也就扣除了我们十几次的点击费用。看来即使我们的“百度广告点击机器人”每一次发出的请求对百度来说都是有效率,但是这样的请求太有规律或太频繁了,百度后台会在计费统计时将它们作废!
   (12)程序逻辑都写完了,但不能带来很大的实用价值,怎能甘心?再抱着侥幸的心理作点最后的努力吧!首先改造“百度广告点击机器人”程序的固定点击频率,让“百度广告点击机器人”程序每次重新拨号和更改IP地址后,只发出一次模拟搜索和点击访问,暂停一个随机的时间段以后,再重新拨号和更改IP地址后,再发出下一次的模拟搜索和点击访问,并且如果一个关键字上有多个推广链接,要让上一次点击的广告链接和下一次点击的广告链接不是同一个链接,而是在多个广告链接之间依次轮循。当这样的过程重复3到7次后,3到7次也是随机计算出来的,再暂停一个很长的随机时间,这样就让“百度广告点击机器人”程序的每次模拟搜索和点击完全没有什么规律可循了。另外,程序也不能一直只访问某个关键字的广告链接,而是要在几个关键字的搜索页面上的广告链接之间进行交替访问,例如,先访问“传智播客”关键字的所有广告链接中的第一个链接,再访问“java培训”关键字的所有广告链接中的第一个链接,再回来访问“传智播客”关键字的所有广告链接中的第二个链接,再访问“java培训”关键字的所有广告链接中的第二个链接,依此递推......,采用互斥的多线程技术可以很好解决这个问题。
   (13)程序在反复运行过程中会出现各种异常问题,特别是程序出了死锁之类的问题,非常难以找出bug所在。为了方便跟踪错误和排查问题,使用Log4j开源工具包进行日志记录。

     最后的声明:
       本文章及随后发布的源码和视频讲解课程仅用于技术研究与交流,希望广大学习者不要将其用于商业目的,尤其不得用于打击竞争对手和消耗竞争对手的广告经费,否则,由此引发的法律纠纷,本人概不负责!
       另外,本文和随后的视频课程的最终目的是向大家教授网络编程技术和分析解决问题的技巧,只要百度调整一下广告算法,我们教授的程序就不再起作用了。但是,只要你按照本文介绍的技巧手法和思路步骤进行研究,就一定能写出对应的“百度广告点击机器人”程序。这好比你学会编写了针对某种病毒的杀毒程序,这个程序对新病毒不会起作用,但只要你研究新病毒后,再按照原来写杀毒程序的方式就一定能写出针对新病毒的杀毒程序。

本文来自CSDN博客,转载请标明出处:http://blog.csdn.net/zhangxiaoxiang/archive/2010/03/30/5432280.aspx

1
2
分享到:
评论
1 楼 T我们的爱T 2010-04-25  
学到了很多东西,谢谢你~~

相关推荐

    小九机器人微信接口php

     百度查询(先输入百度,然后输入要搜索的词条);  更多功能持续开发中,对骂、调戏、扯淡数据也不断完善中,大家可以调教适合自己粉丝的内容,但不允许放广告,调教内容要审核。  需要放广告的可以再我提供的这个...

    ChatGPT又升级了,广告行业将尸横遍野

    近日人工智能领域ChatGPT升级GPT-4,百度文心一言紧锣密鼓发布,机器人离我们并不遥远,这种只能在科幻片中见识到的场景,似乎正在成为现实。 人工智能是趋势,同时也是当下的风口,新晋的GPT-4新奇点在哪?ChatGPT...

    秘书QQ机器人 v3.3.1510.22

    群陪聊、自动加人、无限管理、自动改群名片群娱乐、广告终结、手机踢人、智能客服定制群签到、糗事百科、百度百科、进.退群提示黑名单、自动通过、密码加群、天气预报查询快递、彩票、QQ会员排名、配对、抽签.解签 ...

    盾灵信息分享系统(自带机器人) v1.1

    18、百度PING服务(手动PING)、自动提交给百度收录 19、机器人设置、开关、以及机器人账号昵称的设置 20、启动机器人即可自动发贴操作 21、系统授权(系统使用授权码免费使用) 更新日志: 2014-10-09 1、修复分享...

    盾灵信息分享系统 2.0.rar

    管理员可在后台进行名称变更及设置6、可在线对楼主进行发送小纸条7、首页...广告管理15、邀请码查看与生成(暂未启用、预留功能)16、主题管理与审核17、评论管理与审核18、百度PING服务(手动PING)、自动提交给百度...

    盾灵信息分享系统 v2.0 (内置手机版).rar

    系统介绍: 一个功能极其强大的多用户多用途信息分享系统,内置手机版、后台内置自动原创发贴机器人、SEO蜘蛛统计系统、百度PING等多种特色功能;让你建站更轻松、更方便、搜索引擎收录更快捷、流量来得更猛一些; ...

    百度QQ号码搜索(BaiduQQScan) v2.4

    它可以全天候24小时无人值守工作,是一个真正的QQ号码搜索机器人,为您通过QQ营销方式推销或采购产品助一臂之力。搜索到的号码可以保存为一行一个QQ号码的文本文件,该文件可以直接被配套的新狐QQ发送软件导入后点击...

    无限智能建站的MAIYIGO全自动SEO整站源码

    百度谷歌收录都几千,PR从1升到2,访问量倍增, 达到500IP/天,假如开20个站,价值就更大了, ·智能全自动建站系统:你要做的仅仅是设置几个关键词 ·全自动更新:MAIYIGO自动寻找信息,随时自动更新 ·在线的...

    midjourney辞典.zip

    它可以应用于许多不同的场景,包括新闻报道、广告、社交媒体、博客文章等。以下是一些AIGC的应用场景和使用方法: 新闻报道:AIGC可以用于自动撰写新闻报道,以便更快地产生大量的新闻内容。这对于那些需要快速反应...

    招银国际-20230209-ChatGPT &amp; AIGC在中国市场的发展前景

    例如阿里巴巴、百度和腾讯在几年前便开始部署 AI 及类 ChatGPT 技术发展, 在不久的将来会优先从企业端变现开始实现技术商业化。由于中国有丰富的电 商、教育、线上客服、金融、广告、软件开发、提升工作效率等商用...

    ChatGPT&AIGC在中国市场的发展前景-230209

    例如阿里巴巴、百度和腾讯在几年前便开始部署 AI 及类 ChatGPT 技术发展, 在不久的将来会优先从企业端变现开始实现技术商业化。由于中国有丰富的电 商、教育、线上客服、金融、广告、软件开发、提升工作效率等商用...

    GPT4.0完整使用-秘籍宝典:如何GPT大语言模型提高工作效率探索未知领域37节课-教程网盘链接提取码下载.txt

    课程目录 1本课程学习内容 ...31Python接入百度千帆大模型平台实战:聊天机器人 32Python接入百度千帆大模型平台实战AI客服助理 33机器学习线性回归模型 34机器学习SVR回归模型 35机器学习决策树回归模型

    贱贱客服系统 v1.1 (单用户多客服版)测试版.zip

    获得来路信息以及关键字 - 目前只设置了百度来路关键字! 客服可自定义聊天信息框中广告图片 客服可以发送邀请,邀请后客户接收页面显示邀请客服名称并且抖动及声音提示! 对接状态为3种(在线访问网址...

    AIUIChatSDK:语音方案:百度语音库 baidulib、讯飞语音AIUI库 chatsdk、讯飞语音msc库 iflylib;支持全双工语音识别,边听边识别,适合快速集成,体验效果

    :是对AIUI的语音SDK封装,套餐费用最低在6万/年 ...场景:(语音点读笔、AI机器人、智能音箱、车载语音、家电语音、人机交互、在线教育机器人、语音鼠标、实时翻译、大屏广告互动、...) 落地产品公司:

    人工智能行业展示.pptx

    智能广告、智能诊断、自动写作、身份识别、智能投资顾问、智能助理、机器人等场景应用和解决方案。 金融:蓝海智投、招商银行、安邦金融、蚂蚁金服。 安防:海康威视、东方网力。 无人机:大疆创新、零度智控。 ·...

    百度地图毕业设计源码-algorithm-and-risk-management:风控、大数据、算法

    百度地图毕业设计源码 @toc 一、互联网业务风控 1. 不同场景下的业务风控 1.1 账户业务风控 1.1.1账户安全 账号安全是所有强账号体系应用的基础,强账号体系,如电商、网游、第三方支付、社交网络、即时通讯等;是...

    贱贱客服系统 v1.0 beta2

    客服可自定义聊天信息框中广告图片客服可以发送邀请,邀请后客户接收页面显示邀请客服名称并且抖动及声音提示!对接状态为3种(在线访问网址状态,开启聊天窗口状态,已经与客服对接状态),未读消息数量。绑定客户聊天...

    深蓝搜索引擎dbse.rar

     深蓝搜索引擎由面向用户的Web搜索界面、自动网页索引机器人深蓝之蛛、发布广告和进行关键词竞价排名的深蓝商务中心和独立的数据库系统几大部分组成。其中前台WEB部分用ASP编写,后台数据库采用Microsoft SQL ...

    易心博客 v3.5 手动安装版.rar

    7.完善的广告发布策略,使您轻松的可以在博客中增加广告代码。 8.操作简便人性。所有的功能尽量在后台完成,并且控制在三步之内。避免修改代码来实现某些功能。 9.自动存图。博客站点外的图片保存到博客中。避免了...

    易心博客 v3.5 自动解压版.rar

    7.完善的广告发布策略,使您轻松的可以在博客中增加广告代码。 8.操作简便人性。所有的功能尽量在后台完成,并且控制在三步之内。避免修改代码来实现某些功能。 9.自动存图。博客站点外的图片保存到博客中。避免了...

Global site tag (gtag.js) - Google Analytics