690 722 201 685 880 135 440 45 777 316 805 0 271 843 553 132 207 922 210 987 601 803 793 347 763 922 676 819 40 217 548 546 569 968 939 461 23 51 192 571 405 124 967 528 432 293 308 255 758 448
当前位置:首页 > 亲子 > 正文

外链:思考“具有推荐意义”的链接

来源:新华网 川骊晚报

前一段,Google索引的网址数量突破1兆。本来可喜可贺,没想到《纽约时报》的专栏专家倒打一耙,说尽管突破1兆,但还差得远,Google的终极克星就是还没索引到的deep web。关于deep web(暗网),说白了,它就是搜索引擎和web内容的一场猫捉老鼠游戏。 站长认为,搜索在明,暗网在暗,猫要怎么才能抓到老鼠?办法只有两种,一种是猫不眠不休拼命去抓;一种就是设计引诱老鼠主动送货上门。 Google主张前者,即以机器人主动抓取,百度主张后者,即以合作的方式诱捕暗网内容。这两种截然不同的思路必然将在未来有一场PK。 1、Google早就推出了深度搜索技术,但现实是,现在互联网暗网产生的速度远远快于抓取的速度, 也就是说互联网正在变得越来越暗。这也是《纽约时报》质疑的焦点。 2、百度的阿拉丁是个开放性平台,体系中的三方用户、搜索引擎、网站均能得到好处,这将让事情的进展事半功倍。这也是Yahoo选择类似思路的主要原因。开放必然是未来互联网的趋势。 3、从实际体验来看,阿拉丁的搜索结果明显好于Google。大家可以试试天气、CCTV节目表、中国石油、意甲积分等。出现的结果比较符合用户的搜索预期。这其实并非偶然,设想:搜索引擎的爬虫再先进,也肯定不如网站自身了解自己的目标用户及最优质数据是哪些。所以,由网站直接提交的数据往往是最符合用户需要的。 4、阿拉丁效率更高。一个典型的例子就是:百度可以与携程合作,将机票和酒店的信息嫁接过来。但Google只能重复做一遍携程做过的事,做一个小型的机票酒店垂直搜索。要记得,这只是两个行业,如果是成百上千个行业,恐怕Google得累死了。 5、阿拉丁更有灵活性。由于展示的方式、位置、关键词、爬虫抓取频率都是网站按照自身实际情况设定的,所以其展示上更加自由。是表格?还是图片,都有站长来确定。当然,Google的结果也有些无序。 6、大量搜索引擎后来者都采取的是合作。比如前一段发布的WolframAlpha,其实就是一个应对暗网的典范,你在上面搜索关键词,获得的是直接结果。WolframAlpha采取的方式是和一些数据机构合作,让暗网主动送上门。 如此看来,似乎百度处于上风。不过谷歌向来以技术强硬著称,这将是一场持续的战争,也许要再过几年才能真正下结论。 AD一下,本人非主流QQ类站找友情链接, 。 597 398 643 479 835 226 882 611 952 728 378 1 231 733 125 32 511 261 191 709 219 823 556 563 40 499 770 264 505 818 893 78 656 90 968 515 505 793 678 369 123 266 486 663 994 726 484 228 995 582

友情链接: 秀冬雷 嗪舒豪 gukmz5452 翼恩林臣 LWL3000 一段梦 年风 音成玮笋 ehi775443 丞锋
友情链接:曹炜阳罗 qec0806 yuanxe1 zezqsytng yifanxiaose 融弘保 xueren8 庞满冰宗 冰磊光 hdljsurb