友情提示:如果本网页打开太慢或显示不完整,请尝试鼠标右键“刷新”本网页!阅读过程发现任何错误请告诉我们,谢谢!!
报告错误
网络营销知识仓库-第15章
按键盘上方向键 ← 或 → 可快速上下翻页,按键盘上的 Enter 键可回到本书目录页,按键盘上方向键 ↑ 可回到本页顶部!
————未阅读完?加入书签已便下次继续阅读!
符合的目录链接。 Google的目录搜索服务可满足那些想要浏览某特定主题下相关信息的用户。 如果你的网站还未被DMOZ收录,那就赶紧行动吧。 如果你还在质疑目录列表对网站的重要性,我建议你去读一读Google搜索小贴士上的最后一段: “当无法确定查询条件时,我们推荐用户使用Google网页目录。它可有效限 定搜索范围,不会向用户显示其它类似但无关的网页。例如,若在“天文学”目 录下查找“土星”,则返回关于土星的信息。而在汽车目录下搜索“土星”时, 则返回通用公司“土星车”方面的信息资讯。当搜索范围涵盖太广时,使用目录 服务可有效缩小搜索范围。” Google欲自用户处了解他们想在目录下查找什么样的信息。等我讲到“主题 性页面级别”的时候,你就可以明白,Google是怎样来提供与目录主题匹配的搜 索结果的。1…2…3。Google的新闻搜索服务 Google新闻保留了三十天内所发生的较有价值的报道和头条新闻,用户可使 用其新闻搜索系统查找当前事件的新闻。新闻报道依照发布日期,相关报道数量 和新闻来源的受欢迎程度进行排序。 在一般性搜索中,我们可以看到搜索结果页顶端的部分新闻搜索结果,当用 户进行一般性查询时亦可看到相关的新闻内容。 目前尚为测试版的GoogleNews与其它搜索服务稍有不同,其新闻来源并不 仅限于象“纽约时报”这样的大型传媒。目前Google新闻搜索服务已有4;500家 传媒来源。尽管其它大型ICP网站也提供了重要新闻网站的链接,但在涵盖面和 消息来源上往往不如Google。1…2…4Google的图书检索服务 继亚马逊网站之后,Google也推出了其测试版图书搜索服务GooglePrint。用户可找到图书的简要节选,评论及作者简介等,甚至可能找到图书的外观照片。 搜索结果中还提供了在哪里可以买到这本书的相关链接以及Google的相关广 告。Google一直都在探索如何进一步提高搜索服务的水平,这次推出的图书搜 索服务的测试正是该公司不断改进搜索服务努力的一部分。目前该项服务所提供 的印刷图书数量仍十分有限,不过Google这个搜索巨人是不会让我们失望的, 让我们拭目以待吧。1…2…5。Google会推出更多搜索服务吗? Google不断地推出新的搜索服务,其目的无外为用户提供更好的搜索体验。 这不但对用户来说是个好消息,因为他们可以更加便捷地找到自己所需的信息, 而且对网站也是好事情。可能不久以后网站就只需针对目标群体来有的放矢,而 无须在日益庞大的搜索结果中喊破嗓子来招揽生意了。第二部分:探索Google PageRank新算法…对Google的新排名算法有多种猜测。此文仅做抛砖引玉之用。 2…1。Google的主题性趋向2…1…1。关于页面级别(PageRank)及Google的旧算法出现问题的原因 页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的“随 机运动”来告诉你哪些站点是最重要的。该系统模拟的是一个随机冲浪者跟进点 击某页面上的随机链接,至最深层页面时按“返回”按钮这一过程。页面的等级 越高,则随机网络冲浪者发现它的机率亦越高。 这种思路其实相当富有创意。一个网页的外部链接越多,则对任意网络冲浪 者来说,发现它的机会也就越大。同时,在页面级别算法系统中,页面越流行, 则其导入链接就越能从链接中受益—这是由于任意网络冲浪者发现这些链接的机会就越大。 在特定领域的研究论文查询方面,页面级别系统几乎无可挑剔。例如,如果 用户查询关于素粒子物理学研究方面的论文(或网页)文献集,则对于一个给定条 件的查询,页面级别的算法可以很快告诉你,哪些论文才是与该特定查询条件最 相关及最重要的论文,其原因就在于这些论文较其它论文的引用次数要多。 若互联网上的资源具有同一主题性,那么这种工作可说是尽善尽美了。但正 如我们所知道的,互联网上的资源涵盖了上百万甚至更多的主题,而且在人们的 实际生活中,查询用户所寻找的往往是一些具有特定主题的信息。所以虽然页面 级别系统考虑了所有链接,但却忽视了链接页面的主题性。 Google已试图将链接的文本内容计入排名算法来克服这一局限性。但精明的 搜索引擎营销商却通过在网络上到处建立充盈关键词的链接来欺骗Google的排 名算法。一种新的作坊式行业也随着PageRank应运而生—即有偿交换和交易一些 来自较高“页面级别”页的链接。 如果网站能够从毫不相关的站点购买或交易导入链接而使网站排名得到提 升的话,那么页面级别技术已然无法为绝大多数查询条件提供高质量的搜索结果 了。我们有理由相信,当Google这个世界最顶级的搜索引擎一旦发现其搜索结果 的质量开始恶化时,它是不会坐视不管的。2…1…2。新技术闪亮登场:主题性页面级别技术(Topic…SensitivePageRank) 2002年,斯坦福大学的一名博士生塔赫尔。哈维利瓦拉(TaherH。 Haveliwala)发表了一篇非常有意思的论文,名为“Topic…Sensitive PageRank(主题性页面级别计算系统)”。而更加有趣的是,一年之后哈维利瓦拉 成了Google的一份子。“主题性页面级别计算系统”通过对随机查询用户的随机运动增加一个“偏 差”来处理基本的页面级别计算系统所存在的问题。这个新的随机查询用户具有 明确的查询目的,并更感兴趣于跟进那些具有某个特定主题的相关网页上的相关 链接。这是一个相对而言较为新颖的思路,它解决了搜索结果的质量性方面的一 系列关键性问题。 毫无疑问,哈维利瓦拉将成为搜索引擎业界中一个举足轻重的角色。他已经 在搜索技术的其它领域方面进行了一些实质性的研究工作,包括如何更有效计算 页面级别方面的一些比较有趣的研究。 在最初的研究论文中,哈维利瓦拉描述了他是如何利用斯坦福大学的网络数 据库,对应于ODP(开放目录)的16个顶级目录的16个主题来计算“主题性”页面 级别得分。虽然该研究的主题和数据数量(8千万个网页)十分有限,但能够看出 这种新系统可改善搜索结果,且具备对查询用户感兴趣于何种主题的理解能力。 就在去年,当我回过头来再阅读这篇论文时,我注意到哈维利瓦拉所描述的 这种系统对搜索引擎来说还存在着两个问题。不过下面我们将会看到,这两个问 题现在都能得到妥善解决了。 第一个问题是充分拓展主题的数量。要想改善搜索结果,16个主题自然是远 远不够的。但由于Google的页面级别计算系统的代价非常之高,因而除非新系统 能够提供一些改进的措施,否则Google不大可能实施这个新系统。但随着这一领 域在过去的一年中的深远发展,因而我相信现在在主题数量上已不是大问题了。 第二个问题就是如何决定一个查询条件可能对应的主题–…当用户输入诸 如“自行车”一类的查询条件时,这个用户是想买自行车呢,还是想骑自行车旅游呢?下面我将为大家简单阐述一下Google可能会怎样匹配一给定查询条件以 最恰当的主题,以及为什么一些查询条件更容易受到影响的原因。2…1…3。关于AppliedSemantics公司及其专利技术CIRCA AppliedSemantics网络广告软件公司是互联网广告方面的专家,于2003年4 月份被Google收购。Google此举旨在加强搜索和广告功能。如今该公司的技术已 对Google产生了深远的影响。例如在Google的Adwords关键词广告系统中,为PPC 广告客户提供基于内容的广告就是采用了AppliedSemantics的AdSense技术。 事实上Google在这次收购中获利的还不止AdSense技术,AdSense的后台技术 其实就是AppliedSemantics公司所拥有的专利技术CIRCA。 CIRCA技术所基于的是一个独立语言并具有高度扩展性的本体论,这个本体 论中包含了上百万词语,词语含义及这些词语与其它自然语言中的词语之间的概 念性关系。由复杂的搜索技术所支持的本体论是对词语的多样性含义的概念性理 解的基础,它能够使计算机对信息进行更加有效的管理和检索,从而为搜索用户 更好的提供探索知识的机会。 CIRCA技术的作用就在于它可以确定对特定词语或短语的相关概念。该技术 目前被用来从众多内容中为广告客户提供相关广告服务,亦可应用于Google的关 键词词根还原系统。 尤其值得一提的是:CIRCA能够计算“短语A”对“概念B”的相关程度。例 如,如果用户查询“Coloradobicycletrips”,CIRCA能够将其与“Colorado” 地域,“骑车”,“旅游”等主题概念性地联系起来。这意味着它们能够计算其数 据库中不同的概念与用户查询条件之间的“距离”。这一点十分重要。 2…1…4。二者的有机结合:主题性搜索引擎的实现 现在我们对主题性页面级别和CIRCA都有了一定的了解,那么接下来的问题就是:这二者之间是如何有机联系的?换言之,Google如何结合这些技术来产生 一个更好的搜索引擎呢? 首先,让我们来设想一下:假如对于大量的(上百直至上千个)主题或概念, Google已然解决了如何计算其主题性页面级别的问题。 在Google过去所使用的页面级别系统中,计算结果的精准性是相当重要的。 但随着主题性算法的发展,不久我们就可能看到,也许速度快而且效果良好的近 似计算结果才是他们所需要的。从上述论文中我们不难看出这一点已然颇具可行性。 现在,如果用户再查询的话,则查询条件中的词语将至少与CIRCA数据库中 若干主题紧密匹配。Google完全能够基于用户所使用的查询条件及数据库中所包 含的主题之间的“距离”来提供“主题性页面级别”得分,从而向用户提供更好
温馨提示: 温看小说的同时发表评论,说出自己的看法和其它小伙伴们分享也不错哦!发表书评还可以获得积分和经验奖励,认真写原创书评 被采纳为精评可以获得大量金币、积分和经验奖励哦!