POPPUR爱换

 找回密码
 注册

QQ登录

只需一步,快速开始

手机号码,快捷登录

搜索
查看: 865|回复: 0
打印 上一主题 下一主题

Google新专利展示“相似引擎”

[复制链接]
跳转到指定楼层
1#
发表于 2007-1-7 14:17 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
根据美国商标和专利专利管理局最新公布的资料,Google公司申请了一份名为“相似引擎”的专利,能够比较文档和网页的相似性。

现今的搜索引擎都会遇到这样的问题,搜索结果经常是许多一模一样的信息,或者非常类似。通过“相似引擎”的引入,Google将能够增强搜索结果的独立性,隐藏无用的重复数据。Google在专利文档中这样写道:从搜索引擎的观点来看,为大量网站编制索引的一个问题在于,许多网站的文档是相似或者相同的。为相似文档分别索引会降低我们的效率,而列出一大堆相同的结果也会让用户感到不悦。因此,搜索引擎迫切需要能够鉴别相似或相同的文档,提高自身的工作效率。

据Google的说法,该“相似引擎”基于一种向量算法,他们需要为网页创建校验数据以及他们命名的“草图”,搜索引擎利用这些数据,经过计算区分网页上文本甚至图形的异同。“相似引擎”就是要为一个对象创建向量,然后和其他对象的向量作比较的算法。

除了搜索引擎中的应用,Google公司还在专利中描述可以把该算法运用在文章,表格,幻灯片等常规办公文件的比较上。该专利也并非业界首创,IBM,日立和Visage公司都曾经申请过类似发明的专利。在近10年间,共有过15项专利是关于此领域。
您需要登录后才可以回帖 登录 | 注册

本版积分规则

广告投放或合作|网站地图|处罚通告|

GMT+8, 2025-2-28 03:46

Powered by Discuz! X3.4

© 2001-2017 POPPUR.

快速回复 返回顶部 返回列表