分享| Share!

10:37:29 / 2013年05月10日

#谷歌#的新智慧或能震撼世界

Google的#搜索引擎#得到了很大的改进。

现在,通过使用名为“知识图谱(Knowledge Graph)”的信息库,谷歌搜索不仅能返回链接列表,还另外提供某些有用的背景信息和细节。在谷歌中搜索某些人物、地点或事情时,在正常的搜索结果旁,会显示一个事实框。“知识图谱”已开始出现在某些其他的Google产品中,并可以用来让所有的谷歌软件变得更加智能化。

“以前,搜索主要是通过匹配单词和短语,而不是根据它们的真实含义来进行搜索。”来自谷歌搜索团队的“知识图谱”项目技术指导沙希达尔-塔库尔(Shashidar Thakur)说。他说,开发“知识图谱”项目就是为了改变这种状况。

可以将“知识图谱”视为1个庞大的数据库,通过它,谷歌软件就可以将有关人物、地点和事情的信息彼此联系起来。在2010年收购了Metaweb这个新兴公司以后,谷歌就启动了“知识图谱”项目。当时,它只有1200万个词条。而如今,它包含了5亿多个词条,词条之间的链接超过了35亿个。

“知识图谱”储备了如此丰富的知识,其用途不应仅仅局限于网上搜索。塔库尔说,“知识图谱”已经被嵌入YouTube当中,用来对视频进行主题分类,并根据用户最近的观看记录,向用户推荐新的视频。它还可以根据故事中提到的具体信息,链接到相关新闻文章和推荐给用户。“知识图包含着非常广泛的资源,就像可供我们查阅的基本事实库(ground truth)。”

使用谷歌进行传统搜索时,搜索算法根据用户在搜索框中输入的内容,返回与之相匹配的搜索结果,而不是根据其含义返回搜索结果。谷歌所使用的算法首先会参考以往的搜索数据,根据单词在历史用户搜索中的使用频率,确定查询字符串中哪些单词最为重要。接下来,软件会找到已知的包含了相关信息的网页,这称为反向索引。最后,软件再次进行计算,对搜索结果进行排名,然后展示给用户。如果幸运的话,用户能够在那些网页中找到自己想要的内容。

通过“知识图谱”,谷歌提供了某种新的搜索方法,该方法试图采用复杂得多的方式,对用户要搜索的内容进行解析,然后直接返回相关信息。

然而,这种新方法仍然会使用历史搜索数据来确定哪些信息的相关度最高。例如,人们在搜索电视节目时,通常会加上“cast(演员)”这个词,这样,当“知识图谱”中的某个剧集被找到时,通常也会列出相关演员。塔库尔说:“这是个学习的过程,通过用户进行的查询,我们了解到他们的兴趣所在。”这也有助于谷歌在“知识图谱”内的众多概念之间找到新的联系。塔库尔说,词条和词条之间的链接数量都在快速增长,但他拒绝透露到底增长得多快。

塔库尔不愿谈论“知识图谱”接下来会运用在哪里,但这种技术似乎有可能出现在谷歌的多种产品上。蒂姆-伯纳斯 - 李等网络先驱早就讨论过“语义网络”的构想,在这种网络中,软件可以解析网上信息的含义,而“知识图谱”的诞生,似乎向这个构想迈进了一大步。

然而,语义技术公司OpenLink Software的创始人金斯利-伊顿(Kingsley Idehen)认为,“知识图谱”并未真正推进语义网络的发展,这是因为,它尽管使用维基百科和Freebase等公开数据源进行编译,却不能公开访问。伊顿说,如果谷歌开放“知识图谱”,允许其他公司的产品使用,那么互联网在整体上就会取得很大的进步。

“他们发布了解决方案,却又故意将它封闭起来。”他说,并将“知识图谱”与Facebook自带的知识库“开放图”做了比较。“开放图谱”是公共资源,软件可以利用它来访问音乐、电影、食谱以及其他信息。伊顿认为,这些开放式解决方案“允许公众访问它们的数据库,确实推动了网络向全球性数据空间的转变”。

谷歌发言人拒绝透露谷歌是否将开放“知识图谱”,但这个发言人指出,用户和软件可以通过Freebase免费获取“知识图谱”所包含的部分信息。Freebase是Metaweb在被谷歌收购之前创办的网站。然而,“知识图谱”比Freebase更为完善,而且谷歌正在继续对其进行优化。维基百科背后的基金会有个WikiData项目,谷歌也属于该项目的主要资助者。这个项目旨在创建一个可供机器访问的知识库,如果它像维基百科那样迅速发展起来,这个库可能会变得非常大。

而谷歌公司的塔库尔说,他目前的当务之急是,想办法利用“知识图谱”来解决更复杂的搜索问题,其中部分问题似乎与“知识引擎”Wolfram Alpha所解决的问题相似。“当前,我们只能完成独立词条的搜索,但还有更难的搜索问题,比如‘18世纪爆发的火山’或‘根据书改编而成的电影’。”

*引自:http://www.techreviewchina.com/story/3915.htm


支持

ad ad ad ad

能为您做什么?

我们专注于 软件开发硬件集成算法设计逆向破解。全面为您提供策划,架构,实施,测试,外包的贴心服务。

更多

我们的特点

自主JAVA框架、以及SGUI带给您的项目更个性、更实用的用户体验。拥有各语言、平台相关的开发经验、技术文档积淀,让项目可维护性更高,更安全。

TAGS:逆向与反逆向技术研究SGUIGUI成都软件开发软件开发成都软件外包成都软件定制成都软件公司硬件集成,SUODR,C++,C,汇编,CPU指令,算法设计,C#,PHP,JAVASCRIPT,ACTIONSCRIPT,外包服务。


联系方式

地址:成都市高新区益州大道中段722号复城国际T2栋1409号
EMAIL: clema#qq.com(#换成@)