扩展下一代搜索引擎的个性化查询结果

北卡罗来纳州立大学的研究人员开发出一种搜索引擎方式,为用户提供更准确,个性化的搜索结果

过去的挑战是如何扩展这种方法,以便它不会消耗大量的计算机资源

现在,研究人员已经设计出一种实现个性化搜索的技术,其效率比以前的方法高出100多倍

问题在于搜索引擎如何处理复杂或混乱的查询

例如,如果用户正在搜索对金融信息学进行研究的教师,则该用户需要教师的相关网页列表,而不是提及使用这些术语的教师或新闻报道的研究生页面

这是一个复杂的搜索

“同样,当搜索含有多种可能的解释时,传统的搜索引擎会使用非个人技术

例如,如果用户搜索术语“美洲虎速度”,用户可能正在寻找有关捷豹超级计算机,丛林猫或汽车的信息,“北卡罗来纳州计算机科学助理教授Kemafor Anyanwu博士说

和研究论文的高级作者

“在任何时候,同一个人可能想要了解任何这些事情的信息,因此对用户进行剖析并不一定非常有帮助

”Anyanwu的团队提出了一种通过查看用户的“解决个性化搜索问题的方法”环境查询上下文,“意味着他们查看用户最近的搜索以帮助解释当前搜索

具体而言,它们超越了搜索中使用的单词以关联概念来确定搜索的上下文

因此,如果用户之前的搜索包含“保护”这个词,它将与“动物”或“野生动物”甚至“动物园”等概念相关联

然后,随后搜索“美洲虎速度”将推动丛林猫的结果结果更高 - 而不是汽车或超级计算机

最近一个概念与搜索相关联,在对新搜索的结果进行排名时给予的权重越大

搜索引擎还尝试识别搜索结果中用户点击行为的模式,以识别搜索的最可能的用户意图

然而,这些技术是非个人的并且在全球范围内应用

因此,如果一组关键字的最常用点击模式位于特定上下文中,则该上下文将成为与大多数或所有用户的查询相关联的上下文 - 即使您最近的搜索历史记录表明您的查询上下文是关于丛林猫的

“我们正在做的是不同的,”安安武说

“我们实时识别各个用户的搜索词的上下文,并使用它来确定用户在特定时间对特定查询的意图

这使我们能够比传统搜索引擎更有效地处理更复杂的搜索

此类搜索变得越来越普遍,因为人们现在使用Web作为支持不同类型任务的关键知识库

“虽然Anyanwu和她的团队在一年前开发了一种情境感知的个性化搜索技术,但挑战在于如何扩展接近

“因为为每个用户运行环境上下文程序会占用大量的计算资源,这是不可行的,”Anyanwu说

然而,Anyanwu的研究团队现在已经提出了一种技术,其中包括表示数据的新方法,为数据编制索引的新方法,以便可以有效地访问数据,以及用于组织这些索引的新计算体系结构

新技术有很大的不同

“我们新的索引和搜索计算架构允许我们使用8GB机器支持大约2,900个并发用户的个性化搜索,而早期的方法仅支持17个并发用户

这使得这个概念更加实用,让我们更接近下一代搜索引擎,“Anyanwu说

本文将于10月6日至9日在加利福尼亚州圣克拉拉举行的2013年IEEE大数据大会上发表论文“个性化搜索:多租户语义Web搜索系统中的并发扩展案例”

论文是海州富博士,曾任博士

NC州的学生

该论文由Hyeongsik Kim博士共同撰写

NC州的学生

该研究得到了国家科学基金会的支持

- 网络上:

上一篇 :为什么草莓闻起来像草莓
下一篇 像人类一样,虚拟脑能够做白日梦