10月22日,在2016英特尔中国行业峰会的“互联网高峰论坛”上,搜狗公司首席架构师周天凌发表了“智能时代的搜狗企业搜索”主题演讲,面向参会的数百家企业首次深入介绍了搜狗企业搜索业务及优势,受到了与会者的关注并引发了现场热烈讨论。
(搜狗首席架构师周天凌演讲现场照片)
搜狗搜索是中国第二大搜索引擎,从2004年上线至今已经超过12年,用户数高达5.6亿,覆盖中国95%的互联网用户。搜狗企业搜索则是其近期推出的面向企业级客户的新业务,在自身追求技术创新突破的同时,搜狗搜索把搜索引擎组件化、平台化、服务化,形成了对各个网站的搜索开放能力,致力于为社会机构、企业及组织提供先进的搜索技术支持与服务,以期为更多合作伙伴的直接用户带来站内搜索体验的升级。
论坛上,搜狗首席架构师周天凌表示,搜狗企业搜索将12年来搜狗搜索在To C领域所积累的成熟领先的技术进行输出,应用最先进的大数据挖掘、自然语言处理、机器学习排序,以及最前沿的基于深度学习的语义计算等智慧搜索技术,帮助企业更好地读懂用户查询背后真正的需求,并给用户提供更精准的搜索结果,带来搜索体验升级。
(搜狗企业搜索展台吸引了国内外行业用户驻足)
针对企业搜索目前面临的各种问题,搜狗企业搜索在为网站提供专属搜索服务上优势明显,主要可以总结为几个方面。
搜索结果的实时性、全面性
对于新发现的页面,会实时进行页面分析、建立索引并被用户检索到。页面从发现到被检索延迟在分钟级内,一般重要页面可以做到秒级延迟。根据具体情况,网站也可以将新增网页实时推送至站内搜索系统,进而建立索引并被检索,采用实时推送模式,页面从产生到被检索到的延迟可以控制在秒级内。
在对查询意图进行深入理解的基础上给出精准结果
搜索系统会对用户查询进行多维度分析,包括查询纠错、实体识别、同义词扩展以及查询意图识别等,并根据查询词权重进行查询改写,以保证召回符合需求的文档。进而会对召回的文档进行与查询的匹配计算,在计算时会融合多维度特征,包括页面特征、文本相关性、查询时效性、页面权威度、用户行为特征等进行深度学习排序,将最满足用户需求的文档排在前面。
系统具有高可用性和稳定性
搜狗企业搜索系统继承了搜狗搜索的高性能与高稳定性,在单节点千万级网页量情况下,用户平均查询时间在100ms左右。搜狗搜索系统经过了长时间、大数据量以及高压力的考验,对各种异常情况进行了完善处理,其系统稳定性在99.99%+。
系统对接方便,简单易用
使用搜狗企业搜索系统,企业只需要提供网站数据以及进行结果展现。在数据提供上,用户可以选择数据推送和spider抓取两种方式。另外,搜狗企业搜索提供了丰富的结果展现样式,企业只需简单调配颜色、添加网站Logo即可使用。
在提供基本搜索服务同时,搜狗企业搜索系统还提供了完善的监控与运营数据查询功能。通过监控及统计系统,可以查询检索量、索引量、检索耗时、热搜词等,及时掌握应用的运营情况,同时提供完善的监控报警及故障应急机制,保证应用的正常运行。
周天凌向与会者说明了搜狗企业搜索的发展历程,并结合2016年4月搜狗企业搜索为清华校园搜索系统(http://search.tsinghua.edu.cn/)提供整套校园搜索服务的案例,对搜狗搜索成熟的校园搜索解决方案进行了展示。通过对清华校园网搜索日志进行分析,搜狗企业搜索总结出用户检索需求主要分为导航类、信息公告类查询、人物类查询几种,并针对这几种查询需求演示了具体的解决方案。
例如,对于查询词“美院”,搜狗企业搜索引擎对其进行查询分析,将其扩展为“美术学院”,同时对官网页面及时效性页面进行分析并与查询词进行匹配计算,最终返回用户所需要的文档,效果如下图所示。
信息公告类查询是学校师生需求比较强的一类查询,从检索日志中可以看出,有大量的查询公告的请求,比如“暑期夏令营”、“暑期社会实践”、“毕业离校通知”等。搜狗提供的站内搜索系统可以做到将页面秒级内建立索引并被检索,保证结果的时效性。此外,为了能够让用户更好检索到最新信息,搜狗提供的站内搜索引擎在显著位置设置了时间筛选功能,比如查询“领军计划初试结果”,可以进行“一天内”或者“一周内”等筛选,以便更精准获取所需结果。
(清华大学官网搜索结果截图)
除了搜狗企业搜索本身的优势介绍之外,周天凌还提及了搜狗在技术研发方面的实力背书,据悉,2015年搜狗的2400余名员工中,研发人员所占比例高达76%,中国所有互联网公司中排名最高;技术专利排名行业第3,仅次于腾讯、百度。
现今,越来越多的网站对于搜索功能有更高的需求,而真正实用的搜索功能不只是查询词的精确匹配,还需要对用户的查询以及要检索的文档进行理解,并进行多维度的相关性计算,找出真正满足用户需求的文档,而这涉及到了计算机科学与技术领域最前沿、最复杂的技术。搜狗搜索具有强大的技术团队以及技术积累,并且具有成熟的技术输出经验,有能力并且有意愿为社会机构、企业及组织提供先进的搜索技术支持与服务,为更多合作伙伴的直接用户带来站内搜索体验的升级。
特别提醒:本网信息来自于互联网,目的在于传递更多信息,并不代表本网赞同其观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,并请自行核实相关内容。本站不承担此类作品侵权行为的直接责任及连带责任。如若本网有任何内容侵犯您的权益,请及时联系我们,本站将会在24小时内处理完毕。