登录世纪东方
账 号:
密 码:
验证码:
记住密码
忘记密码? 立即注册
您还可以使用以下方式登录:
尊敬的客户:          您好!
       
确定
尊敬的客户:
      您好!

尊敬的客户:
       您好!

       感谢您长期来对世纪东方的支持与关爱!
       很高兴的通知您,我司已于2013年5月6日正式升格为ICANN国际域名顶级注册商,并同时面向全国用户开放自有国际域名(.COM\.NET)注册接口。
       为了更好的给您提供完备的服务,让您更安全、更放心的使用世纪东方的产品,我们建议您将之前通过我公司在其他注册商处注册的域名转入我公司自有接口来管理和维护。
       为此,我们特别开通了域名转入便捷通道,您只需要在域名续费处一键确认续费并转入,即可享受到更优惠的域名价格和众多优质的域名服务。
       特别提醒:
       1、新网、万网域名转入需要在域名到期前8天进行操作续费,方可一键续费并完成转入世纪东方注册商接口;
       2、商务中国的域名转入需要在域名到期前18天进行操作续费,方可一键续费并完成转入世纪东方注册商接口;
       3、如有不明之处,请致电全国统一服务热线: 400-012-0151或者联系我们的在线企业QQ: 800061151
       因注册商【商务中国】的域名转出流程较为复杂和限制条件众多,需要您授权我们在域名转入前修改您的域名所有者邮箱为我公司专用的域名转入邮箱,我们将在域名转入完成后(或无法满足转入条件时)将域名所有者邮箱进行还原。(商务中国要求修改域名所有人邮箱后30天内无法索取域名转移密码且到期前15天及以后不能转出,获取转移密码后的当天必须操作转移否则会锁定该域名)。
同意 不同意
登录世纪东方
账 号:
密 码:
验证码:
记住密码
忘记密码? 立即注册
您还可以使用以下方式登录:
尊敬的客户:          您好!
       
确定
尊敬的客户:
      您好!

尊敬的客户:
       您好!

       感谢您长期来对世纪东方的支持与关爱!
       很高兴的通知您,我司已于2013年5月6日正式升格为ICANN国际域名顶级注册商,并同时面向全国用户开放自有国际域名(.COM\.NET)注册接口。
       为了更好的给您提供完备的服务,让您更安全、更放心的使用世纪东方的产品,我们建议您将之前通过我公司在其他注册商处注册的域名转入我公司自有接口来管理和维护。
       为此,我们特别开通了域名转入便捷通道,您只需要在域名续费处一键确认续费并转入,即可享受到更优惠的域名价格和众多优质的域名服务。
       特别提醒:
       1、新网、万网域名转入需要在域名到期前8天进行操作续费,方可一键续费并完成转入世纪东方注册商接口;
       2、商务中国的域名转入需要在域名到期前18天进行操作续费,方可一键续费并完成转入世纪东方注册商接口;
       3、如有不明之处,请致电全国统一服务热线: 400-012-0151或者联系我们的在线企业QQ: 800061151
       因注册商【商务中国】的域名转出流程较为复杂和限制条件众多,需要您授权我们在域名转入前修改您的域名所有者邮箱为我公司专用的域名转入邮箱,我们将在域名转入完成后(或无法满足转入条件时)将域名所有者邮箱进行还原。(商务中国要求修改域名所有人邮箱后30天内无法索取域名转移密码且到期前15天及以后不能转出,获取转移密码后的当天必须操作转移否则会锁定该域名)。
同意 不同意
云主机:推荐云I配置(1核、1G、50G SAS硬盘、独享10M),最低仅需148元/月
首页  >>   关于我们  >>   最新公告

京东亿级商品搜索核心技术解密

作者:世纪东方 点击数:3211 更新时间:2015-02-03 文章来源:世纪东方

京东商品搜索引擎是搜索推荐部自主研发的商品搜索引擎,主要功能是为海量京东用户提供精准、快速的购物体验。目前入口主要有PC/移动/微信/手Q搜索、移动列表页、店铺搜索、店铺列表等。虽然只有短短几年的时间,系统已经能够支持日均PV过亿的请求,并且经过了多次618店庆和双11的考验。


与人们日常使用的如谷歌、百度等大搜索(或称为“全文搜索”)引擎相比,京东商品搜索引擎与前者有相通之处,比如“覆盖海量数据”、“超高并发查询”以及“超快速的请求响应时间”,同时又有自身显著的业务特点:

  • 结构化的商品数据,需要从商品、库存、价格、促销、仓储等多个系统进行抽取;

  • 极高的召回率要求,保证每一个状态正常的商品都能够被搜索到;

  • 商品信息的及时更新,目的是为了保证用户极佳的购物体验——比如不能给用户展示出下柜的商品,或者商品的实时价格超出了用户搜索限定的范围。这就要求我们的搜索引擎要做到和各个系统的信息时刻保持同步,目前每天更新次数过亿;

  • 逻辑复杂的商品业务,需要存储的商品属性信息是倒排索引信息的2倍之多;

  • 用户购物的个性化需求,要求系统实现用户标签与商品标签的匹配。


正是由于既要兼顾大搜索引擎的通用需求,同时要契合京东的业务特点,我们将系统架构分为四个部分:1. 爬虫系统、2. 离线信息处理系统、3. 索引系统、4. 搜索服务系统。


为了使各位读者能够深入了解京东商品搜索引擎的架构,本文首先介绍了商品搜索的总体架构,然后依次介绍了爬虫系统、离线信息处理系统等各个部分,并且对搜索技术的最新研究方向做展望,希望对各位读者有所帮助。


总体架构

京东商品搜索引擎的整体架构如下图所示:


从上到下共分为3层。最上层是由搜索的前端UI层,负责页面展示。


中间层是由搜索索引服务、SUG搜索、相关搜索、划词服务和兜底服务组成。其中,SUG搜索提供输入框下拉提示词功能;相关搜索提供与query相关的其他搜索词服务;划词服务提供去除query部分词的功能;兜底服务用于索引服务异常情况下提供托底,保证用户基本的搜索可用。

最下层是索引生产端,主要功能是对接商品、库存、价格、促销、仓储等众多外部系统,整合相关数据生产全量和增量数据的索引,为在线检索服务集群提供全量索引和实时索引数据。


爬虫系统

商品搜索引擎的核心是建立商品索引,而建立索引需要详细的商品信息数据。我们利用大数据平台的数据库抽取接口和中间件系统,实现了站内商品爬虫系统,用来抽取数据库中的商品信息和及时发现变化的商品信息。从实践的效果上来看,爬虫系统表现是非常稳定和可靠的。


世纪东方微信二维码

扫一扫,三重优惠等您拿!
19113525901  
返回顶部  

©2002-2017 Oriental Century All Rights Reserved. 版权所有:成都世纪东方网络通信有限公司
《中华人民共和国增值电信业务经营许可证》ISP证编号:川B2-20030101号 蜀ICP备07500933号 营业执照