搜索组部门经理 王文峰
wangwenfeng@360buy.com
探讨QQ群:288689084
京东搜索分享
1、京东搜索原理和结构
2、京东搜索相关性及排序
3、京东搜索功能简介
4、京东搜索后台录入
5、京东搜索评测规范、搜索词及搜索问题提交
内容简介
1.爬虫和抓取
搜索引擎派出一个能够在网上发现新网页并抓文件的程序,这个程序通常称
之为蜘蛛。搜索引擎从已知的数据库出发,就像正常用户的浏览器一样访
问这些网页并抓取文件。
2.索引
蜘蛛抓取的页面文件分解、分析,并以巨大表格的形式存入数据库。...
搜索引擎结构
文档 文本提取 索引程序
索引库(Lucene)
搜索查询服务器(Solr)
文件
数据库
爬虫
NBA 搜索
1、搜索相关性
2、搜索排序
3、搜索框下拉词表
4、搜索类目筛选
5、搜索属性筛选
6、相关搜索及纠错
7、分类导航
搜索主要功能
1、仅标题部分、广告词、类目建索引、用户搜索到的商品需在标题中出现
2、按字切词、索引,保证查全率
3、精确匹配与模糊匹配
4、相关性权重涉及因素:词频、词间距、是否有广告词
5、标题中应含有品牌、型号、类别、关键属性、功能、别称等
6、搜索词...
1、相关性排序计算:标题、类目、属性、销量、评论数、价格等因素的综合
2、交易性排序计算:销量、价格
3、评论数排序计算:好评度、评论数计算
4、时效性排序计算:上架时间
5、综合各种相关性与商品的商业属性综合算出的排序分值。
搜索排序原理
1、销量排序:七日销量,价格权重,好评度
2、价格排序:按照商品的价格进行高低排序
3、好评度排序:好评度、全部评论数综合因素
4、商品上架时间:按照商品上架时间排列
搜索排序筛选
搜索下拉框提示:
数据来源:用户搜索词,搜索日志
排序:按照相关性进行排序
更新日期:每月更新,采销可提供词表
搜索框下拉提示
1、展示二级类目
2、点击进入三级类目,同时在二级类目下搜索
3、按照类目数量排序
4、进入三级类目进行属性筛选
搜索类目筛选
1、当用户输入三级类目词时,直接展示属性筛选页。
如:用户输入“硬盘”,直接出现属性筛选结果页进行筛选。
2、当用户输入其他词时,直接展示类目筛选页,用户点击
具体类目进入该产品属性进行筛选。
如:用户输入“诺基亚”,直接展示所有类目,用户点手...
1、属性设置为重点属性,关键属性,用户常用属性
2、点击具体类目进行筛选
3、扩展属性在后台类目的使用,扩展属性中三级类目中排序号的顺序设置为
正确排序
4、http://search.360buy.com/search?keyword=童装&...
1、后台扩展属性设置中排序
2、品牌属性中属性排序的设置
扩展属性后台
相关搜索及纠错
数据来源:用户搜索词,搜索日志
排序:按照相关性、搜索量进行排序,同时也有智能化推荐
更新日期:每月更新
相关搜索及纠错
数据来源:用户搜索词,搜索日志
排序:拼音纠错、错别字纠错
更新日期:每月更新、采销可以提供各自纠错词
搜索纠错
1、搜索结果不好搜索词及搜索案例
2、同义词及映射词
3、纠错词
4、新词添加
搜索词和搜索反馈的提供
Q&A
of 17

京东商城Pop商品搜索原理

Published on: Mar 4, 2016
Source: www.slideshare.net


Transcripts - 京东商城Pop商品搜索原理

  • 1. 搜索组部门经理 王文峰 wangwenfeng@360buy.com 探讨QQ群:288689084 京东搜索分享
  • 2. 1、京东搜索原理和结构 2、京东搜索相关性及排序 3、京东搜索功能简介 4、京东搜索后台录入 5、京东搜索评测规范、搜索词及搜索问题提交 内容简介
  • 3. 1.爬虫和抓取 搜索引擎派出一个能够在网上发现新网页并抓文件的程序,这个程序通常称 之为蜘蛛。搜索引擎从已知的数据库出发,就像正常用户的浏览器一样访 问这些网页并抓取文件。 2.索引 蜘蛛抓取的页面文件分解、分析,并以巨大表格的形式存入数据库。 3.搜索词处理 在搜索引擎界面输入关键词,单击“搜索”按钮后,搜索引擎程序即对搜索 词进行处理,如中文分词处理,判断是否需要整合类目属性信息,判断是 否有拼写错误或错别字等情况。搜索词的处理必须十分快速。 4.排序 对搜索词处理后,搜索引擎程序从索引数据库中找出所有包含搜索词的商品 ,并且根据排名算法计算出哪些网页应该排在前面,然后按照一定格式返 回到“搜索”页面。 搜索引擎原理
  • 4. 搜索引擎结构 文档 文本提取 索引程序 索引库(Lucene) 搜索查询服务器(Solr) 文件 数据库 爬虫 NBA 搜索
  • 5. 1、搜索相关性 2、搜索排序 3、搜索框下拉词表 4、搜索类目筛选 5、搜索属性筛选 6、相关搜索及纠错 7、分类导航 搜索主要功能
  • 6. 1、仅标题部分、广告词、类目建索引、用户搜索到的商品需在标题中出现 2、按字切词、索引,保证查全率 3、精确匹配与模糊匹配 4、相关性权重涉及因素:词频、词间距、是否有广告词 5、标题中应含有品牌、型号、类别、关键属性、功能、别称等 6、搜索词与类目关系:商品相关性与商品分类、用户点击有关 7、业务原则和用户搜索原则;例如:用户搜索:“篮球” 搜索相关性原理
  • 7. 1、相关性排序计算:标题、类目、属性、销量、评论数、价格等因素的综合 2、交易性排序计算:销量、价格 3、评论数排序计算:好评度、评论数计算 4、时效性排序计算:上架时间 5、综合各种相关性与商品的商业属性综合算出的排序分值。 搜索排序原理
  • 8. 1、销量排序:七日销量,价格权重,好评度 2、价格排序:按照商品的价格进行高低排序 3、好评度排序:好评度、全部评论数综合因素 4、商品上架时间:按照商品上架时间排列 搜索排序筛选
  • 9. 搜索下拉框提示: 数据来源:用户搜索词,搜索日志 排序:按照相关性进行排序 更新日期:每月更新,采销可提供词表 搜索框下拉提示
  • 10. 1、展示二级类目 2、点击进入三级类目,同时在二级类目下搜索 3、按照类目数量排序 4、进入三级类目进行属性筛选 搜索类目筛选
  • 11. 1、当用户输入三级类目词时,直接展示属性筛选页。 如:用户输入“硬盘”,直接出现属性筛选结果页进行筛选。 2、当用户输入其他词时,直接展示类目筛选页,用户点击 具体类目进入该产品属性进行筛选。 如:用户输入“诺基亚”,直接展示所有类目,用户点手机类目,则 直接进入该类目下手机的产品属性进行筛选。 3、用户搜“诺基亚”→→点击“手机”类目,→→进入属 性筛选页→→进行属性筛选 搜索类目筛选
  • 12. 1、属性设置为重点属性,关键属性,用户常用属性 2、点击具体类目进行筛选 3、扩展属性在后台类目的使用,扩展属性中三级类目中排序号的顺序设置为 正确排序 4、http://search.360buy.com/search?keyword=童装&cid=3962 搜索属性筛选
  • 13. 1、后台扩展属性设置中排序 2、品牌属性中属性排序的设置 扩展属性后台
  • 14. 相关搜索及纠错 数据来源:用户搜索词,搜索日志 排序:按照相关性、搜索量进行排序,同时也有智能化推荐 更新日期:每月更新 相关搜索及纠错
  • 15. 数据来源:用户搜索词,搜索日志 排序:拼音纠错、错别字纠错 更新日期:每月更新、采销可以提供各自纠错词 搜索纠错
  • 16. 1、搜索结果不好搜索词及搜索案例 2、同义词及映射词 3、纠错词 4、新词添加 搜索词和搜索反馈的提供
  • 17. Q&A

Related Documents