寻一好的解决方案【关于产品所归分类的选择问题,涉及Lucene排名】
本帖最后由 wzwaini527 于 2011-11-07 10:30:25 编辑
先列出几种产品名称情况:
①、乐歌 液晶电视机可调节壁挂架 伸缩摇臂 万向旋转 多功能通用32 50寸PSW771 【分类1:液晶电视 2:挂架】
②、松下 DMP-BD75GKK 蓝光DVD 播放机 【分类1:蓝光DVD 2:播放机】
③、XXXXXXXXX超薄屏幕保护膜XX笔记本电脑专用xxxx 【分类1:笔记本电脑 2:保护膜】
④、华帝CXW-200 i11006中式抽油烟机 【分类1:油烟机】
以上4条产品存在两种情况,1是标题中包括两个分类名称 2是标题中包含一个分类名称。
在lucene中将分类名称创建了索引包含(液晶电视,挂架,蓝光DVD,播放机,笔记本电脑,保护膜,油烟机……),在根据分类将产品名称分词后,到分类索引中查找,可以得出标题中所含的所有分类,也就是有的含一个,有得含两个。
针对这样的返回数据,我不能明确的得出此产品到底属于哪一个分类,寻求高手指点一下,可以通过某种条件的限制来解决这种多个分类之间的取舍问题。将①归档为分类【挂架】②为【播放机】 ③为【保护膜】④依然归档为【油烟机】。
谢谢!!!比较棘手,高手们帮忙出出主意!!!
------解决方案--------------------我试图尝试了 使用树形来约束分类
例:
<maincat value=屏幕保护膜>
<option>笔记本电脑</option>
</maincat>
当产品中同时存在分类【笔记本电脑】和【屏幕保护膜】的时候 取【屏幕保护膜】
但是对于大数据量的维护,标题分类不规则,后期的维护会很麻烦! 希望能找到更好的解决方案来解决!