一种读者图书借阅二分网络中的优质图书迭代识别算法
为了给图书馆读者用户提供更满意的个性化推荐图书,我们必须在两方面做出有效的工作:一是如何来准确的识别用户可能感兴趣的图书主题或者类别,不像图书,读者用户一般没有完整直接的兴趣特征标识。常用的方法往往是采用读者所借图书的主题信息来间接表达读者的兴趣特征,然而我们也注意到,读者在借阅时并非始终对某种既定主题保持着浓厚的兴趣,有时也因为能力和专业水平的差距,大量的所借图书可能并非自己最终所要的图书,甚至还有可能借到一些质量并不高的相关图书。这些图书在很大程度上并不能很好的代表着用户的兴趣特征,因此直接利用所借图书的主题信息来间接识别读者信息存在着需要改进的环节;二是如何有效识别不同图书的质量,从而为读者推荐更可能使其满意的图书。传统的方法一般借助于借阅量这个指标,也就是说那些被更多人所借的图书通常也可能会被当前用户所借阅,然而我们认为具有较高专业知识背景的读者应该比一般随便借阅的读者对所借图书具有更高的认可能力,所以传统做法显然忽略了不同读者对自己所借图书的不同推荐能力。同时,由于读者兴趣的广泛性,使得某些专业性较强的图书一般在借阅量上极大的低于某些通俗类图书,这也从另一方面给以单纯使用借阅量为主的推荐方法带来不利影响。
从一定程度上讲,上述第二个问题的解决方法也有助于对第一个问题的解决,正是我们无法探知图书的真正质量所以我们无法准确的从现有的读者借阅信息中识别出最有价值的所借图书信息。
基于该算法,可以提出三种可以应用在个性化图书服务中的推荐模式,分别是特定主题的图书推荐、现有所借图书的修正型推荐和新书推荐。测试网址为:http://www.njmars.net:8088/libs。
一)特定主题的图书推荐实验结果
我们对常见的几种图书类别和关键词进行了查询测试,实验表明对于某主题领域下的高质量图书而言,本文所设计的方法能够比简单借助借阅量方法,对于专业性较强的图书,具有更好的识别效果,尤其在某个特定的主题领域所涉及的图书总数不多的情况,更易于发现该主题领域的高质量图书。
“信息检索”主题相关的图书推荐结果截图
二)现有所借图书的修正型推荐实验结果
如对“搜索引擎”相关图书而言,我们得到了5条初始图书记录,如果选中第一本《搜索引擎广告:网络营销的成功之路》,并将调节参数设定为8,即表示只取标题相似度最高的前8本图书,得到的修正型推荐结果皆与搜索引擎和广告营销密切相关
与搜索引擎和广告营销密切相关“搜索引擎”推荐结果截图
而如果选中第四本《搜索引擎与信息获取技术》,则获得的修正型推荐结果完全和前者不一样,更侧重于搜索引擎技术方面的介绍
与搜索引擎技术密切相关“搜索引擎”推荐结果截图
三)新书推荐实验结果
在实验中,我们仅对读者用户进行了用户个性化模式的表达能力测试。如“A023”读者,该读者共有226条借阅记录,在按照新书推荐算法得到的相关读者兴趣模式中,主要的读者兴趣特征有“TP311”类和“TP312”类等,其中每个最能反映用户兴趣特征的关键词
读者“A023”的用户个性化模式的展示效果截图