您好,欢迎来到易妖游戏网。
搜索
您的当前位置:首页基于用户偏好的个性化信息服务研究

基于用户偏好的个性化信息服务研究

来源:易妖游戏网
信息安全与管理信息与电脑China Computer&Communication2016年第2期基于用户偏好的个性化信息服务研究谢宗燃(成都信息工程大学,四川 成都 610225)摘 要:随着互联网发展的日新月异,其中承载的信息以及参与的用户都也飞速膨胀,要想在这浩如烟海的信息中找到自己所需要的资源变得不再简单,人们往往需要耗费大量的精力和时间去搜寻出那些对自己有用的信息,以至于很多用户迷失其中,相反,那些承载着有价值信息的Web也失去了本该属于自己的用户。因此,如何挖掘出用户的潜在偏好以及对信息的需求,并以此为用户搭建起与所需信息的桥梁,并为之提供方便快捷的个性化信息服务成为互联网发展中所必须解决的问题,一旦解决将大大改善互联网用户的体验。本文主要研究如何从用户行为中抽象出基于Web的用户兴趣偏好,并以此为特征建立起个性化信息服务的系统原型。关键词:用户偏好;个性化信息服务;信息推荐中图分类号:G358  文献标志码:A  文章编号:1003-9767(2016)02-190-02  在世界信息化进程加速的推动下,互联网在深度和广度基于Web内容挖掘:从Web站点页面展示的信息、数据库中上一直都呈现出飞速发展的趋势,用户可以获取的信息不仅的结构化信息和其他如多媒体这样的非结构化数据中挖掘出变得越来越丰富也变得越来越繁杂,互联网已经成为当今世有价值的信息。第三,基于Web使用挖掘:从Web服务器中界人们获取信息服务的最重要的途径。从“新摩尔定律”可所记录的用户行为记录等信息中挖掘出用户感兴趣的信息。以看出,www中的信息量正以半年翻倍的速度爆炸性增长着。面对这浩如烟海的信息,如何让用户快速精准地获取到自己2 用户偏好模型所需的信息而不至于迷失成为Web站点吸引用户的关键。如对用户偏好建模,就是要对用户的固有兴趣或一段时间何从用户的行为出发挖掘出用户的需求针对其个人特征向其内相对稳定不易改变的信息需求进行抽象和描述。用户的兴提供个性化的信息服务成为获取用户吸引用户以及扩充用户趣包含甚广,如仅仅是语言文字描述没有任何意义,为了建群体的关键。立起在电子信息平台上的用户偏好模型,要将用户的兴趣变现有的Web信息服务主要存在以下问题。第一,很多得可计算性,也就是用一种面向算法的思维对用户的需求进Web站点仅根据用户的初始静态信息简单地进行网络链接呈行具备特定数据结构的形式化的描述。由于用户的兴趣不时现,而由于现今信息量的急速膨胀,大量链接容易使用户在的会新增、衰退和遗忘,如何模拟兴趣的遗忘是一个难点,互联网复杂的信息空间中迷失方向。第二,网页中为用户提在此应建立一个遗忘函数对用户的兴趣赋予一个初始兴趣供的大量信息对特定用户来说往往是多余的,没有充分考虑度,随着时间推移该值逐渐衰减,直到降到一定阈值,就定到用户的需求差异,要从大量无用的信息中获取到用户所感义该兴趣被用户完全遗忘。在此基础上,建立起能实时捕捉兴趣的信息相当繁琐。第三,对于绝大多数网站仍然是被动动态更新的用户偏好模型,将用户的兴趣划分为短期和长期的对用户提供信息服务,没有主动去挖掘用户的需求,更没两类P=(S,L),根据各自特点分别进行不同的处理,短期有实现对用户感兴趣的信息进行主动推送。第四,能够进行兴趣S经过一定时间通过验证用户的行为如果达到条件就将个性化信息服务的Web系统大多都极大地依赖于用户主动提转变为长期兴趣L,否则就将减弱消退被用户所遗忘,而长供的显式静态偏好信息,无法主动感知用户的需求变化。期兴趣经过较长时间也可能渐渐被遗忘,定义兴趣度的概念1 国内外相关工作作为衡量指标来模拟用户偏好的遗忘,它是一个随时间递减的函数,用来反应随着时间推移用户对某一方面的兴趣偏好个性化信息服务早已成为国内外专家学者研究的热门课逐渐衰退的过程,其计算公式如下。题,也不乏很多成功案例。获取用户偏好属于数据挖掘的范畴,由于互联息呈现出动态的无结构化特点,要想通过在Web中的用户行为及Web资源中提取潜在的有价值的信息 变得更困难。根据Web挖掘的数据对象差异可将基于Web的数据挖掘分为以下几个类型。第一,基于Web结构挖掘:从Web站点的组织架构和链接结构中挖掘出有价值的信息。第二,2.1 短期偏好用户短期兴趣的定义:短期内会发生改变或者转移的兴作者简介:谢宗燃(1988-),男,四川达州人,研究生。研究方向:计算机。—   190   —2016年信息与电脑1下-正文(晓京返).indd󰀁󰀁󰀁1902016/2/20󰀁󰀁󰀁18:37:15信息与电脑2016年第2期China Computer&Communication信息安全与管理趣,除一部分经过时间推移会转变成固定的长期兴趣,大部用户长期兴趣生成算法如下。分短期兴趣总是因为特定的时间或环境突然出现而又速度消输入:关键字向量失,所以不用过细地去对短期兴趣特定分类,我们用S表示输出:长期偏好短期兴趣,它由一个关键字的集合来表示即S=(s_1,s_2,…,s_第一,取出时刻用户所有关键字向量n),其中s=(k,v),k表示关键字,v表示该关键字对应,根据计算每个关键的权重。字的累积权重。对于获取到的用户相关信息,将其抽象归纳为一组特征第二,重复1直至一个较长时间每个向量都被计算过。关键字的集合来表示,每一个关键字对应一个集合,该集合设定阈值,选中权重高于阈值的关键字组成集合A。根据包括(关键字元k,初始权重v,时间t,文档d,时间衰减度r)。关键字向量得到文本集合。用户短期兴趣生成算法:对关键字K有第三,筛选文档,提升关键字和文本的关联性,设 定阈值(关键字的初始权重)并计算得出初始阈值大于K的t时刻累积权重为的文档集合。将集合分类得到用户一部分长期偏好,表示一个偏好领域。 第四,对没有达到阈值进一步考察:输入:关键字向量集合将一段时间分成前后两个时间段:;输出:用户短期兴趣向量对于关键字,计算初始权重和经过后的权 重累积增量:While 存在用户关键字向量集合 begin 找出向量集合中存在关键字相同的全部向量若增量相差小于认为设定的阈值,则将该关键计算t时刻该关键字的累积权重字对应文档集合重复步骤3得到集合,进一步得到。 第五,合并得到,分别统计各文档数量。end第六,定义为用户对各类别偏好程度,找出权重最大的m项作为用户的短期偏好。最后得到…,。2.2 长期偏好3 结  语用户长期兴趣的定义:由于长期兴趣相对稳定不易变动且信息量很大,所以考虑将用户长期兴趣按领域来进行分类。当今互联网愈加普及,如何为用户提供更人性化、更个表现形式如下。性化的的信息服务将变得越来越重要,而要做到这一点就必L={(l_1,a_1,q_1 ),(l_2,a_2,q_2 ),…, (l_n,a_n,q_n )}须首先从用户的活动轨迹以及一切可收集到的信息中捕获并l:用户感兴趣的一个领域;抽象提炼出用户的兴趣偏好,本文提出的建立用户偏好模型a:用户关注的该领域的文档数量;的方法,能较为准确地描述用户的实际兴趣,并以此对用户q:定义为,表示用户对该领域感兴进行个性化推荐达到个性化信息服务的目的,对于个性化信趣的程度。息技术的研究有一定的启示意义。考虑到当今互联息爆对于某一长期兴趣l,可以通过对文本信息聚类来得到。炸的现状,大量用户信息的收集与处理变得尤为困难,而在而每个文档类都对应着一个特征关键字集,于是可以先对每本文中对原始数据的预处理计算复杂度还相对较高,要实现类文档统计其特征关键字的词频,组合起来便可得到对应每对信息的实时行分析处理还很难达到,流程更简化计算量更个类的特征关键字和全中的向量,对于同一类型的信息每个小更轻量级更实时准确的偏好模型将是以后的研究方向。用户的侧重点都不同,这样更能准确反应出用户的偏好。—   191   —2016年信息与电脑1下-正文(晓京返).indd󰀁󰀁󰀁1912016/2/20󰀁󰀁󰀁18:37:16

因篇幅问题不能全部显示,请点此查看更多更全内容

Copyright © 2019- vipyiyao.com 版权所有 湘ICP备2023022495号-8

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务