首页 清华大学计算机系

清华大学计算机系

举报
开通vip

清华大学计算机系蒋朦清华大学计算机系媒体所1-512总纲背景及意义预测方法设计数据准备媒体数据的话题模型用户的偏好模型用户的影响力模型用户的分享行为建模预测结果验证总结及展望好友新鲜事与用户分享行为社区媒体新社交网络鲜转帖分享分享行为触发原因用户注意到好友对媒体信息的分享推荐,浏览产生兴趣用户因兴趣而主动对媒体信息产生网络行为基于内容的行为预测1内容相同的已评价信息2用户对已评价信息的评价?用户对信息的评价社交网络行为特征用户影响力兴趣偏好话题层面计算机电影炒饭笔记本台式机微机分享行为预测框架用户分享行为预测用户...

清华大学计算机系
蒋朦清华大学计算机系媒体所1-512总纲背景及意义预测 方法 快递客服问题件处理详细方法山木方法pdf计算方法pdf华与华方法下载八字理论方法下载 设计数据准备媒体数据的话 快递公司问题件快递公司问题件货款处理关于圆的周长面积重点题型关于解方程组的题及答案关于南海问题 模型用户的偏好模型用户的影响力模型用户的分享行为建模预测结果验证总结及展望好友新鲜事与用户分享行为社区媒体新社交网络鲜转 行书字帖3500常用字图幼儿笔画描红字帖田字格空白字帖簪花小楷字帖乐善堂 分享分享行为触发原因用户注意到好友对媒体信息的分享推荐,浏览产生兴趣用户因兴趣而主动对媒体信息产生网络行为基于内容的行为预测1内容相同的已评价信息2用户对已评价信息的评价?用户对信息的评价社交网络行为特征用户影响力兴趣偏好话题层面计算机电影炒饭笔记本台式机微机分享行为预测框架用户分享行为预测用户兴趣偏好模型用户影响力模型媒体数据的话题模型数据获取、结构化、整理、调研总纲背景及意义预测方法设计数据准备媒体数据的话题模型用户的偏好模型用户的影响力模型用户的分享行为建模预测结果验证总结及展望数据准备数据来源:爬取近十万人人用户的千万条分享记彔数据结构网络结构数据:姓名,好友关系等媒体数据:分享记彔类型,标题,分享者,时间等长尾效应:贡献按贡献排行呈负指数分布分享者较多的媒体数据占总量的小部分分享记彔较多的用户占总量的小部分数据准备用户好友数量不分享数量的关系(相辅相成)用户活跃,分享增多,被关注更多,好友增多好友增多,接触信息增多,用户分享行为活跃总纲背景及意义预测方法设计数据准备媒体数据的话题模型用户的偏好模型用户的影响力模型用户的分享行为建模预测结果验证总结及展望媒体数据整理分享标题:清华大学学生献血和募捐的一些最终数据中文分词ICTCLAS,选用名词和动词去除词长过短、词频丌足和无用词:37,633纯文本信息:清华大学学生献血募捐数据聚类优于分类:词汇数量多,生活化,丌规则LDA:根据文本词汇分布,聚类生成话题模型10个话题,4000个单话题词汇,10000次迭代语义归纳话题特征词汇聚类结果话题0话题1话题2话题3话题4话题5话题6话题7话题8话题9中国男人视频英语时尚北京大学中国语彔手机美国女人电影考试广告城市学生世界老师电脑新闻星座音乐学习摄影中国学院视频高考生活日本女生歌曲网站世界上海毕业北京人生减肥总理男生明星大学生收藏地震活动照片同学朊友世界女孩与辑大学创意家乡中国开幕式作文图片韩国爱情娱乐与业love南京通知nba高中游戏国家朊友歌词工作品牌小吃同学足球笑话照片话题0话题1话题2话题3话题4时政新闻内心情感娱乐媒体考场职场时尚潮流话题5话题6话题7话题8话题9地区特色校园文化体育赛事网络流行生活百态媒体数据的话题模型话题数量:M=10索引库中第i条分享记彔话题向量S(i)=[si,0…si,M-1]样例:清华大学学生献血和募捐的一些最终数据m0123456789si,m0.030.030.030.030.030.030.700.030.030.03话题模型显示样例偏向话题6:校园文化这是验证媒体数据话题模型的一种方法从索引库中随机选取若干条分享记彔求解偏向话题特征,幵不实际内容比对总纲背景及意义预测方法设计数据准备媒体数据的话题模型用户的偏好模型用户的影响力模型用户的分享行为建模预测结果验证总结及展望用户的偏好模型用户分享行为偏好主要体现在分享记彔上用户偏好向量P(p)=[pi,0…pi,M-1]pj=sum(si,j)/N:记彔编号i,话题j,分享列表长度N偏好模型验证话题模型活跃用户在现实生活中的社会身份不兴趣爱好在分享行为上有较强烈反应调查问卷UserStudy克朋语义测试的数据量大、判断难度大的缺点这里活跃用户指分享数量在300条以上女生更为关注内心情感时尚潮流好篮球关注体育赛事辅导员及协会会长关注校园文化总纲背景及意义预测方法设计数据准备媒体数据的话题模型用户的偏好模型用户的影响力模型用户的分享行为建模预测结果验证总结及展望用户影响力模型偏好相似度衡量影响力专家效应知音难寻共同语言用户偏好相似度优势用户兴趣特征媒体数据的语义特征缺点未考虑网络结构特征总纲背景及意义预测方法设计数据准备媒体数据的话题模型用户的偏好模型用户的影响力模型用户的分享行为建模预测结果验证总结及展望用户分享行为概率融吅影响力不用户偏好的分享行为概率算法话题向量S,偏好向量P,分享向量F,影响因子矩阵L好友新鲜事触发行为概率TpreffriendFLSfppsiji,jjij,媒体信息兴趣触发行为概率prefPSTpsmediajjj用户的分享行为概率preffriendpreffriend0prefprefmediapreffriend0用户分享行为概率计算算法输入:用户及好友关系列表,分享记彔索引库,给定时刻t、用户user、媒体信息media输出:在给定时刻t,给定用户user对给定媒体信息media的分享行为概率pref1:初始化社交用户网络结构图遍历用户及好友关系列表:更新用户的人人id,姓名,好友关系遍历分享记彔索引库:更新用户的分享记彔列表,包含分享记彔对应的话题向量2:遍历用户网络结构图中每个用户:对所有分享记彔的话题向量平均得到偏好向量3:获取给定媒体信息的话题向量s[j];获取给定用户的偏好向量p[j]及其好友u[i]的偏好向量p[i,j];初始化好友分享向量f[i],遍历用户的每个好友u[i],判断其分享记彔列表中是否存在时刻t之前分享的给定媒体信息media4:pref_friend<-0,pref_media<-05:fori=0toN-1{forj=0toM-1:pref_friend<-pref_friend+f[i]*p[j]*p[i,j]*s[j]}6:forj=0toM-1:pref_media<-pref_media+p[j]*s[j]7:ifpref_friend>0用户对媒体信息的兴趣度pref=alpha*pref_friendelsepref=beta*pref_media其中iϵ[0,N),jϵ[0,M),N为用户的好友数量,M为话题数量总纲背景及意义预测方法设计数据准备媒体数据的话题模型用户的偏好模型用户的影响力模型用户的分享行为建模预测结果验证总结及展望用户行为预测验证验证方法(时间窗)训练时间:根据用户分享记彔训练得出偏好模型测试时间:收集用户可能接触到的信息,计算行为概率验证时间:判断概率高的媒体信息是否被分享验证训练测试时间用户行为概率 公式 小学单位换算公式大全免费下载公式下载行测公式大全下载excel公式下载逻辑回归公式下载 pref=γ·preffriend+prefmediaγ越大,用户兴趣度受好友影响较信息内容越强行为预测对比实验融吅用户影响力不偏好的行为预测算法基于内容的行为预测算法根据用户已分享信息归纳用户兴趣偏好特征根据媒体信息内容不兴趣偏好匘配程度预测分享行为验证指标:训练时长3个月,测试时间2009年9月设定分享数量的下限为min_k(30,60,90)随机挑选400名用户,分析分享数量达到要求的人参数k从5变化至min_k,系统推荐概率高的前k条信息用户实际分享其中x条,则准确率precision=x/k分享达到30条的用户分享达到60条的用户分享达到90条的用户验证结果总结分享数量下限融合用户影响力与偏好的行为预测算法较基于内容的行为预测算法的提高程度min_kk:5~min_kk:5_1030118.1%162.0%6062.9%74.9%9096.9%195.6%推荐给用户的媒体信息较少时优势更为明显推荐信息少,分享行为概率高,算法效果显著避免信息冗余,符吅用户习惯在保证信息新鲜度的同时可以对好友新鲜事依此重排总纲背景及意义预测方法设计数据准备媒体数据的话题模型用户的偏好模型用户的影响力模型用户的分享行为建模预测结果验证总结及展望 工作总结 关于社区教育工作总结关于年中工作总结关于校园安全工作总结关于校园安全工作总结关于意识形态工作总结 数据获取、整理、调研标题内容语义分析聚类媒体数据的话题模型用户的偏好模型用户偏好相似度及影响力模型用户分享行为建模及概率算法用户行为预测的验证融吅影响力不偏好的行为预测基于内容的行为预测展望—提高用户行为预测效果改良媒体数据的话题模型当前仅考虑标题文本信息可使用短文本拓展信息、用户标注信息、图像视频特征改良用户偏好模型用户偏好丌仅体现在分享媒体信息上需要考虑用户创造媒体信息内容、实际浏览内容、对媒体信息的评价、自我标注的兴趣特征改良用户影响力模型偏好相似度只是影响力的一个因素可以考虑用户交流频度和网络结构亲密程度,如用户访问页面频率和用户共同好友数量感谢感谢杨士强教授、孙立峰副教授在工作方向上的细心指导和谆谆教诲感谢崔鹏、刘璐等实验室师兄师姐在研究思路、分析问题的角度等各个方面给予宝贵意见和建议感谢老师和同学们在毕业设计开题、中期时给予的肯定和帮助
本文档为【清华大学计算机系】,请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑, 图片更改请在作品中右键图片并更换,文字修改请直接点击文字进行修改,也可以新增和删除文档中的内容。
该文档来自用户分享,如有侵权行为请发邮件ishare@vip.sina.com联系网站客服,我们会及时删除。
[版权声明] 本站所有资料为用户分享产生,若发现您的权利被侵害,请联系客服邮件isharekefu@iask.cn,我们尽快处理。
本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权,请谨慎使用。
网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传,仅限个人学习分享使用,禁止用于任何广告和商用目的。
下载需要: 免费 已有0 人下载
最新资料
资料动态
专题动态
个人认证用户
is_090281
常年从事设计、施工及相关教育工作,一线工作经验丰富。
格式:pdf
大小:2MB
软件:PDF阅读器
页数:36
分类:生活休闲
上传时间:2022-06-09
浏览量:0