期刊文献+
共找到788篇文章
< 1 2 40 >
每页显示 20 50 100
基于频繁主题集偏好的学术论文推荐算法 预览
1
作者 李冉 林泓 《计算机应用研究》 CSCD 北大核心 2019年第9期2675-2678,共4页
针对学术论文推荐中项目冷启动问题,提出了一种基于频繁主题集偏好的协同主题回归模型。该算法考虑到用户在选择学术论文时对研究热点的偏好,使用频繁主题集代表研究热点,将用户对研究热点的偏好表示成用户对频繁主题集的偏好。通过潜... 针对学术论文推荐中项目冷启动问题,提出了一种基于频繁主题集偏好的协同主题回归模型。该算法考虑到用户在选择学术论文时对研究热点的偏好,使用频繁主题集代表研究热点,将用户对研究热点的偏好表示成用户对频繁主题集的偏好。通过潜在狄利克雷分布主题模型挖掘得到论文-主题概率分布矩阵,并筛选出论文中概率较高的主题;然后挖掘出频繁出现的主题集合,并得到论文-频繁主题集矩阵;最后在预测未知评分时融入用户对频繁主题集的偏好。在CiteULike数据集上的实验表明,相比于矩阵分解模型和协同主题回归模型,该算法在召回率、准确率和RMSE三个指标上都有所提升。 展开更多
关键词 论文推荐 主题模型 频繁主题
在线阅读 下载PDF
基于动态主题模型的大数据网络舆情热点抽取 预览
2
作者 万红新 《电脑知识与技术:学术版》 2019年第3Z期159-160,共2页
随着互联网的发展和普及,在网络上产生了大量的评论数据,形成舆情热点话题。舆情热点是一个动态的变化过程。提出的动态主题模型可以从舆情文本中发现动态变化的热点词,通过词语间的主题聚类来提取舆情热点词语,实现从海里文本数据中提... 随着互联网的发展和普及,在网络上产生了大量的评论数据,形成舆情热点话题。舆情热点是一个动态的变化过程。提出的动态主题模型可以从舆情文本中发现动态变化的热点词,通过词语间的主题聚类来提取舆情热点词语,实现从海里文本数据中提取网络舆情热点。 展开更多
关键词 主题模型 动态主题 舆情热点 大数据
在线阅读 下载PDF
基于文本聚类的网络微博舆情话题识别与追踪技术研究 预览
3
作者 闫俊伢 马尚才 《重庆理工大学学报:自然科学》 CAS 北大核心 2019年第9期176-181,共6页
为解决传统话题识别与跟踪方法在处理微博数据时存在的高维、稀疏等问题,提出了一种网络微博话题主题词抽取模型和改进聚类方法。首先,对微博数据以特征词汇选择的方式进行了改进,优先选择时间片内词频统计较高(包含信息量较大)的词汇... 为解决传统话题识别与跟踪方法在处理微博数据时存在的高维、稀疏等问题,提出了一种网络微博话题主题词抽取模型和改进聚类方法。首先,对微博数据以特征词汇选择的方式进行了改进,优先选择时间片内词频统计较高(包含信息量较大)的词汇作为特征词汇,从而降低向量空间的维数,提升运行效率;其次,采用LDA模型来进行微博数据的文本表示;最后,采用基于遗传优化的K-means算法进行聚类分析,提高了聚类结果的准确率和稳定性。网络微博数据实验结果验证了提出方法的有效性,表明其可解决数据处理稀疏、高维的问题。相比其他聚类算法,提出方法在话题识别的多个性能指标上均表现良好,并能准确展示出话题的动态变化。 展开更多
关键词 微博舆情 本文聚类 K-MEANS 主题 主题模型 聚类算法 话题识别
在线阅读 免费下载
结合字词向量的主题向量模型
4
作者 张青 韩立新 刘合兵 《电子测量技术》 2019年第3期49-53,共5页
为了将已有的英文主题向量模型更好地应用于中文的主题向量训练,并且解决主题个数事先确定的缺点。本文将原有模型中,文档向量和词向量线性相加的方式改为内积的方式,并结合文档向量、字向量和词向量三者一起训练主题向量。当得到主题... 为了将已有的英文主题向量模型更好地应用于中文的主题向量训练,并且解决主题个数事先确定的缺点。本文将原有模型中,文档向量和词向量线性相加的方式改为内积的方式,并结合文档向量、字向量和词向量三者一起训练主题向量。当得到主题向量后通过聚类方法将相似的主题聚集在一起,以此来确定主题个数。实验表明,该方法训练出的主题词的相关性较原有模型和传统模型有所提升,并且能够获得较为合理的主题个数,同时,还能够得到词向量,主题向量和文档向量。 展开更多
关键词 主题模型 字向量 主题向量 词向量 文档向量 字词嵌入
结合全局和局部约束的sLDA铁路扣件分类模型 预览
5
作者 杨飞 罗建桥 李柏林 《计算机应用》 CSCD 北大核心 2019年第3期888-893,共6页
针对监督潜在狄利克雷分布(sLDA)模型中测试图像缺乏标注,导致测试主题分布忽略目标结构的问题,提出一种结合全局和局部约束的sLDA(glc-sLDA)扣件图像分类模型。首先,人工标注训练图像,并在sLDA模型中学习得到含有结构信息的训练主题分... 针对监督潜在狄利克雷分布(sLDA)模型中测试图像缺乏标注,导致测试主题分布忽略目标结构的问题,提出一种结合全局和局部约束的sLDA(glc-sLDA)扣件图像分类模型。首先,人工标注训练图像,并在sLDA模型中学习得到含有结构信息的训练主题分布;然后,计算测试主题分布,将测试图像的类别概率作为全局约束,将测试图像子块与训练图像子块的主题相似程度作为局部约束;最后,以全局和局部约束的乘积为更新权值,对训练主题分布加权求和得到新的测试主题分布,并在Softmax分类器中得到测试图像的分类结果。实验结果表明,glc-sLDA模型能表达扣件结构信息,与sLDA相比,各类别的扣件图像区分性增强,分类误检率减小了55%。 展开更多
关键词 铁路扣件分类 监督潜在狄利克雷分布 主题模型 单词标注 目标结构 更新主题分布
在线阅读 下载PDF
主题模型在基于社交媒体的灾害分类中的应用及比较
6
作者 苏凯 程昌秀 +1 位作者 Nikita Murzintcev 张婷 《地球信息科学学报》 CSCD 北大核心 2019年第8期1152-1160,共9页
“一带一路”沿线为自然灾害高发地区,且多为经济欠发达、抗灾能力弱的发展中国家。灾害发生时,挖掘和分析相关推特数据有助于开展应急救援、灾情评估、减灾防灾等工作,为中国国际救援与救助工作提供重要支撑。主题模型能在没有经验语... “一带一路”沿线为自然灾害高发地区,且多为经济欠发达、抗灾能力弱的发展中国家。灾害发生时,挖掘和分析相关推特数据有助于开展应急救援、灾情评估、减灾防灾等工作,为中国国际救援与救助工作提供重要支撑。主题模型能在没有经验语料库的情况下,从海量灾害相关推文中快速聚合出对灾害救援、评估有价值的信息。本文采用BTM模型和LDA模型,对2013年海燕台风相关推文进行细粒度的主题聚类,分析2个模型的精度并测试它们对近似灾害主题的区分能力,并基于“需求相关”主题类的推文,通过地名匹配,分析了海燕台风发生过程中菲律宾物资、医疗等需求程度的空间分布。结果表明:①在区分主题近似的短文本时,BTM总体精度为0.598.LDA的总体精度仅为0.321,说明在海燕台风灾害推文的主题识别中,BTM模型的精度高于LDA模型;②BTM能够较好识别出“灾害地点相关”、“祈福相关”等较为精细的灾害主题;③经初步验证,基于“需求相关”主题文本生成的物资、医疗等需求的需求程度空间分布与实际需求情况基本相符。 展开更多
关键词 主题模型 BTM LDA 推文 主题分类 自然灾害 应急管理
基于文本挖掘技术的社会网络舆情分析框架刍议——以某知名艺人偷税漏税事件为例 预览
7
作者 钟瑞童 《西部学刊》 2019年第10期134-138,共5页
通过研究某知名演员偷税漏税事件的舆情走势,给出舆情分析框架,使用Word2vec模型分析人物关系,梳理事件背景,而后使用评论影响力指标筛选具有导向作用的舆论,再通过主题模型提取观点,分析舆情走势,并对不同主题观点下各类人群构成做量... 通过研究某知名演员偷税漏税事件的舆情走势,给出舆情分析框架,使用Word2vec模型分析人物关系,梳理事件背景,而后使用评论影响力指标筛选具有导向作用的舆论,再通过主题模型提取观点,分析舆情走势,并对不同主题观点下各类人群构成做量化分析。该分析框架有助于决策者迅速精准把握热点事件舆情,了解公众心理,反映社会风气。 展开更多
关键词 舆情分析 观点挖掘 主题模型 word2vec模型
在线阅读 下载PDF
面向复杂主题建模的流式层次狄里克雷过程 预览
8
作者 韩忠明 张梦玫 +2 位作者 李梦琪 段大高 陈谊 《计算机学报》 EI CSCD 北大核心 2019年第7期1539-1552,共14页
互联网已经成为真实事件信息的主要来源.针对互联网海量新闻语料的主题挖掘是新闻事件的组织和追踪任务中关键的一环.主题模型已被广泛应用于挖掘和分析新闻等文本语料,LDA(Latent Dirichlet Allocation)是最常见的主题模型,然而现有基... 互联网已经成为真实事件信息的主要来源.针对互联网海量新闻语料的主题挖掘是新闻事件的组织和追踪任务中关键的一环.主题模型已被广泛应用于挖掘和分析新闻等文本语料,LDA(Latent Dirichlet Allocation)是最常见的主题模型,然而现有基于LDA的方法没有考虑到主题之间的层次关系,且需要预先提供主题个数.作为LDA模型的扩展,层次狄里克雷过程(Hierarchical Dirichlet Process,HDP)是非参数贝叶斯主题模型,HDP能够自动确定主题个数.对于具有层次等特性的复杂主题,HDP难以挖掘出隐式层次结构,且容易产生噪音主题.为了解决这个问题,该文提出了基于HDP改进的非参数贝叶斯模型:流式层次狄里利克雷过程(Flow Hierarchical Dirichlet Process,FHDP),FHDP通过在HDP模型中加入流动操作,加强了对主题之间的同属领域信息的利用,以便于更好的对主题进行层次分析.利用加入了流动操作的中国连锁餐馆模型(Chinese Restaurant Franchise,CRF)对数据进行建模,设计相应的马尔可夫链蒙特卡罗(Markov Chain Monte Carlo,MCMC)采样方法,以推导FHDP模型的分布参数分布.FHDP的主要贡献在于:(1)对含有层次关系的主题建模时,减少了无意义信息.解决了HDP得到主题不明确的问题,扩大了HDP的应用领域;(2)由于在FHDP中加强了对主题隐含领域信息的利用,主题的层次关系变得更加明确.为了客观衡量FHDP和HDP的性能差异,利用模拟和真实数据进行了大量实验.实验表明,在轮廓系数、主题覆盖度、单字对数似然等指标上,FHDP模型明显优于HDP模型。 展开更多
关键词 层次狄里克雷过程 主题模型 非参数贝叶斯模型 马尔可夫蒙特卡罗 流式层次狄里克雷过程
在线阅读 下载PDF
基于虚拟学术社区的知识聚合模型构建研究
9
作者 张连峰 李慧 遆云鹤 《情报科学》 CSSCI 北大核心 2019年第6期55-60,74共7页
【目的/意义】优化虚拟学术社区的知识聚合模型能够构建优质的资源获取平台,实现知识的共享和创新。【方法/过程】结合学术社区用户的相关知识需求分析,提出了虚拟学术社区知识聚合的目标--知识共享、知识管理、知识创新和知识推送;进... 【目的/意义】优化虚拟学术社区的知识聚合模型能够构建优质的资源获取平台,实现知识的共享和创新。【方法/过程】结合学术社区用户的相关知识需求分析,提出了虚拟学术社区知识聚合的目标--知识共享、知识管理、知识创新和知识推送;进而又提出了基于主题的虚拟学术社区知识聚合模型和基于SECI的虚拟学术社区知识聚合模型,并对这两种模型的相关理论进行了深入细致的剖析,在结合理论学习与创新的基础上建立了融合主题与SECI模型的虚拟学术社区知识聚合整体模型构架。【结果/结论】实现了对当前的知识聚合模型的优化,推动虚拟学术社区知识聚合模型理论的深入性和普适性发展,为提升虚拟学术社区知识聚合的水平提供实践参考。 展开更多
关键词 虚拟学术社区 知识聚合 聚合模型 主题模型
融合主题模型和卷积神经网络的APP推荐研究
10
作者 王杰 唐菁荟 +1 位作者 王昊 邓三鸿 《情报理论与实践》 CSSCI 北大核心 2019年第4期158-165,共8页
[目的/意义]将主题模型与卷积神经网络进行结合,以实现APP的个性化推荐,并缓解评分数据稀疏性问题。[方法/过程]提出TMCNN模型,针对文本内容,通过用户和APP双通道的卷积神经网络获取卷积语义特征,同时使用LDA模型获取主题特征,并与用户... [目的/意义]将主题模型与卷积神经网络进行结合,以实现APP的个性化推荐,并缓解评分数据稀疏性问题。[方法/过程]提出TMCNN模型,针对文本内容,通过用户和APP双通道的卷积神经网络获取卷积语义特征,同时使用LDA模型获取主题特征,并与用户和APP的数值特征组合,从而预测用户对APP的评分,进而推荐。[结果/结论]通过360手机助手数据集的测试,从RMSE,召回率,NDCG三个指标进行分析,TMCNN模型不仅具有良好的评分预测效果,而且APP的推荐结果也相对较好。同时,TMCNN模型也丰富了APP推荐的研究方法。[局限]没有考虑APP的权限信息,评论信息的有用性,以及TMCNN模型的优化函数有待改进。 展开更多
关键词 APP推荐 LDA模型 卷积神经网络 主题模型
基于改进LDA主题模型的中日美氢能产业链技术布局研究 预览
11
作者 李昌 吴红 +2 位作者 伊惠芳 韩盟 冀方燕 《情报杂志》 CSSCI 北大核心 2019年第7期78-84,110共8页
[目的/意义]氢能技术主要掌握于中日美三国,研究中日美在氢能领域产业链上的技术布局,对于科学制定技术创新战略、抢占发展制高点具有重要意义。[方法/过程]在赋予技术词产业链与IPC语义的基础上,构建WIC-I-LDA主题模型挖掘氢能领域技... [目的/意义]氢能技术主要掌握于中日美三国,研究中日美在氢能领域产业链上的技术布局,对于科学制定技术创新战略、抢占发展制高点具有重要意义。[方法/过程]在赋予技术词产业链与IPC语义的基础上,构建WIC-I-LDA主题模型挖掘氢能领域技术主题,并运用改进的综合主题强度计算模型,计算三国在各产业链、技术主题的研究热度,依此对氢能技术布局及各国优势、短板和发展趋势进行深度分析。[结果/结论]研究表明:中日美三国基本处于同步发展阶段,都注重氢能的制备与应用,但也各有侧重:中国技术布局优势主要集中在氢能制备,日本优势主要集中在氢能的纯化与应用,美国优势主要集中在氢能储运,金属及其氧化物制氢、甲醇制氢、液化储氢与金属氧化物储氢技术主题是三国共同的关注点,均呈上升趋势。 展开更多
关键词 氢能 中日美 产业链 技术布局 主题模型
在线阅读 下载PDF
从《人民日报》关于就业的报道看大学生就业现状及对策 预览
12
作者 付娆 《劳动保障世界》 2019年第18期10-11,共2页
随着社会的发展、科技与教育的进步,高校毕业生人数越来越多,大学生的就业问题越来越受到社会的关注。本文使用主题模型对《人民日报》中就业报道进行内容研究,结合领英、智联招聘、58同城等就业平台的数据报告,针对大学生就业现状、就... 随着社会的发展、科技与教育的进步,高校毕业生人数越来越多,大学生的就业问题越来越受到社会的关注。本文使用主题模型对《人民日报》中就业报道进行内容研究,结合领英、智联招聘、58同城等就业平台的数据报告,针对大学生就业现状、就业问题进行分析,并在此基础上,提出改善大学生就业状况的建议。 展开更多
关键词 大学生 就业报道 就业现状 主题模型
在线阅读 下载PDF
“一带一路”倡议海外传播分析——基于对主要国际媒体的文本挖掘方法 预览
13
作者 李倩倩 李瑛 刘怡君 《情报杂志》 CSSCI 北大核心 2019年第3期121-126,132共7页
[目的/意义]了解国际主流媒体如何建构“一带一路”倡议,有利于把握“一带一路”倡议在国际传播的议程设置方向。[方法/过程]以CNN、BBC、半岛电视台(AJ)、今日俄罗斯(RT)关于倡议的新闻报道为研究对象,利用主题模型、文档相似性等文本... [目的/意义]了解国际主流媒体如何建构“一带一路”倡议,有利于把握“一带一路”倡议在国际传播的议程设置方向。[方法/过程]以CNN、BBC、半岛电视台(AJ)、今日俄罗斯(RT)关于倡议的新闻报道为研究对象,利用主题模型、文档相似性等文本挖掘方法,探析国际主流媒体的报道重点和相似关联性。[结果/结论]发现:在内容上,国际媒体更多关注倡议落实过程中面临的严峻挑战和对国际社会上产生的影响;在参与度上,国际媒体援引中国国家主流媒体信源的内容不多,中国智库和研究者的声音比较薄弱;在相似性上,CNN、BBC、AJ享有更多的相似议程设置,而RT则相对独立。最后,提出增强“一带一路”倡议海外传播能力的建议。 展开更多
关键词 "一带一路"倡议 海外传播 文本挖掘 主题模型 文本相似性
在线阅读 下载PDF
基于主题模型的网络信息源可视化分析研究 预览
14
作者 刘少俊 方延风 《图书情报导刊》 2019年第3期32-39,共8页
在科技情报收集过程中,网络信息源来源广泛且数据量庞大,对人工分析造成了巨大的压力。对从网络信息源采集的网页进行文本提取,过滤无关信息,使用主题模型对文本进行主题抽取,对抽取的主题进行可视化分析,提取出与需求相关的主题后对信... 在科技情报收集过程中,网络信息源来源广泛且数据量庞大,对人工分析造成了巨大的压力。对从网络信息源采集的网页进行文本提取,过滤无关信息,使用主题模型对文本进行主题抽取,对抽取的主题进行可视化分析,提取出与需求相关的主题后对信息源进行分类分析。这一流程增强了信息处理能力,提高了情报收集的效率。 展开更多
关键词 科技情报 信息源 主题模型 爬虫 自然语言处理
在线阅读 下载PDF
融合语义线索和时空主题的社交媒体动态话题提取 预览
15
作者 万红新 《现代信息科技》 2019年第5期27-29,共3页
基于中文文本的复杂语境结构,同时考虑话题的动态变化性,利用语义线索和时空主题模型来提取话题的关键词语链。结合语义知识和时间约束的主题模型可以有效对社交媒体文本大数据进行分析和处理,以获取潜在的话题知识。
关键词 语义线索 主题模型 社交媒体 动态话题
在线阅读 下载PDF
《人民日报》早期互联网报道(1978-2000)的话语变迁——基于主题模型与诠释包裹的分析
16
作者 赵珞琳 李代 《出版发行研究》 CSSCI 北大核心 2019年第1期57-63,共7页
媒介话语能够反映和建构社会观念。为了还原和理解互联网在中国发展早期的社会语境,需要考察这一时期的相关媒介话语。本研究利用主题模型和话语分析,收集1978年-2000年《人民日报》的互联网相关报道,总结了报道所呈现的主题、框架及其... 媒介话语能够反映和建构社会观念。为了还原和理解互联网在中国发展早期的社会语境,需要考察这一时期的相关媒介话语。本研究利用主题模型和话语分析,收集1978年-2000年《人民日报》的互联网相关报道,总结了报道所呈现的主题、框架及其变化。研究发现,《人民日报》互联网报道的主题显示出深化和多元化的趋势,主要采用"现代化框架""先进框架""产业框架"和"反思框架"来报道互联网。研究探讨了互联网被社会语境所建构的意义及其变化的过程,还讨论了技术、社会语境、媒介话语三者之间的相互作用。 展开更多
关键词 互联网发展史 《人民日报》 媒介话语 主题模型 框架理论
融合语义与图像的大规模图像集检索算法 预览
17
作者 解姗姗 神显豪 《重庆理工大学学报:自然科学》 CAS 北大核心 2019年第7期178-186,共9页
目前的大数据图像检索算法大多仅支持单一的关键词或者图像查询,为此提出了一种语义与图像概率融合的社交媒体图像检索算法。该算法提取图像的空间位置特征与颜色特征,并提取文字标注信息,将两种特征基于概率进行融合。为了解决图像标... 目前的大数据图像检索算法大多仅支持单一的关键词或者图像查询,为此提出了一种语义与图像概率融合的社交媒体图像检索算法。该算法提取图像的空间位置特征与颜色特征,并提取文字标注信息,将两种特征基于概率进行融合。为了解决图像标注缺失与标注噪声的问题,设计了新的主题模型,根据共生的标注信息与视觉特征提取图像的语义主题。主题模型中基于视觉特征生成的最近主题能够有效地增强图像与文字标注之间的相关性。此外,主题模型能够有效地补全缺失的文字标注信息,同时删除噪声标注。基于不同规模的数据集进行了仿真实验,结果显示:该算法支持单一的关键词查询、图像查询以及两者的组合查询,并实现了较高的检索准确率。 展开更多
关键词 社交图像 图像视觉特征 主题模型 文字标注 半监督学习 图像检索
在线阅读 免费下载
基于主题模型的微博评论方面观点褒贬态度挖掘 预览
18
作者 张茜 张士兵 +1 位作者 任福继 张晓格 《中文信息学报》 CSCD 北大核心 2019年第6期116-123,140共9页
在新浪微博中,原创微博下存在着很多用户评论。这些评论能反映原创微博的内容,用户的态度以及与其相关的一些话题。因此,对这些评论进行细粒度信息的提取与褒贬态度的分类很有必要。基于上述原因,该文首先提出与原创无关的评论判别方法... 在新浪微博中,原创微博下存在着很多用户评论。这些评论能反映原创微博的内容,用户的态度以及与其相关的一些话题。因此,对这些评论进行细粒度信息的提取与褒贬态度的分类很有必要。基于上述原因,该文首先提出与原创无关的评论判别方法,通过三个相似度方法得到原创微博与评论之间的相关度,从而判断评论对象是否为原创微博。其次,提出一种用于评论集褒贬态度和方面观点挖掘的新模型,该模型在LDA中加入了表情符号层与文本情感层,实现评论集方面和褒贬态度的同步检测。实验表明:表情符号情感层的融入能提高新模型褒贬态度识别能力。 展开更多
关键词 主题模型 方面观点 褒贬态度 用户评论
在线阅读 下载PDF
基于主题模型的中外期刊文献挖掘对比研究 预览
19
作者 单国栋 肖彦翠 王皓 《长春大学学报》 2019年第6期23-29,共7页
基于运用网络爬虫技术获取的《美国经济评论》和《经济研究》的Web文本数据,从描述性分析和主题模型分析两个角度,分别对预处理后的数据进行对比。分析结果发现,《美国经济评论》和《经济研究》在主题内容上既有相同点,即主题均包含国... 基于运用网络爬虫技术获取的《美国经济评论》和《经济研究》的Web文本数据,从描述性分析和主题模型分析两个角度,分别对预处理后的数据进行对比。分析结果发现,《美国经济评论》和《经济研究》在主题内容上既有相同点,即主题均包含国民经济学、投资学和国际贸易学,亦存在不同之处,此结果为广大学者的研究提供了现实依据,并为《经济研究》的未来建设提供了合理参考。 展开更多
关键词 美国经济评论 经济研究 WEB文本挖掘 分词 主题模型
在线阅读 下载PDF
一种结合主题模型的推荐算法 预览
20
作者 曹占伟 胡晓鹏 《计算机应用研究》 CSCD 北大核心 2019年第6期1638-1642,共5页
针对传统协同过滤推荐算法存在的冷启动、数据稀疏以及相似度度量的准确性问题,基于LDA主题模型对文本隐式主题挖掘的有效性和KL散度在主题分布相似性度量的准确性,提出了结合LDA主题模型的矩阵分解推荐算法。首先,利用改进的LDA算法输... 针对传统协同过滤推荐算法存在的冷启动、数据稀疏以及相似度度量的准确性问题,基于LDA主题模型对文本隐式主题挖掘的有效性和KL散度在主题分布相似性度量的准确性,提出了结合LDA主题模型的矩阵分解推荐算法。首先,利用改进的LDA算法输出项目—主题分布,并用困惑度作为主题数设置的修正函数;然后分别基于余弦相似度和KL散度计算得到项目相似度矩阵,将得到的相似度矩阵结合原评分训练集输出预评分,再将预评分填充到训练集;最后将训练集输入ALS矩阵分解算法得到推荐结果。通过MovieLens数据集的实验结果表明,该算法在不同隐式参数设定下均能得到比ALS推荐算法以及更小的预测误差,并且最优预测误差小于传统推荐算法。该实验说明了通过集成LDA主题模型的ALS算法效果要优于其他推荐算法。 展开更多
关键词 推荐算法 矩阵分解 隐式狄利克雷分布 KL散度 主题模型
在线阅读 下载PDF
上一页 1 2 40 下一页 到第
使用帮助 返回顶部 意见反馈