期刊文献+
共找到1,207篇文章
< 1 2 61 >
每页显示 20 50 100
基于文本挖掘技术分析治疗精子活力低下症的中医用药规律 预览
1
作者 陈曙辉 林煦垚 +2 位作者 张明强 陈立 秦国政 《云南中医中药杂志》 2019年第1期19-22,共4页
目的利用文本挖掘技术探索治疗精子活力低下症的常用中医用药规律,为临床治疗提供一定的参考依据。方法登录中国知网(CNKI)收集中医治疗精子活力低下症的相关文献,使用MySQL数据库,运用全文索引对数据进行归档存储,并人工降噪处理。利... 目的利用文本挖掘技术探索治疗精子活力低下症的常用中医用药规律,为临床治疗提供一定的参考依据。方法登录中国知网(CNKI)收集中医治疗精子活力低下症的相关文献,使用MySQL数据库,运用全文索引对数据进行归档存储,并人工降噪处理。利用数据挖掘中的关联规则算法,统计分析常用中药用药频率及药物协同关系规律,绘制协同药物网络图并进行分析讨论。结果中药协同关系分析显示菟丝子、枸杞子、淫羊藿、熟地黄、黄芪是治疗精子活力低下症最常用的中草药。结论常用中药用药规律,对临床应用具有一定指导意义,文本挖掘技术可以为中医药研究提供技术支持。 展开更多
关键词 精子活力低下症 中医 文本挖掘 用药规律
在线阅读 下载PDF
基于计算机文本挖掘的白内障氧化应激相关基因功能富集及药物治疗分析 预览
2
作者 姜凌峰 石栋 +3 位作者 陆博 韩笑 周文凯 阎启昌 《眼科新进展》 CAS 北大核心 2019年第1期36-40,共5页
目的利用计算机工具和已知的数据库进行挖掘和分析进而确定与白内障和抗氧化应激相关的基因集及信号通路,并进行白内障可能的有效治疗药物的预测和探索。方法利用文本挖掘工具pubmed2ensembl对白内障和抗氧化应激均相关的基因进行初步筛... 目的利用计算机工具和已知的数据库进行挖掘和分析进而确定与白内障和抗氧化应激相关的基因集及信号通路,并进行白内障可能的有效治疗药物的预测和探索。方法利用文本挖掘工具pubmed2ensembl对白内障和抗氧化应激均相关的基因进行初步筛选,得到的基因集利用GeneCodis工具进行基因功能的富集分析和京都基因与基因组百科全书(Kyoto Encyclopedia of Genes and Genomes,KEGG)通路分析,富集的结果则应用STRING工具进行进一步蛋白质-蛋白质相互作用分析,选取相互作用紧密的基因,最后使用DGIdb工具得到基因-药物相互作用的结果,然后对药物进行筛选,确定可能有效的白内障治疗药物。结果通过文本挖掘得到103个与白内障和抗氧化应激均相关的基因集,通过对这些基因的生物学过程的功能富集分析,筛选出22个基因,KEGG工具的进一步筛选确定了11个基因,通过蛋白质-蛋白质相互作用分析得到9个紧密联系的基因,与之对应的基因-药物相互作用分析筛选出了31种药物。结论利用文本挖掘和基因功能富集等生物信息学工具可以进一步探索白内障的发病机制,并且能够很方便地预测可能有效的治疗药物,为白内障的临床治疗提供了新的线索。 展开更多
关键词 文本挖掘 白内障 氧化应激 基因富集分析
在线阅读 下载PDF
基于深度神经网络的肝硬化中医治疗预测研究 预览
3
作者 肖瑞 裴卫 +1 位作者 胡冯菊 肖勇 《医学信息学杂志》 CAS 2019年第5期56-59,76共5页
以中医电子病历中肝硬化数据为数据源,运用数据清洗、主成份分析技术构建致病指标与诊断结果二元组,通过训练神经网络和支持向量机分类器模型进行预测结果对比,结果表明该方法有效可行。
关键词 中医 电子病历 神经网络 文本挖掘 肝硬化
在线阅读 下载PDF
基于文本数据挖掘的汽车行业岗位需求调查研究 预览
4
作者 丁艳 贾辰飞 《教育教学论坛》 2019年第5期251-252,共2页
对汽车及零配件行业内万余条企业主动人才述求进行分析,使用文本挖掘方法得到其岗位任务与任职资格关键内容,为汽车营销与服务专业人才培养方案的制(修)订提供岗位群依据。结果表明,“互联网+”与产业的融合促使新任务、新岗位的产生与... 对汽车及零配件行业内万余条企业主动人才述求进行分析,使用文本挖掘方法得到其岗位任务与任职资格关键内容,为汽车营销与服务专业人才培养方案的制(修)订提供岗位群依据。结果表明,“互联网+”与产业的融合促使新任务、新岗位的产生与人才需求。 展开更多
关键词 文本挖掘 岗位需求 汽车营销与服务
在线阅读 下载PDF
基于文本挖掘和机器学习的股指预测与决策研究 预览
5
作者 戴德宝 兰玉森 +1 位作者 范体军 赵敏 《中国软科学》 CSSCI CSCD 北大核心 2019年第4期166-175,共10页
依据行为金融学理论,资本市场投资者的心理和行为对股票指数变动有重要影响。为此本文假设投资者情绪与股票指数存在一定内在作用机制,能预测股票市场整体价格变化。通过文本挖掘技术和情感分析方法生成积极和消极各三阶共六类投资者情... 依据行为金融学理论,资本市场投资者的心理和行为对股票指数变动有重要影响。为此本文假设投资者情绪与股票指数存在一定内在作用机制,能预测股票市场整体价格变化。通过文本挖掘技术和情感分析方法生成积极和消极各三阶共六类投资者情绪时间序列数据;采用单位根检验、Granger因果关系检验和因子分析等方法构建上证投资者情绪综合指数,并分别使用支持向量机和神经网络预测股票市场价格变化,进行假设验证。结果表明:利用网络股市论坛文本数据和股票交易数据构建的上证投资者情绪综合指数能够提高股指走势预测的精度,有利于政府、在线平台、上市公司和投资主体更好决策。 展开更多
关键词 投资者情绪 股票预测 文本挖掘 机器学习
在线阅读 下载PDF
基于间断均衡理论视角的中国竞争政策变迁研究 预览
6
作者 熊励 钟美芝 许肇然 《智库理论与实践》 2019年第2期14-24,30共12页
[目的/意义]竞争是市场经济的本质特征,竞争政策是市场公平竞争的法治保障。中国政府不断强调要把竞争政策作为我国的基础经济政策,推动产业政策的竞争化发展,打造统一开放、竞争有序的市场经济。随着机构整合后的统一执法,中国竞争政... [目的/意义]竞争是市场经济的本质特征,竞争政策是市场公平竞争的法治保障。中国政府不断强调要把竞争政策作为我国的基础经济政策,推动产业政策的竞争化发展,打造统一开放、竞争有序的市场经济。随着机构整合后的统一执法,中国竞争政策的基础性地位将进一步强化。而我国竞争政策正面临着供给侧结构性改革和经济高质量发展等带来的考验,需要持续完善。因此,很有必要对中国竞争政策变迁过程进行梳理与分析,以便进一步探索智库理论与实践的新思路、新模式和新工具。[方法/过程]本文以1980至2017年中国竞争政策文本为研究对象,运用文本挖掘的方法,对我国竞争政策的发展脉络与阶段性特征进行系统的梳理和解读。并基于竞争政策文本的量化分析结果,运用间断均衡理论对中国竞争政策的变迁进行解释。[结果/结论]研究发现,改革开放以来我国竞争政策呈现出由均衡到间断再到均衡的发展脉络,是新型智库建设的创新点。 展开更多
关键词 竞争政策 间断均衡 文本挖掘 共词分析 智库研究
在线阅读 下载PDF
基于数据关联与文本挖掘技术的图书馆文献资源开发利用研究 预览
7
作者 张影 《中国中医药图书情报杂志》 2019年第4期48-51,共4页
数据关联与文本挖掘技术为图书馆文献资源开发利用提供了新方法。文章阐述了图书馆文献资源开发利用的现状,阐明应用数据关联与文本挖掘技术的必要性,明确了基于数据关联与文本挖掘技术图书馆文献资源开发利用的4项原则,即持久性原则、... 数据关联与文本挖掘技术为图书馆文献资源开发利用提供了新方法。文章阐述了图书馆文献资源开发利用的现状,阐明应用数据关联与文本挖掘技术的必要性,明确了基于数据关联与文本挖掘技术图书馆文献资源开发利用的4项原则,即持久性原则、重点性原则、主动性原则与价值性原则。并从数据源、文本处理、文本挖掘分析、可视化处理4个方面设计了基于数据关联与文本挖掘技术图书馆文献资源开发利用的流程,提出了构建过程中应注意的问题,以期推动图书馆文献资源的开发与利用。 展开更多
关键词 数据关联 文本挖掘 图书馆 文献资源 开发利用
在线阅读 免费下载
“一带一路”倡议海外传播分析——基于对主要国际媒体的文本挖掘方法 预览
8
作者 李倩倩 李瑛 刘怡君 《情报杂志》 CSSCI 北大核心 2019年第3期121-126,132共7页
[目的/意义]了解国际主流媒体如何建构“一带一路”倡议,有利于把握“一带一路”倡议在国际传播的议程设置方向。[方法/过程]以CNN、BBC、半岛电视台(AJ)、今日俄罗斯(RT)关于倡议的新闻报道为研究对象,利用主题模型、文档相似性等文本... [目的/意义]了解国际主流媒体如何建构“一带一路”倡议,有利于把握“一带一路”倡议在国际传播的议程设置方向。[方法/过程]以CNN、BBC、半岛电视台(AJ)、今日俄罗斯(RT)关于倡议的新闻报道为研究对象,利用主题模型、文档相似性等文本挖掘方法,探析国际主流媒体的报道重点和相似关联性。[结果/结论]发现:在内容上,国际媒体更多关注倡议落实过程中面临的严峻挑战和对国际社会上产生的影响;在参与度上,国际媒体援引中国国家主流媒体信源的内容不多,中国智库和研究者的声音比较薄弱;在相似性上,CNN、BBC、AJ享有更多的相似议程设置,而RT则相对独立。最后,提出增强“一带一路”倡议海外传播能力的建议。 展开更多
关键词 "一带一路"倡议 海外传播 文本挖掘 主题模型 文本相似性
在线阅读 下载PDF
基于文本挖掘的新疆自驾游客流时空特征研究 预览
9
作者 刘旭玲 李婧萱 +1 位作者 唐丹丹 杨芳 《新疆财经》 2019年第1期32-38,共7页
本文借助网络游记文本,运用ROST-CM和Arcgis软件,通过语义网络分析和解读,并拾取地理位置信息,研究新疆自驾游客流的时空特征。研究发现:新疆自驾车旅游游客出游时间集中程度高,年内分布不均匀,主要集中在7月、8月和9月,旅游淡旺季明显... 本文借助网络游记文本,运用ROST-CM和Arcgis软件,通过语义网络分析和解读,并拾取地理位置信息,研究新疆自驾游客流的时空特征。研究发现:新疆自驾车旅游游客出游时间集中程度高,年内分布不均匀,主要集中在7月、8月和9月,旅游淡旺季明显;新疆自驾游的客源市场高度集中于北京、上海和广东等发达地区,东部沿海地区和中部经济较发达的湖北省、重庆市等也是新疆重要的自驾游的客源地,新疆本地自驾游的客源市场潜力大,临近省份客源比例不高;新疆自驾游客流活动空间分布范围广,多呈片状或带状分布,空间密度分布不均衡,冷热点区和圈层分布明显;新疆自驾车游客活动空间轨迹呈多边形多个核心节点放射状,北疆节点联结密度高于南疆和东疆,北疆联结点集中在乌鲁木齐市、克拉玛依市和伊宁市等地,东疆主要联结点为哈密地区的哈密市、巴里坤县、淖毛湖镇等地,南疆联结点主要聚集于喀什地区与和田地区,呈大分散小集聚联结的特点。 展开更多
关键词 自驾游 时空特征 文本挖掘 新疆
在线阅读 免费下载
自然语言处理技术在建筑使用后评价中的应用 预览
10
作者 王烟 《南方建筑》 2019年第1期82-87,共6页
为拓展建筑使用后评价(POE)方法的研究思路,弥补过去人工分析文本评价信息在效率方面的局限,通过对自然语言处理技术最新研究成果的介绍,指出其可为建筑POE提供的技术支持。利用现有自然语言处理工具对小学儿童的自由报告式环境评价性... 为拓展建筑使用后评价(POE)方法的研究思路,弥补过去人工分析文本评价信息在效率方面的局限,通过对自然语言处理技术最新研究成果的介绍,指出其可为建筑POE提供的技术支持。利用现有自然语言处理工具对小学儿童的自由报告式环境评价性文本进行建筑POE案例研究。结合案例,指出词性分词、关键词词云、情感分析及评论观点抽取等技术在建筑POE应用中的研究方式与步骤,并初步探讨自然语言处理技术在建筑POE中的局限性和应用前景。 展开更多
关键词 自然语言处理 使用后评价 文本挖掘 儿童作文
在线阅读 下载PDF
高职院校电子商务专业数据分析能力培养研究--基于长三角城市群企业调查数据 预览
11
作者 赵建伟 彭成圆 《无锡职业技术学院学报》 2019年第2期6-9,共4页
随着数据科学的应用和发展,电子商务领域企业的运营推广更依赖于数据的分析和应用。文章以企业需求为导向,借助于大数据分析和文本挖掘等分析方法,调查了"长三角"三千多个电子商务岗位,研究分析了电子商务岗位数据统计分析、... 随着数据科学的应用和发展,电子商务领域企业的运营推广更依赖于数据的分析和应用。文章以企业需求为导向,借助于大数据分析和文本挖掘等分析方法,调查了"长三角"三千多个电子商务岗位,研究分析了电子商务岗位数据统计分析、数据搜集、制作数据报表、流量监控、分析报告、SEO等典型职业活动,并对数据分析的技能要求进行了归纳和总结,从而提出了高等职业院校电子商务专业数据分析能力提升建议。 展开更多
关键词 商务数据分析 电子商务 文本挖掘
在线阅读 下载PDF
面向数字人文的特藏资源揭示研究——以方志数据库建设为例 预览
12
作者 张毅 李欣 《图书馆》 CSSCI 北大核心 2019年第6期100-105,共6页
特藏资源是一个图书馆独特价值的体现,很多图书馆都非常重视特色馆藏建设与数字化,然而,传统的资源揭示方式无法充分体现特藏资源的价值。文章通过解读数字人文概念、调查国内外数字人文研究进展,探索图书馆利用现有数字人文研究成果揭... 特藏资源是一个图书馆独特价值的体现,很多图书馆都非常重视特色馆藏建设与数字化,然而,传统的资源揭示方式无法充分体现特藏资源的价值。文章通过解读数字人文概念、调查国内外数字人文研究进展,探索图书馆利用现有数字人文研究成果揭示与激活特藏资源的方法,又以华东师范大学图书馆特藏方志数据库建设为例,利用文本挖掘、GIS、可视化、关联数据等技术在时间和空间两个维度对方志资源进行揭示。 展开更多
关键词 特藏资源 数字人文 地方志数据库 GIS 可视化 文本挖掘
在线阅读 下载PDF
引入新闻短文本的个股走势预测模型
13
作者 张梦吉 杜婉钰 郑楠 《数据分析与知识发现》 CSSCI CSCD 北大核心 2019年第5期11-18,共8页
【目的】结合深度学习,分析股市数值数据和财经新闻,提高股票涨跌预测准确率。【方法】建立基于事件的新闻分类模型,使用多输入的循环神经网络建立基于新闻事件、资金流向和公司财务的个股走势预测模型,提升股票预测准确率。【结果】引... 【目的】结合深度学习,分析股市数值数据和财经新闻,提高股票涨跌预测准确率。【方法】建立基于事件的新闻分类模型,使用多输入的循环神经网络建立基于新闻事件、资金流向和公司财务的个股走势预测模型,提升股票预测准确率。【结果】引入新闻文本后模型预测准确率进一步提升,其中,采矿业准确率达到76.22%,医药制造业准确率达到77.36%。【局限】未验证新闻标题与新闻文章对股价影响程度的差异,且新闻事件的分类是基于一年内的新闻数据集进行人工划分,数据集不具备完整性和代表性。【结论】引入新闻事件作为股票预测模型的特征之一,能够提升预测的准确率。 展开更多
关键词 个股走势预测 深度学习 文本挖掘
基于文本挖掘技术的酒店社交媒体营销分析——以首旅如家、华住、格林酒店集团为例 预览
14
作者 沈慧贤 《乐山师范学院学报》 2019年第5期60-65,共6页
国内酒店企业对社交媒体上的用户生成数据的挖掘和利用不足。为了帮助酒店企业找到社交媒体数据挖掘的有效手段,发现数据隐含的知识,文章采用案例法,借助文本内容挖掘软件,对国内三家品牌酒店集团的官方微博进行了质性分析。研究发现,... 国内酒店企业对社交媒体上的用户生成数据的挖掘和利用不足。为了帮助酒店企业找到社交媒体数据挖掘的有效手段,发现数据隐含的知识,文章采用案例法,借助文本内容挖掘软件,对国内三家品牌酒店集团的官方微博进行了质性分析。研究发现,三家酒店集团的社交媒体营销策略、侧重程度、资源配置程度不同;促销推广、粉丝互动、服务质量保证、公共关系、社交性推文是三家酒店社交媒体营销的五大主题。研究结果表明,文本内容挖掘是酒店社交媒体数据挖掘的有效途径,它有助于酒店决策部门找到制定市场战略的充分依据。 展开更多
关键词 社交媒体营销 酒店 文本挖掘
在线阅读 下载PDF
基于大数据算法的电话号码与客户编号对应关系的识别研究与实现 预览
15
作者 刘鲲鹏 盛妍 +1 位作者 何薇 宫立华 《计算机应用与软件》 北大核心 2019年第3期301-307,共7页
基于95598业务,利用大数据分析挖掘方法,构建统一身份识别模型,有效识别客户来电号码与户号的对应关系。采用大数据文本挖掘技术,有效解析用电地址信息、客户姓名等内容,并计算地址相似度得分、姓名相似度得分,作为对应关系校验以及识... 基于95598业务,利用大数据分析挖掘方法,构建统一身份识别模型,有效识别客户来电号码与户号的对应关系。采用大数据文本挖掘技术,有效解析用电地址信息、客户姓名等内容,并计算地址相似度得分、姓名相似度得分,作为对应关系校验以及识别疑似户号的关键因子指标。针对能获取到的对应关系,构建权重划分模型,计算对应关系匹配度得分,根据分值大小,校验对应关系的可靠性。针对找不到户号对应关系的来电号码,基于文本相似度得分构建KNN模型,计算对应关系匹配度得分,依据分值大小,识别疑似户号。 展开更多
关键词 统一身份识别 文本挖掘 权重划分 KNN模型
在线阅读 下载PDF
名老中医慢性阻塞性肺疾病医案的疗效评价研究 预览
16
作者 叶超 林色奇 +2 位作者 薛汉荣 喻强强 查青林 《江西中医药大学学报》 2019年第4期25-27,48共4页
目的:探索中医治疗慢性阻塞性肺疾病(COPD)的疗效评价方法,构建适用于中医治疗COPD的临床评价体系。方法:以"十五"国家科技攻关计划-"基于信息挖掘技术的名老中医临床诊疗经验及传承方法研究"中154例名老中医治疗C... 目的:探索中医治疗慢性阻塞性肺疾病(COPD)的疗效评价方法,构建适用于中医治疗COPD的临床评价体系。方法:以"十五"国家科技攻关计划-"基于信息挖掘技术的名老中医临床诊疗经验及传承方法研究"中154例名老中医治疗COPD医案为分析对象,采用文本挖掘技术进行分析。数据分析在SAS9.1.3平台上进行,将病情变化术语进行症状和程度规范,利用数据库将初诊现病史与末次诊察病情变化进行关联,比较患者初诊、复诊时病情程度变化,将疗效判定规则输入SAS软件程序,由程序给出疗效结果。结果:疗效分析显示:COPD医案的咳嗽、心悸、胸闷、睡眠差、喘息、头晕疗效较好,好转消失率分别为79.41%、75%、72.22%、62.5%、61.76%、60%;而咽痒、下肢浮肿、大便溏、咯痰、食欲差、口干、乏力、便秘的疗效较差,好转消失率仅为50%、50%、40%、33.93%、30%、14.29%、10%、0%。结论:现代名老中医COPD医案的疗效具有一定特色,主要表现在对全身症状,如心悸、睡眠差、头晕的改善上,对疾病相关症状喘息、咳嗽、胸闷也有改善作用。深入挖掘名老中医有效医案的证治规律,有利于提高临床医生诊治水平。 展开更多
关键词 慢性阻塞性肺疾病 中医医案 文本挖掘 疗效评价
在线阅读 下载PDF
基于LDA模型的网络刊物主题发现与聚类 预览
17
作者 杨传春 张冰雪 +1 位作者 李仁德 郭强 《上海理工大学学报》 CAS CSCD 北大核心 2019年第3期273-280,306共9页
随着智能终端的普及,文本的主题挖掘需求也越来越广泛,主题建模是文本主题挖掘的核心,LDA生成模型是基于贝叶斯框架的概率模型,它以语义关联为基础,很好地解决了文本潜在主题的提取问题。对文本聚类过程的核心技术LDA生成模型、数据采... 随着智能终端的普及,文本的主题挖掘需求也越来越广泛,主题建模是文本主题挖掘的核心,LDA生成模型是基于贝叶斯框架的概率模型,它以语义关联为基础,很好地解决了文本潜在主题的提取问题。对文本聚类过程的核心技术LDA生成模型、数据采样、模型评价等作了较为深入的阐述和解析,结合网络教育平台的2794篇学习刊物进行了主题发现和聚类实验,建立了包含3800个词项的词库,通过kmeans算法和合并向量算法(UVM)分两步解决了主题聚类问题。提出了文本挖掘实验的一般方法,并对层次聚类中文本距离的算法提出了改进。实验结果表明,该平台刊物的主题整体相似度比较好,但主题过于集中使得许多刊物的内容不具有辨识度,影响用户对主题的定位。 展开更多
关键词 LDA模型 生成模型 主题发现 层次聚类 文本挖掘
在线阅读 下载PDF
基于深度学习的疾病命名实体识别 预览
18
作者 袁源 何云琪 钱龙华 《福建电脑》 2019年第3期39-42,共4页
疾病命名实体识别是生物医学领域文本挖掘的最基础任务之一。基于当前流行的深度学习方法,本文采用BiLSTM-CNN-CRF模型来识别生物医学文献中的疾病命名实体。该模型首先用卷积神经网络(CNN)来获取字符级的词向量表示,然后利用双向长短... 疾病命名实体识别是生物医学领域文本挖掘的最基础任务之一。基于当前流行的深度学习方法,本文采用BiLSTM-CNN-CRF模型来识别生物医学文献中的疾病命名实体。该模型首先用卷积神经网络(CNN)来获取字符级的词向量表示,然后利用双向长短时记忆网络(BiLSTM)来获取单词的隐含表示,最后使用条件随机场(CRF)模型输出疾病实体的标签。实验结果表明,与传统模型相比,深度学习方法在疾病命名实体识别任务上有显著的优势,最终该模型在NCBI语料库上的取得84.47%的F1值。 展开更多
关键词 疾病实体识别 文本挖掘 深度学习
在线阅读 下载PDF
中美血管外科专利创新轨迹研究 预览
19
作者 朱一超 李艳红 欧敬民 《中国发明与专利》 2019年第1期33-38,共6页
外周血管疾病的发病率逐年猛增,揭示血管外科专利的发展轨迹,可以更好掌握血管外科技术的发展方向。通过中文分词、词频统计、关联规则、分布分析和趋势预测等文本挖掘技术,着重于中美专利数量、范围、关注点和发展趋势等的对比分析。... 外周血管疾病的发病率逐年猛增,揭示血管外科专利的发展轨迹,可以更好掌握血管外科技术的发展方向。通过中文分词、词频统计、关联规则、分布分析和趋势预测等文本挖掘技术,着重于中美专利数量、范围、关注点和发展趋势等的对比分析。主要发现:中美血管外科专利数量总体呈上升趋势,涉及范围在扩大;中美关注度主要在支架、导管、球囊这三类器械,材料从金属发展到可降解,正在注重减少器械残留在体内对人体的伤害;美国除了关注与中国相同的4个小类外,还关注另外7类等,涉及到化合物、肽和一些生物材料的研究;中国在药物洗脱支架方面,对地塞米松涂层的研究较少,对钴铬合金的应用不多等。 展开更多
关键词 血管外科 专利 文本挖掘 专利数据库 专利文献
在线阅读 下载PDF
基于语义结构的迁移学习文本特征对齐算法 预览
20
作者 卢晨阳 康雁 +1 位作者 杨成荣 蒲斌 《计算机工程》 CAS CSCD 北大核心 2019年第5期116-121,共6页
特征对齐在源域和目标域空间不一致时会导致负迁移现象。为此,提出一种基于GloVe和WordNet模型的迁移学习文本特征对齐算法。根据数据样本词性和类别对分类任务进行特征筛选,选择源域和目标域的领域共有词作为枢纽词,使用GloVe模型对齐... 特征对齐在源域和目标域空间不一致时会导致负迁移现象。为此,提出一种基于GloVe和WordNet模型的迁移学习文本特征对齐算法。根据数据样本词性和类别对分类任务进行特征筛选,选择源域和目标域的领域共有词作为枢纽词,使用GloVe模型对齐源域和目标域中最相似的非枢纽特征。在此基础上,根据源域和目标域的非共有特征,通过WordNet模型对领域独立特征完成强语义对齐,同时利用含有枢纽特征的对齐三元组表示对齐特征。实验结果表明,该算法可有效降低特征维度,扩充特征空间,提高跨领域文本分类精度。 展开更多
关键词 迁移学习 特征对齐 词向量 词网 文本挖掘
在线阅读 下载PDF
上一页 1 2 61 下一页 到第
使用帮助 返回顶部 意见反馈