期刊文献+
共找到67篇文章
< 1 2 4 >
每页显示 20 50 100
基于FCN的图像感兴趣区域提取与细粒度分类的研究 预览
1
作者 戴志鹏 《现代计算机》 2019年第3期44-49,共6页
近年来基于深度学习的细粒度分类是研究的热点,细粒度分类的主要方法是先找出分类对象再分类。找出分类对象的方法中主要分为两种:强监督与弱监督,强监督需要使用昂贵的人工标签,为了减少人工标注成本,提出一种基于FCN的图像感兴趣区域... 近年来基于深度学习的细粒度分类是研究的热点,细粒度分类的主要方法是先找出分类对象再分类。找出分类对象的方法中主要分为两种:强监督与弱监督,强监督需要使用昂贵的人工标签,为了减少人工标注成本,提出一种基于FCN的图像感兴趣区域的分割与提取,并利用分割的图像进一步训练网络提高正确率。 展开更多
关键词 监督 FCN 感兴趣区域
在线阅读 免费下载
基于动作模板匹配的弱监督动作定位 预览
2
作者 石祥滨 周金成 刘翠微 《计算机应用》 CSCD 北大核心 2019年第8期2408-2413,共6页
为解决视频中的动作定位问题,提出一种基于模板匹配的弱监督动作定位方法。首先在视频的每一帧上给出若干个动作主体位置的候选框,按时间顺序连接这些候选框形成动作提名;然后利用训练集视频的部分帧得到动作模板;最后利用动作提名与动... 为解决视频中的动作定位问题,提出一种基于模板匹配的弱监督动作定位方法。首先在视频的每一帧上给出若干个动作主体位置的候选框,按时间顺序连接这些候选框形成动作提名;然后利用训练集视频的部分帧得到动作模板;最后利用动作提名与动作模板训练模型,找到最优的模型参数。在UCF-sports数据集上进行实验,结果显示,与TLSVM方法相比,所提方法的动作分类准确率提升了0.3个百分点;当重叠度阈值取0.2时,与CRANE方法相比,所提方法的动作定位准确率提升了28.21个百分点。实验结果表明,所提方法不但能够减少数据集标注的工作量,而且动作分类和动作定位的准确率均得到提升。 展开更多
关键词 动作定位 动作模板 监督 动作提名 视频
在线阅读 下载PDF
基于关键词的蛋白质交互关系识别 预览
3
作者 毛宇薇 牛耘 《计算机技术与发展》 2019年第3期18-22,共5页
蛋白质交互关系(PPI)是生物医学领域的重要研究内容之一,目前通过生物医学实验得到的PPI信息主要以文本的形式存储在相关文献中。随着生物医学文献数量的飞速增长,人工识别PPI的方式已经难以满足实际应用需求。文中采用基于弱监督的PPI... 蛋白质交互关系(PPI)是生物医学领域的重要研究内容之一,目前通过生物医学实验得到的PPI信息主要以文本的形式存储在相关文献中。随着生物医学文献数量的飞速增长,人工识别PPI的方式已经难以满足实际应用需求。文中采用基于弱监督的PPI识别基础框架,以少量有交互关系的蛋白质对作为种子集,通过对种子集的不断迭代扩充,最终实现蛋白质交互关系识别。相比于现有的其他方法,该方法仅需少量有标注数据实现了较好的识别效果,节省了大量人力物力。在此基础上,利用词向量对现有的表达交互关系的关键词进行扩充,并对关键词的可靠性进行评分,根据扩充后的关键词集合对基础框架的聚类过程做了改进,将聚类的输入词汇模式集合根据所包含的关键词分数做降序排序。实验结果表明,基础的PPI识别框架仅有少量有标注数据取得了较好的结果,在此基础上改进后的关键词扩充算法进一步提高了PPI识别结果,第一次迭代后的F值最高为67.20%,比改进前的算法提高了1.54%,三次迭代后的F值为69.05%。 展开更多
关键词 蛋白质交互关系 监督 分布式假设 词向量 关键词
在线阅读 下载PDF
基于深度CNN的改进弱监督学习方法设计与验证 预览
4
作者 尚重阳 赵东波 陈杰 《重庆邮电大学学报:自然科学版》 CSCD 北大核心 2019年第2期183-190,共8页
针对包含目标、尺度和平移变化较强的空间信息难以获取大量训练样本的问题,提出一种基于深度卷积神经网络(deep convolutional neural network,DCCN)的弱监督学习方法,从3个层面对当前卷积神经网络进行扩展。为了提取分辨率更高的局部特... 针对包含目标、尺度和平移变化较强的空间信息难以获取大量训练样本的问题,提出一种基于深度卷积神经网络(deep convolutional neural network,DCCN)的弱监督学习方法,从3个层面对当前卷积神经网络进行扩展。为了提取分辨率更高的局部特征,同时考虑到全卷积网络(full convolution network,FCN)在全监督式学习下的高效性能,使用FCN作为后端模块;为了获取更多的通用特征,增加一个多映射弱监督学习的传输层,对与补充性类模态相关的多个局部特征进行显式学习;为了优化训练过程,改进了池化层,使用全局图像标签进行训练,将空间得分聚合为全局预测。使用图像分类、弱监督逐点目标定位和图像分割3种常用的机器视觉任务进行评估。多个公开数据库的实验结果表明,所提方法能够有效地学习强局部特征,具有良好的分类和定位效果。 展开更多
关键词 卷积神经网络 监督 池化层 机器视觉 局部特征
在线阅读 免费下载
一种用于病案相似性度量的弱监督学习算法 预览
5
作者 张振宇 朱培栋 赵东升 《计算机技术与发展》 2019年第9期1-6,共6页
弱监督机器学习算法解决标签模糊类的问题具有更好的优势,该类算法缓解了数据标签的精度要求。病案的相似性度量就是这类问题,其对医疗数据的应用有着极其重要的基础性作用。鉴于现有病案相似性度量算法通常只基于病理关系的理论规则模... 弱监督机器学习算法解决标签模糊类的问题具有更好的优势,该类算法缓解了数据标签的精度要求。病案的相似性度量就是这类问题,其对医疗数据的应用有着极其重要的基础性作用。鉴于现有病案相似性度量算法通常只基于病理关系的理论规则模型提出,忽略了数据本身包含的信息,文中提出一种弱监督机器学习算法应用于病案相似性度量。该算法首先基于多指标概率分配的方法进行病案组的构建,避免陷入局部最优的情况;然后根据理论模型进行标签赋值,充分利用理论信息;最后通过输入、损失函数、学习模型的分析,从机器学习的角度进行病案的相似性度量。与经典病案相似性度量算法相比,该算法提高了病案相似性度量的准确性,解决了高成本标签的问题。 展开更多
关键词 监督 机器学习 病案相似性 理论模型
在线阅读 下载PDF
基于弱监督的改进型GoogLeNet在DR检测中的应用 预览
6
作者 丁英姿 丁香乾 郭保琪 《计算机应用》 CSCD 北大核心 2019年第8期2484-2488,共5页
针对糖尿病视网膜病变分级检测中标定样本少、多目标检测的问题,提出了一种基于改进型GoogLeNet的弱监督目标检测网络。首先,对GoogLeNet网络进行改进,去掉最后一个全连接层并保留检测目标的位置信息,添加全局最大池化层,以sigmoid交叉... 针对糖尿病视网膜病变分级检测中标定样本少、多目标检测的问题,提出了一种基于改进型GoogLeNet的弱监督目标检测网络。首先,对GoogLeNet网络进行改进,去掉最后一个全连接层并保留检测目标的位置信息,添加全局最大池化层,以sigmoid交叉熵作为训练的目标函数以获得带有多种特征位置信息的特征图;然后,基于弱监督方法仅使用类别标签对网络进行训练;其次,设计一种连通区域算法来计算特征连通区域边界坐标集合;最后在待测图片中使用边界框定位病灶。实验结果表明,在小样本条件下,改进模型准确率达到了94.5%,与SSD算法相比,准确率提高了10%。改进模型实现了小样本条件下端到端的病变识别,同时该模型的高准确率保证了模型在眼底筛查中具有应用价值。 展开更多
关键词 糖尿病视网膜病变 监督 卷积神经网络 目标检测网络 全局最大池化
在线阅读 下载PDF
一种语义弱监督LDA的商品评论细粒度情感分析算法
7
作者 彭云 万红新 钟林辉 《小型微型计算机系统》 CSCD 北大核心 2018年第5期978-985,共8页
随着商品评论文本数据的日益增加,需要利用情感分析技术来自动实现商品的情感极性分类,尤其是细粒度的情感分类.LDA主题模型可以实现大规模文本数据的主题词提取,并利用主题聚类功能发现特征词和情感词之间的潜在关系,但LDA模型倾向于... 随着商品评论文本数据的日益增加,需要利用情感分析技术来自动实现商品的情感极性分类,尤其是细粒度的情感分类.LDA主题模型可以实现大规模文本数据的主题词提取,并利用主题聚类功能发现特征词和情感词之间的潜在关系,但LDA模型倾向于提取粗粒度的情感分类知识,难以满足细粒度情感分析的语义需求.本文提出了一种语义弱监督的主题模型,在LDA模型中嵌入词语关联、全局特征词及主题情感隶属语义先验知识来提升LDA对特征词、情感词及其关系的识别能力.主要研究内容包括:从句法分析、词性关系和语境相关等角度进行词语关联语义约束的提取;全局特征词识别和主题情感隶属两类语义约束的获取;设计语义约束对LDA主题分配的影响机制,构建语义弱监督的细粒度情感分析主题模型SWS-LDA.实验表明,SWS-LDA模型可以改善LDA的语义理解能力,提高局部特征词和局部情感词的提取率,提升主题模型细粒度情感极性分类的准确性. 展开更多
关键词 商品评论 主题模型 LDA 情感分析 监督
基于弱监督预训练CNN模型的情感分析方法 预览
8
作者 张越 夏鸿斌 《计算机工程与应用》 CSCD 北大核心 2018年第13期27-33,共7页
传统的情感分析研究大多基于机器学习算法,此类方法依赖大量人工抽取的特征与领域知识。使用卷积神经网络自动学习文本的特征表示,进而判别文本的情感极性。为了解决情感分析中监督训练样本不足的问题,利用大规模弱监督数据来训练卷积... 传统的情感分析研究大多基于机器学习算法,此类方法依赖大量人工抽取的特征与领域知识。使用卷积神经网络自动学习文本的特征表示,进而判别文本的情感极性。为了解决情感分析中监督训练样本不足的问题,利用大规模弱监督数据来训练卷积神经网络。同时引入"预训练-微调"策略,先在弱监督数据集上对卷积神经网络进行预训练,然后使用监督数据集进行微调训练来克服弱监督数据中的噪声问题。在SemEval-2013 Twitter情感分析数据集上进行实验验证,结果表明由于引入了弱监督数据参与训练,有效增强了卷积神经网络学习情感语义的能力,从而提升了模型的准确性。 展开更多
关键词 情感分析 监督 预训练-微调 卷积神经网络
在线阅读 下载PDF
弱监督军事实体关系识别 预览
9
作者 李煜甫 黄蔚 胡国超 《电子设计工程》 2018年第1期74-78,83共6页
目前的实体关系识别方法, 无法充分利用海量未标注军事文本中的潜在信息, 并且在实体关系特征词提取方面并不完善.于是本文对实体关系描述词的特点进行了分析, 提出了一种语义层面的弱监督军事实体关系识别技术.本方法采取Word2vec模型... 目前的实体关系识别方法, 无法充分利用海量未标注军事文本中的潜在信息, 并且在实体关系特征词提取方面并不完善.于是本文对实体关系描述词的特点进行了分析, 提出了一种语义层面的弱监督军事实体关系识别技术.本方法采取Word2vec模型和FPGrowth算法对海量未标注军事文本进行分析, 从关联分析角度进行实体关系描述词提取, 从语义相似角度进行关系词扩充, 并提出一种浅层关系分类矩阵对实体关系进行分类.该方法在对1000篇军事文本测试中, 取得了加权平均值F-Score为89.2%的效果. 展开更多
关键词 实体关系识别 监督 BOOTSTRAPPING Word2vec FPGrowth 浅层关系分类矩阵
在线阅读 下载PDF
基于Attention的弱监督多标号图像分类 预览
10
作者 张文 谭晓阳 《数据采集与处理》 CSCD 北大核心 2018年第5期801-808,共8页
深度学习依赖于大数据在很多的任务中取得巨大成功,但目前大部分方法都依赖于严格标注的数据,或者假定仅含一个物体大致位于图片近中心位置且背景较少。而现实场景中背景复杂,出现的物体多样,增加了分类的难度,而且标注的代价很大。本... 深度学习依赖于大数据在很多的任务中取得巨大成功,但目前大部分方法都依赖于严格标注的数据,或者假定仅含一个物体大致位于图片近中心位置且背景较少。而现实场景中背景复杂,出现的物体多样,增加了分类的难度,而且标注的代价很大。本文关注于弱监督场景下的分类任务,提出了基于注意力机制(Attention)结合递归神经网络的深度模型,利用图片级的标注进行多标号学习,利用损失函数进行梯度下降训练自动调整关注区域,使模型每次关注图片的局域区域,并在数据集PASCAL VOC 2007/2012上验证算法的有效性,与其他方法相比具有更强的可解释性。 展开更多
关键词 监督 多标号 注意力 深度学习
在线阅读 下载PDF
基于弱监督的蛋白质交互识别 预览
11
作者 彭昀磊 牛耘 《计算机技术与发展》 2018年第2期19-23,共5页
蛋白质交互信息是解决大量医学难题的关键信息,这些信息都记录在医学文献中,随着生物医学文献的大量增加,以手工收集信息的方式已经难以满足实际需求.对此,提出一种基于弱监督的方法识别文本中的蛋白质交互关系.该方法首先根据文本库产... 蛋白质交互信息是解决大量医学难题的关键信息,这些信息都记录在医学文献中,随着生物医学文献的大量增加,以手工收集信息的方式已经难以满足实际需求.对此,提出一种基于弱监督的方法识别文本中的蛋白质交互关系.该方法首先根据文本库产生蛋白质交互的向量表示;接着根据蛋白质对实例的相似性对实例聚类,产生提取模式;然后根据提取模式从文本库中找到新的满足条件的蛋白质对实例,作为候选实例;最后对候选实例对应的蛋白质对进行评估,并将满足条件的蛋白质对添加到种子集合中.该方法仅需少量的蛋白质对作为种子,通过迭代算法不断扩充种子集,可以使得监督最小化,极大地减少了人工干预.实验结果表明,该方法取得了较高的精度和召回率. 展开更多
关键词 蛋白质交互 监督 聚类 模式
在线阅读 下载PDF
弱监督任意姿态人体检测 预览 被引量:1
12
作者 蔡雅薇 谭晓阳 《计算机科学与探索》 CSCD 北大核心 2017年第4期587-598,共12页
困难姿态(多视角或者任意姿态)下的弱监督人体检测问题被关注研究。现在大部分人体检测仅仅关注普通的直立姿态,但现实中的人体却呈现非常丰富的姿态(如弯曲的、躺着的、坐着的),这不仅加大了人体检测的难度,而且令标注工作更加... 困难姿态(多视角或者任意姿态)下的弱监督人体检测问题被关注研究。现在大部分人体检测仅仅关注普通的直立姿态,但现实中的人体却呈现非常丰富的姿态(如弯曲的、躺着的、坐着的),这不仅加大了人体检测的难度,而且令标注工作更加困难,实际中通常只能获得弱标注样本。多示例学习方法放松了精准标注的要求,因此常常被用来解决此类问题。但是多示例学习对正示例的质量以及一些模型参数设置相当敏感,例如将示例层次条件概率融合到包层次的策略。在PascalVOC2007的人类数据集上对这些重要但很少被关注的问题进行了综合性深度研究,并提出了一种新的选择性弱监督检测算法(selectiveweaklysuperviseddetection,SWSD)。实验证明,只要添加少量的监督样本,在多示例学习框架下,可以大幅度提高弱监督人体检测性能。 展开更多
关键词 监督 人体检测 任意姿态 多示例学习
在线阅读 下载PDF
基于弱监督和半自动方法的中文关系抽取数据集构建 预览 被引量:1
13
作者 马超义 徐蔚然 《中文信息学报》 CSCD 北大核心 2017年第5期114-119,共6页
关系抽取是信息抽取中的一项基础任务,对信息检索、问答系统、知识图谱等有非常重要的意义。现有的关系抽取数据集存在包含类别太少、句子标注困难、不易扩展等缺陷,且只有英文数据集,不能很好地解决中文关系抽取任务。该文采用弱监督... 关系抽取是信息抽取中的一项基础任务,对信息检索、问答系统、知识图谱等有非常重要的意义。现有的关系抽取数据集存在包含类别太少、句子标注困难、不易扩展等缺陷,且只有英文数据集,不能很好地解决中文关系抽取任务。该文采用弱监督和半自动的方法,构建了一份中文关系抽取数据集,弥补了上述不足。首先借助维基百科抽取出丰富的关系对,从百度搜索返回结果及搜狗新闻语料中抽取包含实体对的句子,完成弱监督句子抽取过程。将句子放入RNN关系抽取系统进行打分,选取标注价值高的句子提交人工标注,对标注结果进行处理,最终得到中文关系抽取数据集。 展开更多
关键词 关系抽取 数据集 监督 半自动
在线阅读 下载PDF
基于卷积神经网络的中文医疗弱监督关系抽取 预览 被引量:2
14
作者 刘凯 符海东 +1 位作者 邹玉薇 顾进广 《计算机科学》 CSCD 北大核心 2017年第10期249-253,共5页
随着医疗领域受到越来越多的关注,自然语言处理的理论和应用逐渐拓展到该领域,其中信息抽取技术在该领域的应用成为研究热点。针对信息抽取技术在医疗领域实体关系抽取中的应用,提出一种基于卷积神经网络的弱监督关系抽取方法。该方法... 随着医疗领域受到越来越多的关注,自然语言处理的理论和应用逐渐拓展到该领域,其中信息抽取技术在该领域的应用成为研究热点。针对信息抽取技术在医疗领域实体关系抽取中的应用,提出一种基于卷积神经网络的弱监督关系抽取方法。该方法通过添加人工规则使训练语料带有实体关系标签,然后将该弱关系训练语料转换为向量特征矩阵,并输入到卷积神经网络进行分类模型训练,最终实现实体关系抽取。实验结果表明,该方法比常规机器学习方法更加准确高效。 展开更多
关键词 自然语言处理 实体关系抽取 监督 卷积神经网络
在线阅读 免费下载
情感分类研究进展 预览 被引量:17
15
作者 陈龙 管子玉 +1 位作者 何金红 彭进业 《计算机研究与发展》 CSCD 北大核心 2017年第6期1150-1170,共21页
文本情感分析是多媒体智能理解的重要问题之一.情感分类是情感分析领域的核心问题,旨在解决评论情感极性的自动判断问题.由于互联网评论数据规模与日俱增,传统基于词典的方法和基于机器学习的方法已经不能很好地处理海量评论的情感分... 文本情感分析是多媒体智能理解的重要问题之一.情感分类是情感分析领域的核心问题,旨在解决评论情感极性的自动判断问题.由于互联网评论数据规模与日俱增,传统基于词典的方法和基于机器学习的方法已经不能很好地处理海量评论的情感分类问题.随着近年来深度学习技术的快速发展,其在大规模文本数据的智能理解上表现出了独特的优势,越来越多的研究人员青睐于使用深度学习技术来解决文本分类问题.主要分为2个部分:1)归纳总结传统情感分类技术,包括基于字典的方法、基于机器学习的方法、两者混合方法、基于弱标注信息的方法以及基于深度学习的方法;2)针对前人情感分类方法的不足,详细介绍所提出的面向情感分类问题的弱监督深度学习框架.此外,还介绍了评论主题提取相关的经典工作.最后,总结了情感分类问题的难点和挑战,并对未来的研究工作进行了展望. 展开更多
关键词 情感分析 情感分类 深度学习 监督 主题提取
在线阅读 下载PDF
基于弱监督预训练深度模型的微博情感分析 预览 被引量:3
16
作者 万圣贤 兰艳艳 +1 位作者 郭嘉丰 程学旗 《中文信息学报》 CSCD 北大核心 2017年第3期191-197,共7页
微博情感分析对于商业事务和政治选举等应用非常重要。传统的做法主要基于浅层机器学习模型,对人工提取的特征有较大的依赖,而微博情感特征往往难以提取。深度学习可以自动学习层次化的特征,并被用于解决情感分析问题。随着新的深度学... 微博情感分析对于商业事务和政治选举等应用非常重要。传统的做法主要基于浅层机器学习模型,对人工提取的特征有较大的依赖,而微博情感特征往往难以提取。深度学习可以自动学习层次化的特征,并被用于解决情感分析问题。随着新的深度学习技术的提出,人们发现只要提供足够多的监督数据,就能训练出好的深度模型。然而,在微博情感分析中,通常监督数据都非常少。微博中广泛存在着弱监督数据。该文提出基于弱监督数据的“预训练—微调整”训练框架(distant pretrain-finetune),使用弱监督数据对深度模型进行预训练,然后使用监督数据进行微调整。这种做法的好处是可以利用弱监督数据学习到一个初始的模型,然后利用监督数据来进一步改善模型并克服弱监督数据存在的一些问题。我们在新浪微博数据上进行的实验表明,这种做法可以在监督数据较少的情况下使用深度学习,并取得比浅层模型更好的效果。 展开更多
关键词 情感分析 深度学习 监督 预训练-微调整
在线阅读 下载PDF
基于图排序的社会媒体用户的消费意图检测 被引量:1
17
作者 刘挺 付博 陈毅恒 《中国科学:信息科学》 CSCD 北大核心 2015年第12期1523-1535,共13页
消费意图是指用户为满足某种需要,在一定购买动机的支配下,通过文本内容表达出对产品或服务的购买意愿.消费意图检测旨在推断用户在文本中是否表达出消费意图的含义.我们定义微博中的消费意图必须包含两个重要元素,分别是消费意图触发... 消费意图是指用户为满足某种需要,在一定购买动机的支配下,通过文本内容表达出对产品或服务的购买意愿.消费意图检测旨在推断用户在文本中是否表达出消费意图的含义.我们定义微博中的消费意图必须包含两个重要元素,分别是消费意图触发词和消费意图对象(即需要购买的产品),这两种元素直接引发用户的购买意愿,是决定用户消费意图的重要特征.本文提出了基于弱监督的图排序算法,该方法适用于数据总量较大、已标注数据量相对较小的情形中,并且可以使未标注数据和标注数据同时参与到图排序算法的学习过程中.实验结果表明,所采用的图排序方法对于消费意图检测是行之有效的. 展开更多
关键词 消费意图 消费意图检测 社会媒体 图排序 监督
基于弱监督ECOC算法的肺结节辅助检测 预览 被引量:2
18
作者 苏志远 刘慧 尹义龙 《数据采集与处理》 CSCD 北大核心 2015年第5期1003-1010,共8页
肺结节的准确分类与识别是计算机辅助诊断系统在肺癌诊断领域应用的关键,同时也面临巨大的挑战。该技术不仅在特征表示、样本标记等方面存在发展的瓶颈,而且目前缺少准确、有效的分类识别算法。本文提出了一种结合弱监督纠错输出编码(E... 肺结节的准确分类与识别是计算机辅助诊断系统在肺癌诊断领域应用的关键,同时也面临巨大的挑战。该技术不仅在特征表示、样本标记等方面存在发展的瓶颈,而且目前缺少准确、有效的分类识别算法。本文提出了一种结合弱监督纠错输出编码(Error-correcting output codes,ECOC)算法和肺结节形状特征表达的肺结节多分类算法。为了提高分类识别的准确率,本文对肺结节的形状特征进行了详细的分析,并提出了一系列准确的形状特征描述向量。在分类识别阶段,算法训练学习了利用专家对肺结节标记信息标记的少量样本,并生成二类分类器,获得编码矩阵。最后,通过计算测试样本编码和编码矩阵每一行的汉明距离,确定样本所属类别。实验结果表明,本文方法能够获得更加准确的分类结果。 展开更多
关键词 肺结节 分类识别 监督 纠错输出编码 肺部图像数据库联盟
在线阅读 下载PDF
基于弱监督的属性关系抽取方法 预览 被引量:5
19
作者 杨宇飞 戴齐 +1 位作者 贾真 尹红风 《计算机应用》 CSCD 北大核心 2014年第1期64-68,共5页
针对从中文百科中抽取属性关系时所面临的训练语料匮乏问题,提出一种利用极少人工参与的弱监督自动抽取方法。首先,利用中文百科务目信息模板中的半结构化属性关系回标条目文本自动获取训练语料;然后,根据朴素贝叶斯分类原理优化训... 针对从中文百科中抽取属性关系时所面临的训练语料匮乏问题,提出一种利用极少人工参与的弱监督自动抽取方法。首先,利用中文百科务目信息模板中的半结构化属性关系回标条目文本自动获取训练语料;然后,根据朴素贝叶斯分类原理优化训练语料;最后,基于条件随机场(CRF)建立属性关系抽取模型。在互动百科中采集的数据集上进行实验,综合评价F值达到了80.9%。结果表明该方法能够获得质量较高的训练语料,并取得良好的抽取性能。 展开更多
关键词 关系抽取 监督 中文百科 朴素贝叶斯分类 条件随机场
在线阅读 下载PDF
基于机器学习的实体关系抽取方法 预览 被引量:3
20
作者 刘方驰 钟志农 +1 位作者 雷霖 吴烨 《兵工自动化》 2013年第9期57-62,共6页
实体关系抽取是信息抽取的一项重要内容,总结现有的方法对于该领域的发展具有指导和借鉴意义。结合当前的研究进展,分析和比较了有监督、无监督和弱监督3类关系抽取方法的原理和代表性算法,总结了各类方法的特性并对关系抽取的发展... 实体关系抽取是信息抽取的一项重要内容,总结现有的方法对于该领域的发展具有指导和借鉴意义。结合当前的研究进展,分析和比较了有监督、无监督和弱监督3类关系抽取方法的原理和代表性算法,总结了各类方法的特性并对关系抽取的发展趋势进行了展望。 展开更多
关键词 实体关系抽取 机器学习 监督 监督 监督
在线阅读 下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部 意见反馈