期刊文献+
共找到18篇文章
< 1 >
每页显示 20 50 100
基于神经网络的汽车说明书问答系统
1
作者 齐乐 张宇 +3 位作者 马文涛 崔一鸣 王士进 刘挺 《山西大学学报:自然科学版》 CAS 北大核心 2019年第1期69-77,共9页
为了简化用户查阅汽车说明书的流程,设计了针对中文汽车说明书的问答系统(CM-QA),包括以下3个问题:1)如何充分利用文档信息表示文档;2)领域词汇的分词和复述问题;3)正负样本不均衡。为了解决上述问题,结合卷积神经网络和双向长短时记忆... 为了简化用户查阅汽车说明书的流程,设计了针对中文汽车说明书的问答系统(CM-QA),包括以下3个问题:1)如何充分利用文档信息表示文档;2)领域词汇的分词和复述问题;3)正负样本不均衡。为了解决上述问题,结合卷积神经网络和双向长短时记忆网络对文本建模,手工构建领域词的复述词典,并使用字向量替代词向量。最后,尝试将模型转换为基于Pairwise思想的排序模型和扩展正例两种训练策略来解决正负样本不均衡的问题。在800条人工标注的问题上对系统进行了测试,其准确率达到了93.07%。 展开更多
关键词 问答系统 神经网络 汽车说明书 自然语言处理
基于主题增强卷积神经网络的用户兴趣识别 预览 被引量:2
2
作者 杜雨萌 张伟男 刘挺 《计算机研究与发展》 CSCD 北大核心 2018年第1期188-197,共10页
提出了一种基于主题增强卷积神经网络的用户兴趣识别的方法,通过构造一个双通道CNN 模 型,融合连续语义信息和离散主题信息,获取用户微博类别分布,在此基础上,通过极大似然估计识别用 户的兴趣. 实验结果表明,相较于基于 Labeled LDA ... 提出了一种基于主题增强卷积神经网络的用户兴趣识别的方法,通过构造一个双通道CNN 模 型,融合连续语义信息和离散主题信息,获取用户微博类别分布,在此基础上,通过极大似然估计识别用 户的兴趣. 实验结果表明,相较于基于 Labeled LDA 主题模型的方法和传统卷积神经网络的方法,提出 的主题增强卷积神经网络缓解了噪声词对用户兴趣词的影响,并且通过融入主题信息提高了对于包含 噪声词较多的微博的分类效果,在微博分类及用户兴趣识别上的效果获得了显著的提升. 展开更多
关键词 主题模型 卷积神经网络 微博分类 用户兴趣识别 微博
在线阅读 下载PDF
基于DQN的开放域多轮对话策略学习 预览
3
作者 宋皓宇 张伟男 刘挺 《中文信息学报》 CSCD 北大核心 2018年第7期99-108,136共11页
有效地进行多轮对话是开放域人机对话系统的主要目标之一。目前的神经网络对话生成模型在开放域多轮对话过程中存在着容易产生万能回复、很快陷入死循环的问题;而已有的多轮对话研究工作存在着没有考虑未来对话走向的问题。借鉴强化学... 有效地进行多轮对话是开放域人机对话系统的主要目标之一。目前的神经网络对话生成模型在开放域多轮对话过程中存在着容易产生万能回复、很快陷入死循环的问题;而已有的多轮对话研究工作存在着没有考虑未来对话走向的问题。借鉴强化学习方法考虑全局的视角,该文利用深度强化学习算法DQN(deep Q-network),提出了使用深度价值网络对每一轮的候选句子进行评估,并选择未来收益最大的而非生成概率最大的句子作为回复的多轮对话策略学习方法。实验结果表明,该文提出的方法将多轮对话的平均对话轮数提高了两轮,同时在主观对比评价指标上获胜比例高出了45%。 展开更多
关键词 多轮对话 对话策略 强化学习
在线阅读 下载PDF
基于关键信息的问题相似度计算 预览
4
作者 齐乐 张宇 刘挺 《计算机研究与发展》 CSCD 北大核心 2018年第7期1539-1547,共9页
判断问题相似是社区问答(community question answer,CQA)中很重要的一个研究方向.社区问答中的问题通常由主题和描述构成.由于社区问答的开放性,用户的提问长短不一,而问题中会包含大量干扰模型判断问题是否相似的背景信息.为了减少... 判断问题相似是社区问答(community question answer,CQA)中很重要的一个研究方向.社区问答中的问题通常由主题和描述构成.由于社区问答的开放性,用户的提问长短不一,而问题中会包含大量干扰模型判断问题是否相似的背景信息.为了减少上述问题对计算问题相似度的影响,模型将关键词及问题主题视为问题的关键信息,并使用这些信息计算问题相似度.首先,在基于文本间相似及相异信息的CNN模型的基础上引入了关键词抽取技术.同时,为了更好地利用问题主题的信息,模型融合了问题主题相似度的特征.模型在SemEval2017评测的问题相似任务中进行了实验,其平均精度均值(mean average precision,MAP)达到了49.65%,超过了评测中的最佳结果. 展开更多
关键词 问题相似 社区问答 关键词 问题主题 卷积神经网络
在线阅读 下载PDF
基于依存句法分析的复合事实型问句分解方法 预览 被引量:1
5
作者 刘雄 张宇 +1 位作者 张伟男 刘挺 《中文信息学报》 CSCD 北大核心 2017年第3期140-146,共7页
问答系统一直以来都是自然语言处理领域的研究热点之一,然而现有问答系统技术对复合事实型问句的处理效果并不完美。为了增强问答系统理解复合事实型问句的能力,该文提出了一种针对复合事实型问句的分解方法:使用基于树核的支持向量机... 问答系统一直以来都是自然语言处理领域的研究热点之一,然而现有问答系统技术对复合事实型问句的处理效果并不完美。为了增强问答系统理解复合事实型问句的能力,该文提出了一种针对复合事实型问句的分解方法:使用基于树核的支持向量机对问句的分解类别进行识别,进而使用基于依存句法分析的方法生成分解结果。实验结果显示,在我们所构建的高质量问句分解语料库中,我们的方法对问句分解类别进行了准确的识别,同时也可以较好地生成嵌套型问句的子问句。 展开更多
关键词 问句分解 复合事实型问句 问句理解 问答系统 自然语言处理
在线阅读 下载PDF
对话系统评价方法综述 被引量:6
6
作者 张伟男 张杨子 刘挺 《中国科学:信息科学》 CSCD 北大核心 2017年第8期953-966,共14页
本文介绍了对话系统的发展历史以及随着对话系统发展而衍生出的多种对话系统评价方法,从任务型对话系统与开放域对话系统两个方向进行了调研和总结,分析了不同评价方法的利弊,每种评价方法的侧重点和不同方向上最新的研究进展.在任务型... 本文介绍了对话系统的发展历史以及随着对话系统发展而衍生出的多种对话系统评价方法,从任务型对话系统与开放域对话系统两个方向进行了调研和总结,分析了不同评价方法的利弊,每种评价方法的侧重点和不同方向上最新的研究进展.在任务型对话系统方面,介绍了Steve Young等人的近期研究成果,总结了几种被广泛使用的评价思路.在开放域对话系统方面,从客观指标评价和模拟人工评分两个角度探索了开放域聊天系统的评价方法,对于不同的指标和不同的研究思路做了分析及介绍.最后,本文通过总结及分析对话系统的经典评价方法和当前最新的基于神经网络模型的对话评价方法,对对话系统评价方法的发展趋势进行了展望. 展开更多
关键词 对话系统评价方法 开放域对话系统 任务型对话系统 自然语言处理 人工智能
机器人来了,记者去哪儿 被引量:8
7
作者 刘挺 《中国传媒科技》 2015年第9期20-22,共3页
注:在新闻领域谈机器人,并非特指有胳膊有腿儿的人形实体机器人,而是泛指能够模拟人的某种能力的智能信息处理系统,可能有硬件载体,更可能是纯软件。美联社、纽约时报用机器人写新闻的消息一度充斥媒体,最近腾讯财经也用机器人写新闻了... 注:在新闻领域谈机器人,并非特指有胳膊有腿儿的人形实体机器人,而是泛指能够模拟人的某种能力的智能信息处理系统,可能有硬件载体,更可能是纯软件。美联社、纽约时报用机器人写新闻的消息一度充斥媒体,最近腾讯财经也用机器人写新闻了,"狼"不但来了,而且在中国登陆了。古往今来,写作是人类的专利,关乎人类的尊严,无生命的机器真的能够替代人吗?本文是一个工科背景的人对这位"狼先生"的看法,尝试探讨机器人技术将对新闻领域产生的变革。机器人将给新闻领域带来的冲击包括四个方面:编辑、写作、传播、辅助设备。 展开更多
关键词 机器人技术 记者 信息处理系统 纽约时报 辅助设备 新闻 模拟人 美联社
基于跨社交媒体检索的微博消费对象识别 预览 被引量:1
8
作者 付博 刘挺 《计算机科学与探索》 CSCD 北大核心 2015年第10期1247-1255,共9页
目前,微博消费意图识别问题成为新的研究热点。然而,已有工作主要判断微博是否具有商业意图,很少研究消费意图内容中消费对象的识别问题,而消费对象的识别是精确地进行商业推荐的关键,因此对其进行研究具有重要意义。微博内容较短且用... 目前,微博消费意图识别问题成为新的研究热点。然而,已有工作主要判断微博是否具有商业意图,很少研究消费意图内容中消费对象的识别问题,而消费对象的识别是精确地进行商业推荐的关键,因此对其进行研究具有重要意义。微博内容较短且用户用语不规范,基于词典匹配与依存关系分析的方法,在识别召回率上难以得到满意的效果。提出了一种基于跨媒体伪相关反馈的方法。首先分析具有消费意图微博中的关键词,而后将其视为查询提交给搜索引擎进行搜索,最后从搜索结果中提取消费意图对象。实验结果表明,提出的方法显著地优于基准方法。 展开更多
关键词 消费意图 消费对象 跨社交媒体检索 信息抽取 单语词对齐模型 社交媒体
在线阅读 下载PDF
面向社会媒体的消费意图识别:任务、挑战与机遇 预览 被引量:1
9
作者 付博 刘挺 《智能计算机与应用》 2015年第4期1-4,8共5页
社会媒体是一个基于用户关系的信息分享、传播以及获取平台,并实现即时分享。在社会媒体上产生了大量的用户发布的,对于诸如产品购买、喜好等有价值的消费需求信息。这些关于产品需求的信息表达了人们的各种消费意愿和消费需求。例如,... 社会媒体是一个基于用户关系的信息分享、传播以及获取平台,并实现即时分享。在社会媒体上产生了大量的用户发布的,对于诸如产品购买、喜好等有价值的消费需求信息。这些关于产品需求的信息表达了人们的各种消费意愿和消费需求。例如,"请推荐一款2 000块钱左右的诺基亚手机"即为用户的一种消费需求。类似这样的信息为公司或企业提供了有价值的信息。本文以此介绍了面向社会媒体的消费意图识别这一任务的诞生背景、要解决的主要问题、面临的主要挑战、相关工作以及未来的研究方向。 展开更多
关键词 消费意图识别 查询商业意图识别 消费意图模板 社会媒体
在线阅读 免费下载
省略识别及恢复联合模型研究 预览 被引量:1
10
作者 尹庆宇 张伟男 +1 位作者 张宇 刘挺 《计算机研究与发展》 EI CSCD 北大核心 2015年第11期2460-2467,共8页
省略现象在对话中十分普遍,它的存在导致了语句成分的缺失.问答系统往往不能正确理解这些缺省的表述,这样就会产生错误的问答结果,所以,省略恢复在问答系统中是十分必要的.省略恢复通常分为零代词类别恢复、零代词指代消解2个步骤,已有... 省略现象在对话中十分普遍,它的存在导致了语句成分的缺失.问答系统往往不能正确理解这些缺省的表述,这样就会产生错误的问答结果,所以,省略恢复在问答系统中是十分必要的.省略恢复通常分为零代词类别恢复、零代词指代消解2个步骤,已有工作主要是将二者顺序执行,因此会造成错误的累加.为了克服上述问题,提出了1种零代词类别恢复和零代词指代消解联合模型(joint model)的方法,旨在通过联合模型融合省略恢复的2个步骤,进而提高恢复效果.实验结果表明,相比较已有的方法,引入联合模型后,省略恢复的性能得到了显著的提升. 展开更多
关键词 联合模型 省略恢复 零代词 指代消解 对话
在线阅读 下载PDF
基于依存句法分析的社会媒体文本挖掘方法——以饮食习惯特色分析为例 预览 被引量:8
11
作者 任彬 车万翔 刘挺 《中文信息学报》 CSCD 北大核心 2014年第6期208-215,共8页
在进行社会媒体文本挖掘时,传统的基于词表的方法,存在准确率较低、词表难获得等问题.该文提出一种基于依存句法分析的文本挖掘方法,通过规则匹配的方式从社会媒体文本中提取信息.该方法不依赖词表,且实验证明了相比基于词表的方法在准... 在进行社会媒体文本挖掘时,传统的基于词表的方法,存在准确率较低、词表难获得等问题.该文提出一种基于依存句法分析的文本挖掘方法,通过规则匹配的方式从社会媒体文本中提取信息.该方法不依赖词表,且实验证明了相比基于词表的方法在准确率上有大幅提高.应用基于依存句法分析的文本挖掘方法,我们在微博文本上进行了饮食习惯特色分析,实现了性别、地区、时间等维度的饮食习惯特色分析并可进行交叉分析,最终用词云的方式展示了结果. 展开更多
关键词 依存句法分析 文本挖掘 社会媒体 饮食习惯特色分析
在线阅读 下载PDF
面向网络文本的信息可信度评估方法研究 预览 被引量:1
12
作者 李璐旸 李渝勤 +2 位作者 刘挺 秦兵 王轩 《智能计算机与应用》 2013年第5期31-34,38共5页
随着网络信息的膨胀性增长,不可信的信息在网络中日益增多,阻碍误导用户对可信信息的获取。研究网络文本的可信度评估方法,对句子级命题提取多维网络分布特征,通过线性组合计算可信度值,从而判断命题的可信度。在可信度评估过程中... 随着网络信息的膨胀性增长,不可信的信息在网络中日益增多,阻碍误导用户对可信信息的获取。研究网络文本的可信度评估方法,对句子级命题提取多维网络分布特征,通过线性组合计算可信度值,从而判断命题的可信度。在可信度评估过程中,文中方法通过词语结构特征提取可信信息的候选信息,并在候选信息的可信度计算中加入对信息源的可信度分析判断,提高了信息可信度的评估准确度。 展开更多
关键词 信息可信度 替换项 候选答案 可信度计算
在线阅读 免费下载
数据驱动的依存句法分析方法研究 预览 被引量:1
13
作者 李正华 李渝勤 +1 位作者 刘挺 车万翔 《智能计算机与应用》 2013年第5期1-4,共4页
依存句法分析是自然语言处理领域的核心研究课题。依存句法分析的目标是将输入的自然语言文本从序列形式转化为树状结构,从而刻画句子内部词语之间的句法关系。近年来,依存句法分析作为一个研究热点,取得了长足的发展,并且逐渐广泛... 依存句法分析是自然语言处理领域的核心研究课题。依存句法分析的目标是将输入的自然语言文本从序列形式转化为树状结构,从而刻画句子内部词语之间的句法关系。近年来,依存句法分析作为一个研究热点,取得了长足的发展,并且逐渐广泛应用于其他自然语言处理任务中。对前人提出的数据驱动的依存句法分析方法进行总结和比较,进而提出了依存句法分析未来的挑战。 展开更多
关键词 自然语言处理 依存句法分析 数据驱动
在线阅读 免费下载
面向问句检索的词项赋权研究 预览
14
作者 张伟男 都云程 +1 位作者 张宇 刘挺 《智能计算机与应用》 2013年第5期54-57,共4页
在社区型问答服务中,存在大量的由用户生成的问题及答案,一方面用户可以通过发布新问题,等待其他用户的回答;另一方面用户可以通过搜索与当前问题相关或者相似的问题,从而得到相应的答案。随着社区型问答服务的发展,用户更加关注... 在社区型问答服务中,存在大量的由用户生成的问题及答案,一方面用户可以通过发布新问题,等待其他用户的回答;另一方面用户可以通过搜索与当前问题相关或者相似的问题,从而得到相应的答案。随着社区型问答服务的发展,用户更加关注问题检索服务的质量,因此如何合理并有效地检索出与用户当前问题相关或相似的问题,成为社区型问答服务的核心任务。对社区型问答服务中用户问题的特点进行了分析,提出一种确定问题中词项重要性的方法,从而改进传统问题检索模型中计算当前问题和候选问题集之间相关度的方法,提高问题检索质量。实验证明文中的方法在MAP、MRR及R—precision三项指标中均有提高。同时,分析了影响词项重要度的实验特征,得出最优的特征集合。 展开更多
关键词 社区型问答 问题检索 词项赋权
在线阅读 免费下载
基于微博分类的用户兴趣识别 预览 被引量:11
15
作者 宋巍 张宇 +3 位作者 谢毓彬 刘挺 李生 都云程 《智能计算机与应用》 2013年第4期80-83,共4页
社会媒体成为用户分享与获取信息的重要平台。发现感兴趣的微博账户与信息是社交媒体平台最重要的活动,其关键问题在于用户兴趣模型的构建。提出基于微博分类的用户兴趣识别方法。首先人工构建目标分类体系,基于典型微博账户采集微博训... 社会媒体成为用户分享与获取信息的重要平台。发现感兴趣的微博账户与信息是社交媒体平台最重要的活动,其关键问题在于用户兴趣模型的构建。提出基于微博分类的用户兴趣识别方法。首先人工构建目标分类体系,基于典型微博账户采集微博训练语料训练微博分类器,而后通过对用户微博进行分类识别出用户感兴趣的类别。实验表明基于典型主题类别微博,结合词语与主题的特征可有效进行微博分类达到86%的F值,输出的类别可准确表示用户兴趣。 展开更多
关键词 社会媒体 微博分类 主题模型 用户建模 个性化
在线阅读 免费下载
语言技术平台 预览 被引量:25
16
作者 刘挺 车万翔 李正华 《中文信息学报》 CSCD 北大核心 2011年第6期 53-62,共10页
中文信息处理不仅需要基础数据平台的支撑,而且需要基础技术平台的支撑。该文介绍了我们历经八年研制并不断改进的语言技术平台LTP(Language Technology Platform)。该平台包括中文词法分析、句法分析以及语义分析等多项中文处理技术... 中文信息处理不仅需要基础数据平台的支撑,而且需要基础技术平台的支撑。该文介绍了我们历经八年研制并不断改进的语言技术平台LTP(Language Technology Platform)。该平台包括中文词法分析、句法分析以及语义分析等多项中文处理技术,其中的句法语义分析技术在CoNLL 2009国际评测中获得第一名的成绩。该平台自2006年起对学术界免费共享,2010年获得中国中文信息学会"钱伟长中文信息处理科学技术奖一等奖",目前已有400多家国内外研究机构签约共享该平台。2011年6月,该平台开放源代码,同行们不仅可以利用该平台的结果进行上层技术研究,而且可以和我们一起改进该平台本身。 展开更多
关键词 中文信息处理 语言技术平台
在线阅读 下载PDF
走向智能时代的语言信息化产业 预览 被引量:1
17
作者 郭玉箐 徐俊 王海峰 《语言战略研究》 2016年第6期27-35,共9页
语言文字是信息最主要的载体,语言文字的信息化是实现国家信息化战略目标的基础。在语言信息化产业中,搜索引擎和机器翻译是最具代表性且已经实现大规模产业化的两大领域。本文以这两个领域为例,详细解读语言信息化技术和产业如何应对... 语言文字是信息最主要的载体,语言文字的信息化是实现国家信息化战略目标的基础。在语言信息化产业中,搜索引擎和机器翻译是最具代表性且已经实现大规模产业化的两大领域。本文以这两个领域为例,详细解读语言信息化技术和产业如何应对互联网时代的新机遇和新挑战,并展望语言信息化产业的智能化趋势。 展开更多
关键词 搜索引擎 机器翻译 深度神经网络
在线阅读 下载PDF
融合多类特征的Web查询意图识别 被引量:9
18
作者 伍大勇 赵世奇 +1 位作者 刘挺 张宇 《模式识别与人工智能》 EI CSCD 北大核心 2012年第3期 500-505,共6页
识别搜索引擎用户的查询意图在信息检索领域是备受关注的研究内容.文中提出一种融合多类特征识别Web查询意图的方法.将Web查询意图识别作为一个分类问题,并从不同类型的资源包括查询文本、搜索引擎返回内容及Web查询日志中抽取出有... 识别搜索引擎用户的查询意图在信息检索领域是备受关注的研究内容.文中提出一种融合多类特征识别Web查询意图的方法.将Web查询意图识别作为一个分类问题,并从不同类型的资源包括查询文本、搜索引擎返回内容及Web查询日志中抽取出有效的分类特征.在人工标注的真实Web查询语料上采用文中方法进行查询意图识别实验,实验结果显示文中采用的各类特征对于提高查询意图识别的效果皆有一定帮助,综合使用这些特征进行查询意图识别,88.5%的测试查询获得准确的意图识别结果. 展开更多
关键词 搜索引擎 查询意图 特征融合
上一页 1 下一页 到第
使用帮助 返回顶部 意见反馈