期刊文献+
共找到321篇文章
< 1 2 17 >
每页显示 20 50 100
基于深度示例差异化的零样本多标签图像分类 预览
1
作者 冀中 李慧慧 何宇清 《计算机科学与探索》 CSCD 北大核心 2019年第1期97-105,共9页
零样本多标签图像分类是对含多个标签且测试类别标签在训练过程中没有相应训练样本的图像进行分类标注。已有的研究表明,多标签图像类别间存在相互关联,合理利用标签间相互关系是多标签图像分类技术的关键,如何实现已见类到未见类的模... 零样本多标签图像分类是对含多个标签且测试类别标签在训练过程中没有相应训练样本的图像进行分类标注。已有的研究表明,多标签图像类别间存在相互关联,合理利用标签间相互关系是多标签图像分类技术的关键,如何实现已见类到未见类的模型迁移,并利用标签间相关性实现未见类的分类是零样本多标签分类需要解决的关键问题。针对这一挑战性的学习任务,提出一种深度示例差异化分类算法。首先利用深度嵌入网络实现图像视觉特征空间至标签语义特征空间的跨模态映射,然后在语义空间利用示例差异化算法实现多标签分类。通过在主流数据集Natural Scene 和IAPRTC-12 上与已有算法进行对比实验,验证了所提方法的先进性和有效性,同时验证了嵌入网络的先进性。 展开更多
关键词 零样本学习 多标签分类 跨模态映射 多示例学习
在线阅读 下载PDF
基于空间变换双线性网络的细粒度鱼类图像分类 预览
2
作者 冀中 赵可心 +1 位作者 张锁平 李明兵 《天津大学学报:自然科学与工程技术版》 CSCD 北大核心 2019年第5期475-482,共8页
有效地识别水下各种鱼类目标具有重要的实际意义和理论价值.鱼类生存环境复杂,由于海洋的极端条件,水下鱼类图像的分辨率低,且图像类间相似度高、类内差异性大,并受光照、角度、姿态等的影响较大,这些因素使得鱼类识别成为一项具有挑战... 有效地识别水下各种鱼类目标具有重要的实际意义和理论价值.鱼类生存环境复杂,由于海洋的极端条件,水下鱼类图像的分辨率低,且图像类间相似度高、类内差异性大,并受光照、角度、姿态等的影响较大,这些因素使得鱼类识别成为一项具有挑战的任务.针对这些难点,提出了一个能够有效进行细粒度鱼类图像分类的深度学习模型.该模型包含空间变换网络和双线性网络两部分,首先利用空间变换网络作为注意力机制,去除图像背景中复杂的干扰信息,选择图像中感兴趣的目标区域,简化后续分类;双线性网络通过融合两个深度网络的特征图提取图像的双线性特征,使得对目标中具有判别性的特定位置有较强的响应,从而识别种类,该模型可以进行端到端的训练.在公开的F4K数据集上,该模型取得了最好的性能,识别正确率为99.36%,较现有最好算法DeepFish提高0.56%,此外,发布了一个包含100类共6358张图片的新的鱼类图像数据集Fish100,该模型在Fish100数据集上的识别正确率高出BCNN算法0.98%.多个数据集上的实验验证了模型的有效性与先进性. 展开更多
关键词 鱼类分类 细粒度分类 空间变换 双线性网络
在线阅读 下载PDF
基于重要性感知稀疏自编码器的多视频摘要 预览
3
作者 冀中 熊凯琳 +1 位作者 马亚茹 何宇清 《天津大学学报:自然科学与工程技术版》 CSCD 北大核心 2018年第11期1147-1153,共7页
如何有效地管理和查询海量视频数据是大数据时代亟待解决的问题.基于查询的多视频摘要技术可提供全面且简洁的查询内容的相关信息,是解决此问题的重要途径之一.然而,多视频内容具有多样性,且包含较多的噪音和冗余,从这些复杂信息中找出... 如何有效地管理和查询海量视频数据是大数据时代亟待解决的问题.基于查询的多视频摘要技术可提供全面且简洁的查询内容的相关信息,是解决此问题的重要途径之一.然而,多视频内容具有多样性,且包含较多的噪音和冗余,从这些复杂信息中找出最具代表性的信息极具挑战性.针对这一挑战,提出一种基于稀疏自编码器,并将网络查询图像内容作为正则项的多视频摘要模型.该模型不仅满足代表性和简洁性的要求,还具有依赖查询进行重要性感知的能力.大量的实验验证了本文模型的有效性与先进性. 展开更多
关键词 多视频摘要 稀疏自编码器 重要性感知 视频管理
在线阅读 下载PDF
基于解码器注意力机制的视频摘要 预览
4
作者 冀中 江俊杰 《天津大学学报:自然科学与工程技术版》 CSCD 北大核心 2018年第10期1023-1030,共8页
作为一种快速浏览和理解视频内容的方式,视频摘要技术引起了广泛的关注.本文将视频摘要任务看作是序列到序列的预测问题,设计了一种新颖的基于解码器的视觉注意力机制,并基于此提出一种有监督视频摘要算法.所提方法考虑到视频帧之... 作为一种快速浏览和理解视频内容的方式,视频摘要技术引起了广泛的关注.本文将视频摘要任务看作是序列到序列的预测问题,设计了一种新颖的基于解码器的视觉注意力机制,并基于此提出一种有监督视频摘要算法.所提方法考虑到视频帧之间的内在关联性,利用长短时记忆网络将注意力集中在历史的解码序列,融合历史的解码信息有效地指导解码,提升模型预测的准确性.所提算法主要在TVSum和SumMe数据集上进行了大量实验,验证了其有效性及先进性. 展开更多
关键词 视频摘要 视觉注意力模型 编解码模型 长短时记忆网络
在线阅读 下载PDF
最大边界重要和覆盖的视频摘要方法 预览 被引量:1
5
作者 冀中 马亚茹 何宇清 《计算机科学与探索》 CSCD 北大核心 2018年第8期1286-1294,共9页
视频信息的剧增使得人们迫切需要一种能够高效浏览和理解视频内容的技术。视频摘要是其中一种有效的技术,它将重要的且具有代表性的视频内容以一种简洁的形式呈现出来,方便用户对视频的浏览和管理。理想的视频摘要需满足最大覆盖率、... 视频信息的剧增使得人们迫切需要一种能够高效浏览和理解视频内容的技术。视频摘要是其中一种有效的技术,它将重要的且具有代表性的视频内容以一种简洁的形式呈现出来,方便用户对视频的浏览和管理。理想的视频摘要需满足最大覆盖率、重要优先和最小冗余标准,而目前相关视频摘要的主要技术挑战是如何同时将这3个标准融入到一个框架中获取理想的视频摘要。针对这一问题提出了一种优化冗余性、重要性和覆盖率的最大边界重要和覆盖框架(maximal marginal importance and coverage,MMIC)。在MMIC中,利用基于K-RNN(K-regular nearest neighbor)图的流形排序算法计算视频帧的重要性,并且提出摘要覆盖率标准(summarization coverage criterion,SCC)用以直观指导用户获取合适的摘要长度。通过在Open Video Project和YouTube两个数据集上进行大量实验,验证了所提方法的有效性和先进性。 展开更多
关键词 视频摘要 视频浏览 最大边界相关 流形排序
在线阅读 下载PDF
基于噪声检测的总变分去噪算法 预览
6
作者 冀中 赵硕 +1 位作者 王建 刘立 《计算机工程与科学》 CSCD 北大核心 2018年第3期507-514,共8页
对受高斯和脉冲混合噪声污染的数字图像去噪方法进行了研究,提出了一种基于噪声检测的自适应总变分(T V)去噪算法。提出的改进算法采用两步迭代框架实现:脉冲噪点检测和全变分图像恢复。第一步中,考虑到脉冲噪声污染的像素点不包含原图... 对受高斯和脉冲混合噪声污染的数字图像去噪方法进行了研究,提出了一种基于噪声检测的自适应总变分(T V)去噪算法。提出的改进算法采用两步迭代框架实现:脉冲噪点检测和全变分图像恢复。第一步中,考虑到脉冲噪声污染的像素点不包含原图像有效信息,采用一种局部统计值,即邻域像素间的随机绝对差排序值(ROAD)估计出噪点的位置;第二步中,采用L2-TV方法进行去噪处理,并对上述过程进行迭代处理,得到去噪图像。在噪点估计过程中引入脉冲噪点水平参数,这样处理的优势在于可更准确地检测出脉冲噪点;而L2-TV去噪方法可很好地去除高斯噪声,两者结合有效地解决了TV算法存在误判图像脉冲噪声为边缘而产生假边缘的问题。与现有典型去噪方法的比较实验表明,该迭代去噪算法,即TV-ROAD算法,既能够去除混合噪声,又可以保留图像细节特征。 展开更多
关键词 高斯脉冲混合噪声 全变分修复 随机绝对差排序值 图像去噪
在线阅读 下载PDF
基于典型相关分析和距离度量学习的零样本学习 预览 被引量:1
7
作者 冀中 谢于中 庞彦伟 《天津大学学报:自然科学与工程技术版》 CSCD 北大核心 2017年第8期813-820,共8页
零样本学习是一类特殊的图像分类问题,是指测试数据的类别在训练数据中没有出现的情况.为了更好地描述语义特征空间中图像特征和语义特征的距离关系,本文将距离度量学习引入零样本学习任务.具体而言,首先利用典型相关分析将样本的图像... 零样本学习是一类特殊的图像分类问题,是指测试数据的类别在训练数据中没有出现的情况.为了更好地描述语义特征空间中图像特征和语义特征的距离关系,本文将距离度量学习引入零样本学习任务.具体而言,首先利用典型相关分析将样本的图像特征和相应类别的语义特征映射至公共特征空间;然后,利用距离度量学习衡量图像特征和语义特征之间的距离;最后,使用最近邻分类器进行分类.通过在流行的Aw A和CUB数据集中的实验,证明了所提方法的有效性和鲁棒性. 展开更多
关键词 零样本学习 典型相关分析 距离度量学习 图像分类
在线阅读 下载PDF
基于局部保持典型相关分析的零样本动作识别 预览 被引量:1
8
作者 冀中 郭威辰 《天津大学学报:自然科学与工程技术版》 CSCD 北大核心 2017年第9期975-983,共9页
动作识别领域需要识别的类别越来越多,这使得标注足够多的训练数据越来越难.零样本学习是针对传统机器学习收集和标注数据日益困难而提出的一种新思路.针对基于零样本学习的动作识别问题,提出了一种基于局部保持典型相关分析映射的... 动作识别领域需要识别的类别越来越多,这使得标注足够多的训练数据越来越难.零样本学习是针对传统机器学习收集和标注数据日益困难而提出的一种新思路.针对基于零样本学习的动作识别问题,提出了一种基于局部保持典型相关分析映射的方法.该方法使用流形约束的典型相关分析将视觉特征和辅助特征映射到一个公共特征空间,并且在映射过程中保留视觉特征和辅助特征的局部信息,还考虑了域转换所带来的不利影响,同时采用自训练和hubness修正等方法增强所提方法的鲁棒性.通过在主流数据集HMDB51和UCF101上的大量实验,表明所提方法具有较好的零样本学习性能. 展开更多
关键词 零样本学习 动作识别 典型相关分析 局部保持
在线阅读 下载PDF
基于超图排序算法的视频摘要 预览 被引量:3
9
作者 冀中 樊帅飞 《电子学报》 CSCD 北大核心 2017年第5期1035-1043,共9页
技术作为一种快速感知视频内容的方式得到了广泛的关注.现有基于图模型的视频摘要方法将视频帧作为顶点,通过边表示两个顶点之间的关系,但并不能很好地捕获视频帧之间的复杂关系.为了克服该缺点,本文提出了一种基于超图排序算法的静态... 技术作为一种快速感知视频内容的方式得到了广泛的关注.现有基于图模型的视频摘要方法将视频帧作为顶点,通过边表示两个顶点之间的关系,但并不能很好地捕获视频帧之间的复杂关系.为了克服该缺点,本文提出了一种基于超图排序算法的静态视频摘要方法(Hyper-Graph Ranking based Video Summarization,HGRVS).HGRVS方法首先通过构建视频超图模型,将任意多个有内在关联的视频帧使用一条超边连接;然后提出一种基于超图排序的视频帧分类算法将视频帧按内容分类;最后通过求解提出的一种优化函数来生成静态视频摘要.在Open Video Project和YouTube两个数据集上的大量主观与客观实验验证了所提HGRVS算法的优良性能. 展开更多
关键词 视频摘要 超图 超图排序 视频帧分类 关键帧提取
在线阅读 下载PDF
利用超图随机游走的视频摘要生成方法 被引量:1
10
作者 冀中 樊帅飞 《小型微型计算机系统》 CSCD 北大核心 2017年第11期2535-2540,共6页
基于图模型的视频摘要算法在视频摘要技术中有着广泛的应用,通常将视频帧作为图模型的顶点,每两个顶点之间通过一条边相连接.虽然图模型能够很好地捕获每对顶点之间的关系,却不能够较好地捕获多个顶点之间的关系.实际上,视频中往往存在... 基于图模型的视频摘要算法在视频摘要技术中有着广泛的应用,通常将视频帧作为图模型的顶点,每两个顶点之间通过一条边相连接.虽然图模型能够很好地捕获每对顶点之间的关系,却不能够较好地捕获多个顶点之间的关系.实际上,视频中往往存在着较为复杂的高阶关系.为此,本文使用超图模型来捕获多个顶点之间的高阶关系,并且基于超图的随机游走算法提出了一种新颖的静态视频摘要方法(Random Walk on Hypergraph for Video Summarization,简称RWH).RWH算法首先通过构建视频概率超图模型,然后利用超图上的随机游走算法选取关键帧.在常用的VSUMM数据集上进行了大量的主观和客观实验,通过与其它视频摘要算法的比较验证了所提RWH算法的先进性. 展开更多
关键词 随机游走 概率超图 视频摘要
一种基于直推判别字典学习的零样本分类方法 预览
11
作者 冀中 孙涛 于云龙 《软件学报》 CSCD 北大核心 2017年第11期2961-2970,共10页
零样本分类的目标是对训练阶段未出现过的类别的样本进行识别和分类,其主要思路是,借助类别语义信息,将可见类别的知识转移到未见类别中.提出了一种直推式的字典学习方法,包含以下两个步骤:首先,提出一个判别字典学习模型,对带标签的... 零样本分类的目标是对训练阶段未出现过的类别的样本进行识别和分类,其主要思路是,借助类别语义信息,将可见类别的知识转移到未见类别中.提出了一种直推式的字典学习方法,包含以下两个步骤:首先,提出一个判别字典学习模型,对带标签的可见类别样本的视觉特征和类别语义特征建立映射关系模型;然后,针对可见类别和未见类别不同引起的域偏移问题,提出了一个基于直推学习的修正模型.通过在3个基准数据集(Aw A,CUB和SUN)上的实验结果,证明了该方法的有效性和先进性. 展开更多
关键词 零样本分类 图像分类 字典学习 直推学习
在线阅读 下载PDF
基于卷积神经网络的纹理分类方法研究 预览 被引量:7
12
作者 冀中 刘青 +1 位作者 聂林红 庞彦伟 《计算机科学与探索》 CSCD 北大核心 2016年第3期389-397,共9页
深度卷积神经网络(convolutional neural network,CNN)在许多计算机视觉应用中都取得了突破性进展,但其在纹理分类应用中的性能还未得到深入研究。为此,就CNN模型在图像纹理分类中的应用进行了较为系统的研究。具体而言,将CNN用于提... 深度卷积神经网络(convolutional neural network,CNN)在许多计算机视觉应用中都取得了突破性进展,但其在纹理分类应用中的性能还未得到深入研究。为此,就CNN模型在图像纹理分类中的应用进行了较为系统的研究。具体而言,将CNN用于提取图像的初步特征,此特征经过PCA(principal component analysis)降维后可得到最终的纹理特征,将其输入到SVM(support vector machine)分类器中便可获得分类标签。在4个常用的纹理数据集上进行了性能测试与分析,结果表明CNN模型在大多纹理数据集上均能取得很好的性能,是一种优秀的纹理特征表示模型,但其对包含旋转和噪声的纹理图像数据集仍不能取得理想结果,需要进一步提升CNN的抗旋转能力和抗噪声能力。另外,有必要构建具有足够多样性的大规模纹理数据集来保征CNN性能的发挥。 展开更多
关键词 纹理分类 卷积神经网络(CNN) 计算为州泥觉
在线阅读 下载PDF
基于抗噪声局部二值模式的纹理图像分类 预览 被引量:4
13
作者 冀中 聂林红 《计算机研究与发展》 EI CSCD 北大核心 2016年第5期1128-1135,共8页
局部二值模式(local binary pattern ,LBP)特征是一种简单有效的纹理特征描述符,但是它的抗噪声能力较差。针对这一问题,提出一种对噪声较为鲁棒的纹理特征表示方法———抗噪声的完整增强局部二值模式(noise-tolerant complete e... 局部二值模式(local binary pattern ,LBP)特征是一种简单有效的纹理特征描述符,但是它的抗噪声能力较差。针对这一问题,提出一种对噪声较为鲁棒的纹理特征表示方法———抗噪声的完整增强局部二值模式(noise-tolerant complete enhanced LBP ,CELBPNT )。该特征基于局部二值模式特征,对光照、旋转和噪声均具有较好的鲁棒性。其提取过程如下:1)根据 LBP 中各模式的结构和出现频率对特征中的模式重新分类,提出增强局部二值模式(enhanced LBP ,ELBP)特征;2)添加差值的模值信息与中心像素信息,并根据图像尺寸自适应地调整其中的阈值,提出完整增强局部二值模式(complete ELBP , CELBP)特征;3)进一步将该特征进行多尺度下的表示,从而最终提出具有抗噪声能力的纹理特征———CELBPNT 。通过在常用的纹理数据库上添加不同强度和不同类型噪声的情况进行实验,结果表明:CELBPNT 不仅能够显著提升无噪声纹理图像的分类性能,而且对含有噪声的纹理图像分类也有显著的性能提高。 展开更多
关键词 局部二值模式 图像噪声 纹理图像分类 特征提取 多尺度分析
在线阅读 下载PDF
图像多样性重排序技术综述 预览
14
作者 李靖 冀中 《信息技术》 2013年第6期190-192,196共4页
近年来互联网呈现出了爆炸式的增长,而与El常生活息息相关的图像资源变得更加重要,如何能够准确地获取所需的图像资源是当前多媒体搜索领域需要重点解决的问题。目前的大多工作围绕图像的相关性搜索重排序展开,对多样性搜索重排序的... 近年来互联网呈现出了爆炸式的增长,而与El常生活息息相关的图像资源变得更加重要,如何能够准确地获取所需的图像资源是当前多媒体搜索领域需要重点解决的问题。目前的大多工作围绕图像的相关性搜索重排序展开,对多样性搜索重排序的研究较少。相关性重排序是指对于返回结果来说,都是将相关的样本排在结果集的前列,但是很少考虑样本相互之间的联系,而多样性重排序是为了提高返回结果的多样性,也就是覆盖主题的多样性,以降低相关重排序中带来的信息冗余问题。文中对当前常见的几种算法评价并进行比较,并通过不同于文本重排的评价准则对性能进行评价。 展开更多
关键词 图像搜索重排序 多样性搜索重排序 随机游走 基于内容的图像搜索
在线阅读 下载PDF
谈招标人招标代理机构如何正确面对和处理异议 预览
15
作者 冀中 陈丽 《招标与投标》 2013年第2期36-37,共2页
《中华人民共和国招标投标法实施条例》(以下简称《实施条例》)自2012年2月1日正式实施以来,在规范招标投标市场,引导参与主体正确维护其合法权益等方面取得了明显效果。但是,由于部分招标投标活动当事人对《实施条例》理解不透彻... 《中华人民共和国招标投标法实施条例》(以下简称《实施条例》)自2012年2月1日正式实施以来,在规范招标投标市场,引导参与主体正确维护其合法权益等方面取得了明显效果。但是,由于部分招标投标活动当事人对《实施条例》理解不透彻,仅停留在文字表面,没有真正从法理上领悟其具体举措的内涵,使得《实施条例》一些创新机制没有发挥其应有的作用,异议程序便是其中乡一。 展开更多
关键词 异议程序 招标代理机构 招标人 《实施条例》 中华人民共和国 招标投标市场 招标投标活动 招标投标法
在线阅读 下载PDF
多视频摘要技术:方法、应用及挑战 预览 被引量:2
16
作者 冀中 苏育挺 庞彦伟 《计算机工程与应用》 CSCD 2012年第27期1-6,共6页
多视频摘要技术近年来受到了国内外学者的广泛关注,它是指通过对视频结构和内容的分析,从多个相关视频文件中提取出有意义的部分,将它们以一定方式进行组合,形成简洁的、能够充分表现语义内容的概要,目的是提供快捷的浏览和查询服务。... 多视频摘要技术近年来受到了国内外学者的广泛关注,它是指通过对视频结构和内容的分析,从多个相关视频文件中提取出有意义的部分,将它们以一定方式进行组合,形成简洁的、能够充分表现语义内容的概要,目的是提供快捷的浏览和查询服务。目前该技术还处于起步阶段,实际的应用系统很少,有关体系结构、技术方法仍需要深入研究,更多的应用方向还有待开拓。在介绍研究意义的基础上,对多视频摘要的研究现状和主要方法进行了归纳、评述,探讨了一些应用方向,指出了目前研究面临的重点问题以及发展趋势。 展开更多
关键词 多视频摘要 多媒体内容分析与检索 多媒体排序
在线阅读 下载PDF
基于仿射包和伪Zernike矩的视频人脸检索 预览 被引量:1
17
作者 苏育挺 王静 冀中 《计算机工程与应用》 CSCD 2012年第34期179-183,共5页
近年来基于视频的人脸检索已成为人脸识别和检索领域最为活跃的研究方向之一。提出了一种基于仿射包结合伪Zemike矩特征的视频人脸检索算法(FRIVAP)。在视频中检测跟踪到人脸生成图像集,接着提取图像集中人脸的伪Zemike矩特征,建立... 近年来基于视频的人脸检索已成为人脸识别和检索领域最为活跃的研究方向之一。提出了一种基于仿射包结合伪Zemike矩特征的视频人脸检索算法(FRIVAP)。在视频中检测跟踪到人脸生成图像集,接着提取图像集中人脸的伪Zemike矩特征,建立特征的仿射包,通过相似度计算得到结果。经对Honda/UCSD视频数据库和自行构建的视频数据库的大量实验表明,该算法可以充分利用视频中人脸的时间和空间信息,并且对噪声、人脸姿势变化等条件下的人脸检索有较强的鲁棒性。 展开更多
关键词 视频人脸检索 人脸识别 仿射包 伪ZERNIKE矩
在线阅读 下载PDF
基于内容的图像和视频搜索重排序技术综述 预览 被引量:6
18
作者 张静 曲晓杰 +1 位作者 冀中 苏育挺 《计算机工程与应用》 CSCD 北大核心 2011年第29期 171-174,共4页
基于内容的图像/视频搜索重排序技术是指在基于文本的图像/视频搜索结果的基础上,利用数据的视觉信息,通过某种方法对原始搜索结果重新排序的过程,目的是提高搜索质量和提升用户搜索体验,是一种互联网多媒体图像/视频搜索新模式... 基于内容的图像/视频搜索重排序技术是指在基于文本的图像/视频搜索结果的基础上,利用数据的视觉信息,通过某种方法对原始搜索结果重新排序的过程,目的是提高搜索质量和提升用户搜索体验,是一种互联网多媒体图像/视频搜索新模式。对这一技术进行了综述,系统地分析了重排序技术的发展现状,详尽地探讨了各类重排序技术的特点及应用,总结了现有评价方法和数据库,指出了当前重排序技术的发展趋势。 展开更多
关键词 基于内容的重排序 图像/视频搜索 相关性重排序 多样性重排序
在线阅读 下载PDF
基于上下文信息的新闻故事单元分割 预览 被引量:1
19
作者 冀中 苏育挺 +2 位作者 宋星光 纪旭 华蕊 《天津大学学报》 EI CAS CSCD 北大核心 2009年第2期 153-158,共6页
为了有效检索和管理新闻视频资源,提出了一种利用多模态特征、基于上下文信息的新闻故事单元分割方法。首先利用字幕变化、音频类型和视频镜头类型信息将新闻镜头序列转换成为相应的关键词序列,使新闻故事单元分割转换成为文体序列分... 为了有效检索和管理新闻视频资源,提出了一种利用多模态特征、基于上下文信息的新闻故事单元分割方法。首先利用字幕变化、音频类型和视频镜头类型信息将新闻镜头序列转换成为相应的关键词序列,使新闻故事单元分割转换成为文体序列分割的问题;然后应用一种有效的序列分割模型—条件随机场,来分割新闻故事单元。对多段视频的测试结果证明了该方法的有效性,取得了查全率为72.9%、查准率为88.4%的较好结果。 展开更多
关键词 新闻故事单元分割 上下文信息 条件随机场 视频内容分析 新闻视频
在线阅读 下载PDF
基于多模态信息融合的新闻独白镜头检测 预览 被引量:1
20
作者 冀中 苏育挺 杨益铮 《计算机工程与应用》 CSCD 北大核心 2009年第25期 173-175,182,共4页
新闻视频中的独白镜头具有较大的信息量,在视频检索和挖掘中具有较高的应用价值。提出了一种融合音频、视频、时域以及上下文信息等多模态特征进行独白场景检测的方法。首先利用规则移除广告和“其他”镜头,然后应用聚类的方法检测主... 新闻视频中的独白镜头具有较大的信息量,在视频检索和挖掘中具有较高的应用价值。提出了一种融合音频、视频、时域以及上下文信息等多模态特征进行独白场景检测的方法。首先利用规则移除广告和“其他”镜头,然后应用聚类的方法检测主持人镜头,最后应用条件随机场(CRFs)模型标记独白和记者镜头。该方法无需额外的信息,具有较好的普适性,实验取得了较好的性能。 展开更多
关键词 独白镜头检测 新闻视频 视频检索 多模态 条件随机场
在线阅读 下载PDF
上一页 1 2 17 下一页 到第
使用帮助 返回顶部 意见反馈