期刊文献+

融合视音频特征的影片摘要生成方法 预览 被引量:1

Movie summarization method based on audio-visual feature fusion
在线阅读 下载PDF
收藏 分享 导出
摘要 提出了融合视音频特征的影片摘要生成算法。以特写人脸检测,紧张、激烈镜头检测作为选取重要视频片段的依据,针对影片语音端点难以检测的问题,利用影片字幕文件提取影片语音首尾时间以及语音内容,从而实现了影片语音端点的准确检测。实验证明,该方法生成的影片摘要具有较好的有效性。 Abstract : This paper proposed a movie summarization method based on audio-visual feature fusion. This method selected video clips which had close-up faces and atwitter shots as the important clips. To solve the problem of difficulty in movie speech endpoint detection, it introduced a method of speech endpoint detection based on subtitles of motion pictures, which could detect the start and end time of captions exactly. Compared with other summarization algorithms, the proposed method is proved to be effective for movie summarization.
作者 栾悉道 谢毓湘 李琛 牛晓 Luan Xidao1, Xie Yuxiang2, Li Chen2, Niu Xiao2 ( 1. Dept. of Mathematics & Computer Science, Changsha University, Changsha 410022, China; 2. College of Information Systems & Management, National University of Defense Technology, Changsha 410073, China)
出处 《计算机应用研究》 CSCD 北大核心 2017年第1期287-289,共3页 Application Research of Computers
基金 国家自然科学基金资助项目(61571453) 湖南省自然科学基金资助项目(14JJ3010) 湖南省教育厅重点资助项目(15A020)
关键词 视频摘要 人脸检测 端点检测 视音频特征融合 video summarization face detection endpoint detection audio-visual feature fusion
作者简介 栾悉道(1976-),男,山东即墨人,副教授,博士,主要研究方向为多媒体信息系统; 谢毓湘(1976-),女(通信作者),湖南隆回人,副教授,博士,主要研究方向为多媒体信息系统(yxxie@nudt.edu.cn); 李琛(1991-),男,山西运城人,硕士研究生,主要研究方向为多媒体信息系统; 牛晓(1992-),男,河北沦州人,硕士研究生,主要研究方向为多媒体信息系统.
  • 相关文献

参考文献4

二级参考文献59

  • 1谢毓湘,栾悉道,吴玲达,肖鹏.一种基于EDU模型的新闻视频摘要方法[J].国防科技大学学报,2007(5):71-76. 被引量:1
  • 2Ma Y F,Lu L,Zhang H J.A user attention model for video summarization[C] //Proceedings of ACM International Conference on Multimedia,Juan-les-Pins,2002:533-542. 被引量:1
  • 3Ekin A,Tekalp A M,Mehrotra R.Automatic soccer video analysis and summarization[J].IEEE Transactions on Image Processing,2003,12(7):796-807. 被引量:1
  • 4Lin T,Zhang H.Automatic video scene extraction by shot grouping[C] //Proceedings of the 15th International Conference on Pattern Recognition,Barcelona,2000:39-42. 被引量:1
  • 5Pan J Y,Yang H,Faloutsos C.MMSS:multi-modal story-oriented video summarization[C] //Proceedings of the 4th IEEE International Conference on Data Mining,Brighton,2004:491-494. 被引量:1
  • 6Smith M A,Kanade T.Video skimming for quick browsing based on audio and image characterization[R].Pittsburgh:Carnegie Mellon University.School of Computer Science,CMU-CS-95-186,1995. 被引量:1
  • 7Haas M,Lew M S,Huijsmans D P.Shot break detection and camera motion classification in digital video[M] //Image Databases and Multimedia Search.River Edge,NJ:World Scientific,1997:191-201. 被引量:1
  • 8Shi L,King I,Lyu M R.Video summarization by video structure analysis and graph optimization[C] //Proceedings of IEEE International Conference on Multimedia and Expo,Taipei,2004:1959-1962. 被引量:1
  • 9Chen F,Cooper M,Adcock J.Video summarization preserving dynamic content[C] //Proceedings of the International Workshop on TRECVID Video Summarization,Augsburg,2007:40-44. 被引量:1
  • 10Zhang H J,Kankanhalli A,Smoliar S W.Automatic partitioning of full-motion video[J].Multimedia Systems,1993,1(1):10-28. 被引量:1

共引文献7

同被引文献13

引证文献1

投稿分析

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部 意见反馈