期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
汉语-印尼语平行语料自动对齐方法研究 预览
1
作者 郑铿涛 林楠铠 +2 位作者 付颖雯 王连喜 蒋盛益 《广西师范大学学报:自然科学版》 CAS 北大核心 2019年第1期89-97,共9页
双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对... 双语平行语料库是多语种自然语言处理的重要资源,已被广泛地应用于机器翻译、机助人译、翻译知识抽取与跨语言信息检索等领域中。本文针对汉语-印尼语平行语料的自动对齐与可比语料的自动提取问题,提出了基于锚点和词典相结合的段落对齐方法,并在此基础上采用基于置信区间的长度模型实现句子对齐,同时,为了快速提高汉语-印尼语平行语料库的构建效率,还提出了基于跨语言文档相似度的可比语料提取方法。实验结果表明,本文提出的平行语料对齐方法和可比语料提取方法的准确率较传统方法有显著的提高,说明本文提出方法是有效的、可行的。 展开更多
关键词 平行语料 语料库构建 可比语料 段落对齐 句对齐
在线阅读 下载PDF
基于可比语料库的中外学术论文引言的语类分析 被引量:1
2
作者 牛桂玲 《西安外国语大学学报》 CSSCI 2018年第1期25-30,共6页
近年来,学术语类研究逐渐受到国内学界的特别关注,研究内容广泛,成果颇丰,但针对学术论文引言的语类研究却相对缺乏。文章基于自建的大型中外中英文学术论文引言可比语料库,利用语料库的大文本、多功能、语料选择严谨以及定量和定性相... 近年来,学术语类研究逐渐受到国内学界的特别关注,研究内容广泛,成果颇丰,但针对学术论文引言的语类研究却相对缺乏。文章基于自建的大型中外中英文学术论文引言可比语料库,利用语料库的大文本、多功能、语料选择严谨以及定量和定性相结合的优势来实现对引言文本的多层对比研究。结果发现:国内外大多数引言均采用Swale的CARS模型;但在具体运用方面,相对于与国际论文引言,中国论文引言中的"中国式"论文写作风格依然凸显,存在规约性较弱、语步逆序性较为显著、语类特点不够突出等特点。研究结果表明加强中国作者论文引言写作的语类意识、明确各语步的功能、进而习得引言写作技能是提高引言质量的必要手段。 展开更多
关键词 可比语料库 语类分析 引言
基于可比语料库的“悲伤”情绪隐/转喻对比研究——以歌德和李白诗歌为例
3
作者 张嘉伟 刘越莲 《外语教学》 CSSCI 北大核心 2018年第4期46-51,共6页
本文以歌德和李白诗歌为语料,通过语料库方法系统地考察和对比其“悲伤”情绪转喻与隐喻表征。语料分析显示,德汉语在“悲伤”的身体特征转喻表征方面呈现出很大的相似性,而在概念隐喻方面存在较大差异。在诗歌作品中,诗人常用多样... 本文以歌德和李白诗歌为语料,通过语料库方法系统地考察和对比其“悲伤”情绪转喻与隐喻表征。语料分析显示,德汉语在“悲伤”的身体特征转喻表征方面呈现出很大的相似性,而在概念隐喻方面存在较大差异。在诗歌作品中,诗人常用多样的感知体验来构成情绪转喻和隐喻表征;同时,具身体验和文化语境都影响转喻和隐喻的使用及其频率。 展开更多
关键词 情绪隐喻 可比语料库 歌德 李白
对外汉语教学领域可比语料库的构建及应用研究——以“把”字句的句法语义标注及应用研究为例 预览
4
作者 谭晓平 《中文信息学报》 CSCD 北大核心 2017年第6期83-92,共10页
该文构建了一个规模为11万字的,包含自然语料、对外汉语教材语料和汉语中介语语料的小型"把"字句可比语料库,制订了"把"字的句法语义标注框架,对语料库中1 556个"把"字句进行了句法语义标注,开发了检索界面,探讨了可比语料库在"... 该文构建了一个规模为11万字的,包含自然语料、对外汉语教材语料和汉语中介语语料的小型"把"字句可比语料库,制订了"把"字的句法语义标注框架,对语料库中1 556个"把"字句进行了句法语义标注,开发了检索界面,探讨了可比语料库在"把"字句教学与研究中的应用。数据显示:汉语教材中表示具体空间转移、描述动作的方式和次数、信息转移、致使类的"把"字句偏多,但表示抽象空间转移、判断或认同类的"把"字句偏少。学习者对于结果类"把"字句掌握较好;教材中S+把+N+V+状态补语、S+把+N1+V+N2等五种结构形式的"把"字句偏多,但S+把+N1+V为+N2、S+把+N1+V到+N2等六种结构形式的"把"字句偏少。学习者须依次加强S+把+N+V+趋向补语、S+把+N1+V到+N2等17种结构形式的"把"字句的学习。研究认为汉语可比语料库可为对外汉语教材研究、教材编排、二语习得研究、课堂教学提供数据支持与语料基础。 展开更多
关键词 可比语料库 对外汉语教学 “把”字句
在线阅读 下载PDF
基于可比语料库的双语词典抽取方法比较研究 被引量:1
5
作者 李舰 李波 +1 位作者 陈鹏 杨丹 《小型微型计算机系统》 CSCD 北大核心 2017年第7期1554-1561,共8页
双语词典是一种重要的语言资源,但现有的基于可比语料库的双语词典抽取方法在体系结构、所依赖的基础性资源等方面差异较大,这使得在统一的实验条件下对各种算法进行比较变得很困难.因此,目前的研究工作多选择将性能评测任务限定在... 双语词典是一种重要的语言资源,但现有的基于可比语料库的双语词典抽取方法在体系结构、所依赖的基础性资源等方面差异较大,这使得在统一的实验条件下对各种算法进行比较变得很困难.因此,目前的研究工作多选择将性能评测任务限定在很狭小的范围内,缺乏统一的评测结果给双语词典抽取任务的发展和算法的选择带来一定困难.为解决上述问题,选取并实现了四种代表性的双语词典抽取方案,在统一的测试数据集上进行比较研究.在比较研究中,我们重点揭示了词典抽取任务中几种关键因素如语料库大小、训练词典大小等对各算法性能的不同影响程度.本文的结论对今后相关工作中的实验设计、性能比较与算法选用都具有重要的理论意义和实践价值. 展开更多
关键词 可比语料库 双语词典抽取 上下文向量 词向量
融合主题和要素的汉柬可比语料获取方法 被引量:1
6
作者 郭月江 严馨 +3 位作者 刘小惠 余正涛 线岩团 莫源源 《云南大学学报:自然科学版》 CSCD 北大核心 2017年第3期360-368,共9页
为了有效地获取可比语料,选取汉柬双语新闻文档作为可比语料库的候选语料,提出一种融合发布时间要素、实体要素和主题分布的可比语料获取方法.该方法首先计算文本的主题概率分布的JS距离,并融合各主题和要素特征,计算文本相似度;然后利... 为了有效地获取可比语料,选取汉柬双语新闻文档作为可比语料库的候选语料,提出一种融合发布时间要素、实体要素和主题分布的可比语料获取方法.该方法首先计算文本的主题概率分布的JS距离,并融合各主题和要素特征,计算文本相似度;然后利用改进型的层次聚类算法对双语文本进行聚类,最后从聚簇类结果中获取可比语料.与基于词典的文本相似度计算方法进行聚类相比,该文方法有更高的Purity和F值并且获得的高质量的可比语料更多,说明了本文方法的有效性. 展开更多
关键词 可比语料库 层次聚类 双语主题模型 跨语言文本相似度
基于特征相似度的可比语料挖掘汉柬命名实体等价对 预览
7
作者 徐璐 严馨 +2 位作者 夏青 周枫 莫源源 《计算机与数字工程》 2017年第5期882-885,910共5页
命名实体翻译等价对在跨语言信息处理中具有非常重要的应用价值,然而由于语料资源的有限性,国内外关于汉柬命名实体等价对的抽取方法还没有深入研究。论文从可比语料文本出发,根据不同类型实体要素的特点以及在可比语料中的特点,选... 命名实体翻译等价对在跨语言信息处理中具有非常重要的应用价值,然而由于语料资源的有限性,国内外关于汉柬命名实体等价对的抽取方法还没有深入研究。论文从可比语料文本出发,根据不同类型实体要素的特点以及在可比语料中的特点,选取了柬文命名实体到中文命名实体的音译特征、翻译特征、可比语料中命名实体的上下文特征及自身的长度特征,提出了一种基于多特征融合来计算相似度的方法来挖掘汉柬双语命名实体等价对。实验表明该方法取得了比较好的效果,其中挖掘人名实体对的准确率达到76%,召回率达到66%,证明了该方法要优于只采用单一特征的方法。 展开更多
关键词 命名实体等价对 汉柬双语 多特征融合 可比语料 音译模型
在线阅读 下载PDF
基于类比语料库考察英语旅游翻译的读者关照——以《杭州旅游指南(英文版)》为例 预览
8
作者 刘东光 《湖北函授大学学报》 2017年第13期176-178,共3页
本文基于由英语旅游翻译文本和原生文本构成的可比语料库,运用语料库分析技术,从语言通俗性、语言对话性,语言感染力三个角度,考察了英语旅游翻译文本与原生文本在反映读者关照数项指标上的差异,从而为旅游文本英译提供借鉴。
关键词 语料库 旅游文本 读者关照
在线阅读 下载PDF
立法文本的语言及翻译特征——基于可比语料库的研究 预览
9
作者 孙钰岫 Aleksandra Matulewska 《浙江工商大学学报》 CSSCI 2017年第6期25-35,共11页
文章通过自建的中文立法英译本和美国立法文本组成的可比语料库,比较研究中文立法英译与原创立法英文之间的语言差异情况。通过对54个语言特征进行多维度分析,文章从五个维度对中文立法英译本的翻译特征和美国立法文本的语言特征进行比... 文章通过自建的中文立法英译本和美国立法文本组成的可比语料库,比较研究中文立法英译与原创立法英文之间的语言差异情况。通过对54个语言特征进行多维度分析,文章从五个维度对中文立法英译本的翻译特征和美国立法文本的语言特征进行比较,发现立法文本与通用文本之间以及两种英文文本内部均存在差异,并可从三个视角(弱叙事性与个性化、弱叙事性与弱显性说服性以及高信息密度与明确度)对维度间的联系进行解释,归纳出两种英文文本的语言特征异同,力图从法律界定与保障角度对其深层原因进行探讨。所得出的结论可为国家权力以及公民权利的语言层面研究提供一定程度的理论指导,同时对今后的法律翻译实践提出建议,并为以后的法律语体变异研究提供参考。 展开更多
关键词 立法文本 可比语料库 语言差异 语言特征 多维度分析法
在线阅读 免费下载
基于可比语料库的翻译英语衔接显化研究 被引量:6
10
作者 许家金 徐秀玲 《外语与外语教学》 CSSCI 北大核心 2016年第6期94-102,122共10页
现有语料库翻译学研究,多数限于描述译文的词汇运用,少量涉及句法特征,对译文语篇特征的关注较少。本研究借助在线文本分析工具Coh—Metrix,对比了汉译英翻译英语和原创英语中的25项语篇衔接特征。研究发现,翻译英语中有多项语法... 现有语料库翻译学研究,多数限于描述译文的词汇运用,少量涉及句法特征,对译文语篇特征的关注较少。本研究借助在线文本分析工具Coh—Metrix,对比了汉译英翻译英语和原创英语中的25项语篇衔接特征。研究发现,翻译英语中有多项语法和词汇衔接特征与原创英语存在显著差异,呈现出衔接显化的特点。其中语法衔接突出表现为多用各类连词。词汇衔接方面,以语篇中句间实词重复现象为典型特征。英语译文的语法衔接显化,大致可从汉语重意合,英语重形合得到解释。而词汇衔接显化,可能与汉语源语特征以及英语译文中多用高频词和泛义词有关。本文还就衔接显化作为翻译普遍性特征进行了讨论。 展开更多
关键词 衔接显化 翻译英语 汉英翻译 可比语料库 语料库翻译学
基于跨语言信息检索的可比语料库构建方法研究 预览 被引量:1
11
作者 司莉 史雅莉 《国家图书馆学刊》 CSSCI 北大核心 2016年第6期64-70,共7页
为满足用户对多语言信息表达与获取的迫切需求,可比语料库的研究和开发逐渐成为信息检索领域研究者和系统开发人员的关注重点。从跨语言信息检索视角出发,可比语料库的构建方法主要有提问式翻译法、特征过滤法、中间语言翻译法、文本翻... 为满足用户对多语言信息表达与获取的迫切需求,可比语料库的研究和开发逐渐成为信息检索领域研究者和系统开发人员的关注重点。从跨语言信息检索视角出发,可比语料库的构建方法主要有提问式翻译法、特征过滤法、中间语言翻译法、文本翻译法和同源匹配法等。我国可比语料库的建设,应在充分考虑系统整体性能的前提下,根据用户需求选择适用的构建方法,完善文本翻译及术语抽取技术,并优化文本对齐方式。 展开更多
关键词 可比语料库 构建方法 跨语言信息检索
在线阅读 下载PDF
基于可比语料库的汉维术语抽取研究 预览
12
作者 米尔夏提·力提甫 艾合买提·赛都拉 《新疆大学学报:哲学社会科学维文版》 2016年第3期19-23,共5页
摘要:对平行语料库的汉维术语抽取和基于可比语料库的汉维术语抽取进行对比分析,说明基于可比语料库的汉维术语抽取的研究意义应用价值。分析总结解决该问题的主要方法,指出存在的问题并展望该研究的未来发展方向。通过这个项目引导... 摘要:对平行语料库的汉维术语抽取和基于可比语料库的汉维术语抽取进行对比分析,说明基于可比语料库的汉维术语抽取的研究意义应用价值。分析总结解决该问题的主要方法,指出存在的问题并展望该研究的未来发展方向。通过这个项目引导更多年轻研究者关注。 展开更多
关键词 汉维术语抽取 可比语料库 上下文向量 向量相似度计算
在线阅读 下载PDF
基于维基百科的双语可比语料的句子对齐 预览 被引量:3
13
作者 胡弘思 姚天昉 《中文信息学报》 CSCD 北大核心 2016年第1期198-203,共6页
该文提出了一种从维基百科的可比语料中抽取对齐句子的方法。在获取了维基百科中英文数据库备份并进行一定处理后,重构成本地维基语料数据库。在此基础上,统计了词汇数据、构建了命名实体词典,并通过维基百科本身的对齐机制获得了双语... 该文提出了一种从维基百科的可比语料中抽取对齐句子的方法。在获取了维基百科中英文数据库备份并进行一定处理后,重构成本地维基语料数据库。在此基础上,统计了词汇数据、构建了命名实体词典,并通过维基百科本身的对齐机制获得了双语可比语料文本。然后,该文在标注的过程中分析了维基百科语料的特点,以此为指导设计了一系列的特征,并确定了'对齐'、'部分对齐'、'不对齐'三分类体系,最终采用SVM分类器对维基百科语料和来自第三方的平行语料进行了句子对齐实验。实验表明:对于语言较规范的可比语料,分类器对对齐句的分类正确率可达到82%,对于平行语料,可以达到92%,这说明该方法是可行且有效的。 展开更多
关键词 句子对齐 可比语料 维基百科 SVM
在线阅读 下载PDF
基于可比语料库的英语译文词义泛化研究 被引量:8
14
作者 许家金 《中国翻译》 CSSCI 北大核心 2016年第2期16-21,共6页
本研究基于可比语料库,从实词的熟悉度、具体化程度、意象性、多义性四个语义维度,对比了英语译文与原创英文中的词义抽象度情况。数据显示,英语译文在实词熟悉度上取值明显偏高,在具体化程度、意象性方面取值偏低。这些从正反两方... 本研究基于可比语料库,从实词的熟悉度、具体化程度、意象性、多义性四个语义维度,对比了英语译文与原创英文中的词义抽象度情况。数据显示,英语译文在实词熟悉度上取值明显偏高,在具体化程度、意象性方面取值偏低。这些从正反两方面揭示出英语译文用词抽象、概括的显著特点。 展开更多
关键词 词义泛化 英语译文 汉英翻译 翻译共性 可比语料库
类比语料分析对标题与摘要写译的启示——以Nature与Science原创科研论文为例 被引量:4
15
作者 曾文华 刘萍 《中国科技期刊研究》 CSSCI 北大核心 2016年第2期223-229,共7页
【目的】促进科技期刊对科研论文标题与摘要英译的正确导向,提高英文摘要的写译质量。【方法】以65篇Nature和Science原创科研论文为例,从标题句式、摘要人称与时态、悬垂分词的使用三方面进行分析,将国际顶级期刊论文标题和摘要的特点... 【目的】促进科技期刊对科研论文标题与摘要英译的正确导向,提高英文摘要的写译质量。【方法】以65篇Nature和Science原创科研论文为例,从标题句式、摘要人称与时态、悬垂分词的使用三方面进行分析,将国际顶级期刊论文标题和摘要的特点与国内现有行业要求、论文撰写书刊中的相关描述进行对比。【结果】发现Nature和Science论文标题除名词短语外,完整句比例较高;近全部摘要使用第一人称we;动词时态使用多样,可分为单一时态与混合时态两大类;无悬垂分词使用现象。【结论】类比语料的分析结果,可为国内科技期刊的英文摘要写译提供借鉴,为国内科技论文写作教学提供一定参考。 展开更多
关键词 类比语料 标题 摘要 悬垂分词 NATURE SCIENCE
基于类比语料库的中英旅游文本对比研究——语言特征和文本功能维度 预览
16
作者 翟淑洁 时晓婷 《济宁学院学报》 2016年第6期75-79,共5页
基于对自建的中英旅游文本类比语料库分析,发现汉语旅游文本倾向于使用丰富的修饰语,文本风格较为正式,侧重于描写;而英语旅游文本倾向于使用简洁、并且亲近读者的语言,侧重于提供信息,注重呼唤功能.因此,在旅游文本英译时,译者应提高... 基于对自建的中英旅游文本类比语料库分析,发现汉语旅游文本倾向于使用丰富的修饰语,文本风格较为正式,侧重于描写;而英语旅游文本倾向于使用简洁、并且亲近读者的语言,侧重于提供信息,注重呼唤功能.因此,在旅游文本英译时,译者应提高语言和文体的可接受性,强化呼唤功能,从而实现提升旅游产品形象、拓展国际市场的目的 . 展开更多
关键词 类比语料库 旅游文本 语言特征
在线阅读 下载PDF
研究论文摘要中译英之探讨 预览 被引量:1
17
作者 廖柏森 《外国语文研究》 2015年第2期49-59,共11页
篇幅短小,但也是一种独立文体,与论文本文有许多相同特征,但目前在台湾的论文摘要翻译的研究却完全阙如。因此本研究探讨学术论文摘要及其英文译文之间的关系。研究方法是建置两种语料库来探讨(1)中文英译摘要中的各种翻译共性现象,... 篇幅短小,但也是一种独立文体,与论文本文有许多相同特征,但目前在台湾的论文摘要翻译的研究却完全阙如。因此本研究探讨学术论文摘要及其英文译文之间的关系。研究方法是建置两种语料库来探讨(1)中文英译摘要中的各种翻译共性现象,以及(2)翻译与非翻译英文论文摘要之言步结构。执行过程分成两阶段:(1)以台湾各研究领域中文期刊论文的英文摘要建置双语平行语料库,检视中译英摘要中显化、简化、常态化现象的型态和频率;(2)以国外相同研究领域的英文期刊论文摘要建置可比语料库,与台湾期刊论文中译英摘要作比较。希望研究成果能作为中文论文摘要英译以及学术翻译教学上的参考。 展开更多
关键词 论文摘要翻译 平行语料库 可比语料库 翻译共性
在线阅读 下载PDF
基于类比语料库的英语旅游文本文体特征考察 被引量:13
18
作者 李德超 唐芳 《中国外语》 CSSCI 北大核心 2015年第4期88-96,共9页
本文基于自建英语旅游文本类比语料库,比较英语旅游翻译文本与英语旅游原生文本在类符型符比、词汇密度、平均句长、平均词长、高频词等参数上的区别。研究发现,英语旅游翻译文本较之英语旅游原生文本具有以下特点:(1)符合“简化... 本文基于自建英语旅游文本类比语料库,比较英语旅游翻译文本与英语旅游原生文本在类符型符比、词汇密度、平均句长、平均词长、高频词等参数上的区别。研究发现,英语旅游翻译文本较之英语旅游原生文本具有以下特点:(1)符合“简化”趋势,主要表现为标准化类符型符比较低,动词变化程度较低,原形形容词使用重复率较高,高频原形副词使用较频繁;(2)符合“显化”趋势,主要依据为代词密度偏低;(3)时态的运用更为丰富,主要体现在完成时和将来时所占的比重更高;(4)文体更为正式、客观,主要表征为动词名词化较多、被动语态的使用更为频繁和极低的缩略式使用频率。 展开更多
关键词 类比语料库 旅游文本 文体特征
翻译汉语中指示代词的显化:基于语料库的研究 预览 被引量:3
19
作者 任小华 《常熟理工学院学报》 2014年第5期91-97,共7页
基于翻译汉语和原创汉语可比语料库,对翻译汉语中的指示代词进行了研究,结果表明:总体上,指示代词在翻译汉语中均体现出显化特征,文体因素对显化总趋势没有影响,但对显化程度有一定影响。对谓词性指示代词“这…”的个案研究表明... 基于翻译汉语和原创汉语可比语料库,对翻译汉语中的指示代词进行了研究,结果表明:总体上,指示代词在翻译汉语中均体现出显化特征,文体因素对显化总趋势没有影响,但对显化程度有一定影响。对谓词性指示代词“这…”的个案研究表明,翻译汉语中“这…”显化比较明显;“这…”在非文学翻译汉语中呈现出明显的显化特征,但在文学翻译汉语中却没有明显的显化特征;“这…”在“一般”和“学术”类文体的翻译汉语中呈现出明显的显化,而在“新闻”和“小说”类文体的翻译汉语中没有呈现出差异。本文从翻译目的与策略以及英语源语透过效应两个角度讨论了显化的动因,也对“这…”在翻译汉语和原创汉语中差异不明显做了一些解释。 展开更多
关键词 显化 指示代词 翻译汉语 可比语料库
在线阅读 下载PDF
基于类比语料库的中国网站英语旅游文本语言分析 预览 被引量:11
20
作者 康宁 《青岛科技大学学报:社会科学版》 2012年第4期105-109,共5页
基于对自建的英语旅游文本类比语料库,通过与英语国家网站旅游文本的相互参照和比较,以及对中国网站英语旅游文本的语言分析,发现中国网站英语旅游文本的标准化类符/形符比(STTR)与平均词长均低于英语国家网站旅游文本;中国旅游网站... 基于对自建的英语旅游文本类比语料库,通过与英语国家网站旅游文本的相互参照和比较,以及对中国网站英语旅游文本的语言分析,发现中国网站英语旅游文本的标准化类符/形符比(STTR)与平均词长均低于英语国家网站旅游文本;中国旅游网站英语文本句子长度长于英语国家旅游网站英语文本。此外中国网站旅游文本的词汇密度大于英语国家网站旅游文本。从实词类词频上看,中国网站英语旅游文本的名词、形容词、副词均显著超用,而实意动词、第一人称代词(we,our,us)和第二人称代词(you,your)呈现显著少用的特点。该发现有助于提高和改善中国语境下的英语旅游文本语言质量,从而推动中国旅游资源的对外有效传播。 展开更多
关键词 英语旅游文本 类比语料库 语言特征
在线阅读 免费下载
上一页 1 2 3 下一页 到第
使用帮助 返回顶部 意见反馈