当前位置: 首页 > news >正文

给网站做网站站长工具在线平台

给网站做网站,站长工具在线平台,必应搜索推广,佛山网页开发#AI夏令营 #Datawhale #夏令营 1.赛事简介 目前神经机器翻译技术已经取得了很大的突破,但在特定领域或行业中,由于机器翻译难以保证术语的一致性,导致翻译效果还不够理想。对于术语名词、人名地名等机器翻译不准确的结果,可以通…

#AI夏令营 #Datawhale #夏令营

1.赛事简介

目前神经机器翻译技术已经取得了很大的突破,但在特定领域或行业中,由于机器翻译难以保证术语的一致性,导致翻译效果还不够理想。对于术语名词、人名地名等机器翻译不准确的结果,可以通过术语词典进行纠正,避免了混淆或歧义,最大限度提高翻译质量。

2.赛事任务

基于术语词典干预的机器翻译挑战赛选择以英文为源语言,中文为目标语言的机器翻译。本次大赛除英文到中文的双语数据,还提供英中对照的术语词典。参赛队伍需要基于提供的训练数据样本从多语言机器翻译模型的构建与训练,并基于测试集以及术语词典,提供最终的翻译结果,数据包括:

·训练集:双语数据:中英14万余双语句对

·开发集:英中1000双语句对

·测试集:英中1000双语句对

·术语词典:英中2226条

3.baseline

(1)对中英双语句对进行分词:

import nltk
import jieba
def read_file(filepath):with open(filepath, 'r', encoding='utf-8') as file:lines = file.readlines()return lines# 分词英语文本
def tokenize_en(lines):return [' '.join(nltk.word_tokenize(line)) for line in lines]# 分词中文文本
def tokenize_zh(lines):return [' '.join(jieba.cut(line)) for line in lines]

(2)统计句长分布

train_en.tok

train_zh.tok

句长普遍较短,且中英句长分布有区别。

(3)filter

利用分词后的语料训练源语言和目标语言的语言模型,打分后删除低分语句。

(4)训练

http://www.hyszgw.com/news/45471.html

相关文章:

  • 电商网站建设可行性分析淘宝联盟推广网站怎么做
  • 网站源码有什么用seo是什么的简称
  • 谁有做网站的朋友的V信邢台企业做网站哪家好
  • 响应式网站设计思路网站优化的策略
  • 接入服务商网站备案管理系统技术规范要求个人+网站可以做导航吗
  • 网站备案号代码怎么做中英文双语网站
  • 新开传奇网站刚开一秒第一区人力资源公司名字大全免费
  • php网站开发教程培训开源自动化运维平台
  • 市场营销专业网站企业网站系统建设
  • 旅游网站建设公司哪家好wordpress大学主题下载
  • 建站公司兴田德润简介wordpress 插件 调用
  • 中国制造网 做网站费用百度竞价可以自学吗
  • 电商网站如何做seo企业门户网站建设特色
  • 北京网站建设工作基于ssh框架的网站开发流程图
  • 编程网站scratch常州建设工程信息网站
  • 四平网站建设哪家效果好建设部网站公示
  • 电子商务网站建设策划书 服装 有详细数据库设计网站建设佰金手指科杰三
  • wordpress做淘宝客如何利用seo赚钱
  • 电子商务的网站建设哪做网站
  • 阿里云部署一个自己做的网站吗网站建设开票内容些什么
  • 广西建设官方网站百度提交网站
  • 网站管理包括介绍湖北的网页制作
  • 有哪些做高考模拟卷的网站跨境电商是干嘛的
  • 怎样防止网站被黑网站域名如何备案
  • 汽车信息网站设计论文做的网站浏览的越多越挣钱
  • 免费建设网站公司哪家好搜索引擎推广一般包括哪些
  • 石家庄网站建设蓝点如何加强省市级政门户网站建设
  • 网站设计模板免费下载网站开发设计各部门职责
  • 建设网站使用的工具一站式网站开发服务平台
  • 用eclipse做网站模板wordpress代码加亮的