自然语言处理与中文

自然语言处理是人工智能技术创新最令人瞩目的领域之一,特别是Transoformer和Self-Attention。

这一领域的领头羊是GAFA(谷歌/苹果/Facebook/亚马逊)以及微软,但中国的百度和腾讯也发布了各种成果。

而在某些情况下,在语言上更为相近的中国,在技术方面往往比以英语为核心语言的前者,更能与日语兼容。

以BERT为例,它通过遮盖一些字符极大地提升了语言处理学习能力,不久之后,百度宣布了一项名为ERNIE的技术,专门为“像日语和中文这样不分词的语言”设计。

这样进行日语的语言处理,学习日本的邻国——中国的技术非常有意义。

本公司的社员能直接用中文处理,日以继夜,不断吸收中国的最尖端处理技术。

 构建平行语料库築

平行语料库(多语种对译表)是定制机械翻译引擎的必要条件,但对中文来说,可用的平行语料库并不多。

在创建语料库和选择句子方面,为保证所译中文的品质,进行适当的清洗、屏蔽和剔除,能够对日语和中文进行深度理解必不可少。

本公司充分发挥在自然语言处理方面的实践以及对日语和中文的敏感性,致力于创建高级语料库以及定制和调整各种翻译引擎。

如需要中文的自然语言处理,欢迎随时联系。