谷歌周三宣布,有 24 种新的语言和方言需要翻译。添加到多语言神经机器翻译服务中的新项目包括来自全球不同地区的语言,包括被认为是美洲土著语言的盖丘亚语、瓜拉尼语和艾马拉语。这使谷歌翻译涵盖的语言总数达到 133 种。
“多年来,谷歌翻译帮助打破了语言障碍并连接了世界各地的社区。我们希望让更多人能够做到这一点——尤其是那些语言在大多数技术中都没有体现出来的人。因此,今天我们为 Translate 添加了 24 种语言,现在支持全球使用的总共 133 种语言,”Google 翻译高级软件工程师 Isaac Caswell 说。“超过 3 亿人使用这些新增的语言——比如印度东北部大约 80 万人使用的米佐语和中非超过 4500 万人使用的林加拉语。”
Caswell 指出,谷歌翻译的最新更新相当特别,因为这些语言是第一个使用“零样本机器翻译”添加的。据他介绍,这些语言的机器学习模型“在没有看到示例的情况下学习翻译成另一种语言”并且“只看到单语文本”。有了这个,软件工程师承认它在所有方面都不是完美的,尽管他认为它令人印象深刻。“我们将不断改进这些模型,以提供与西班牙语或德语翻译相同的体验,”他补充道。“如果您想深入了解技术细节,请查看我们的 Google AI 博客文章和研究论文。”
以下是添加到 Google 翻译的最新语言和方言的完整列表,以及使用它们的地点和使用它们的人数:
阿萨姆语。印度东北部(约 2500 万扬声器)
艾马拉。玻利维亚、智利和秘鲁(约 200 万使用者)
班巴拉。马里(约 1400 万扬声器)
博杰普尔。印度北部、尼泊尔和斐济(约 5000 万使用者)
迪维希语。马尔代夫(约 300,000 名发言者)
多格里。印度北部(约 300 万扬声器)
母羊。加纳和多哥(约 700 万扬声器)
瓜拉尼_ 巴拉圭和玻利维亚、阿根廷和巴西(大约 700 万发言者)
伊洛卡诺。菲律宾北部(约 1000 万扬声器)
康卡尼_ 印度中部(约 200 万扬声器)
克里奥。塞拉利昂(约四百万人)
库尔德人(索拉尼语)。伊拉克和伊朗(约 1500 万发言者)
林加拉语。刚果民主共和国、刚果共和国、中非共和国、安哥拉和南苏丹共和国(约 4500 万发言者)
英语_ 乌干达和卢旺达(约 2000 万发言者)
迈提利。印度北部(约 3400 万扬声器)
梅泰隆(曼尼普里)。印度东北部(约 200 万扬声器)
米佐。印度东北部(约 830,000 名演讲者)
奥罗莫_ 埃塞俄比亚和肯尼亚(约 3700 万发言者)
盖丘亚语。秘鲁、玻利维亚、厄瓜多尔及周边国家(约 1000 万扬声器)
梵文。印度(约 20,000 名发言者)
英语_ 南非(约 1400 万扬声器)
提格里尼亚语_ 厄立特里亚和埃塞俄比亚(约 800 万发言者)
特松加_ 斯威士兰、莫桑比克、南非和津巴布韦(约 700 万使用者)
特威。加纳(约 1100 万发言者)
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/Yun164443.html