

借助转换器神经网络架构,您可使用非常大规模的模型,其中通常具有数千亿个参数。这种大规模模型可以摄取通常来自互联网的大量数据,但也可以从包含 500 多亿个网页的 Common Crawl 和拥有约 5700 万个页面的 Wikipedia 等来源摄取数据。


(1)早期探索:机器翻译的历史可以追溯到17世纪,哲学家如莱布尼茨和笛卡尔提出了关于语言之间单词关系的编码提案。1950年,艾伦·图灵发表了著名的文章《计算机器与智能》,提出了现在称为图灵测试的智能标准。
讯飞星火是科大讯飞推出的另一个重要的语言模型,主要用于语音识别和语音合成,强化了讯飞在语音技术领域的领先地位。




特别说明:本文仅供学习交流,如有不妥欢迎后台联系小编。
– END –
原创来源:北外CAT课程展示-张恩桐、罗邵雯-2023
推文编辑:张恩桐、罗邵雯