一周速览【0317-0323】|翻译管理与大语言模型最新发展
一起回顾上周动态~
周一
DeepL通过下一代LLM模型和写作功能增强API能力,其下一代模型可提供更精准、高质量的翻译,写作API则提供语法建议、拼写校正等高级写作工具。这些功能使企业能更高效地进行语言相关工作,且DeepL API支持多种语言,专享用户享有企业级安全保障。
周二
谷歌和Unbabel推出WMT24++,将AI翻译基准从9种扩展到55种语言,涵盖文学、新闻、社交和语音四大领域。研究发现大型语言模型(LLMs)在这些语言上的翻译表现优于传统机器翻译系统,但自动评估指标存在局限,研究人员强调人类评估对于准确衡量翻译质量和理解LLMs局限性依然关键。
周三
云翻译平台Crowdin提供翻译管理和协作的云端解决方案。企业版支持自动化工作流、多种文件类型和多语言批量翻译,有翻译记忆库、机器翻译和AI辅助功能。但配置有技术门槛,机器翻译结果或需人工校对,大团队管理需更细致权限分配。
周四
Manus是武汉初创公司“蝴蝶效应”开发的通用智能体,整合多个AI模型及独立操作智能体,可自主处理多任务。尽管科技界人士纷纷称赞,但目前仅有不到1%的等待名单用户获得邀请码。测试中,Manus在整理记者名单和搜索房源两项任务中表现出色,能根据反馈改进结果,输出可编辑分享的文件,但在处理付费墙文章时遇阻。此外,Manus存在频繁崩溃、系统卡顿、处理长文本易出错等问题,其故障率高于ChatGPT DeepResearch,不过单任务成本仅为DeepResearch的十分之一。若优化服务器,有望成为高性价比的AI工具。
周五
Welo Data发布新研究,建立多语言框架评估大语言模型因果推理能力,发现模型在处理因果关系时存在显著差距,尤其在语言类型多样的情况下。研究强调了改进模型训练方法的必要性,特别是在多语言和复杂推理任务中。该研究旨在推动AI研发进展,帮助开发者提升多语言AI模型性能。
周六
Tradutor是首个针对欧洲葡萄牙语的开源AI翻译模型,由多所高校和研究机构联合开发。它旨在解决现有翻译模型对欧洲葡萄牙语支持不足的问题,通过构建大规模平行语料库对开源大语言模型进行微调,初步测试性能优于许多现有开源系统,接近部分顶尖闭源模型。该模型的开源将推动面向特定语言变体的机器翻译研究,促进AI系统语言包容性。
周日
大英图书馆与卡塔尔基金会合作的项目(BLQFP)在翻译海湾历史档案时,面临殖民语境下术语的伦理和实践问题。为此,他们制定了尽职尽责的双语描述(CBD)指南,将术语分为四个级别,并提供处理建议。例如,对“fallāḥ”等复杂术语,通过添加引号、提供语境或纳入双语词汇表来处理,旨在与殖民语言保持距离,鼓励用户批判性看待记录。CBD仍在不断发展,为多语种标准制定提供参考。
观世界 译中国敬请期待下周动态