人工智能能解决真正的人类问题吗?Mabel AI的联合创始人兼首席执行官Karolina Sjöberg和bydhouse AI的联合创始人兼首席执行官霍雪直面了这个问题。
两位ceo都在2022年创立了实时人工智能语音翻译初创公司。Sjöberg是一名训练有素的医生,她获得了语言障碍在医疗环境中可能产生的影响的第一手经验。她认为迫切需要一款翻译医学对话的应用程序。
霍也有动力先解决自己的问题。17岁移居美国时,她因为英语说得不流利而被人挑毛病。后来,在她的职业生涯中,她发现自己在多语言团队中,这些团队的才能因语言熟练程度的差异而受到阻碍。她想知道——人工智能能解决这个问题吗?
Sjöberg和霍在伦敦SlatorCon的语言人工智能创业小组上分享了他们创新人工智能创业背后的想法,揭示了语音翻译的技术挑战,并解释了他们如何找到适合市场的产品。
Sjöberg解释说,Mabel人工智能应用程序可以翻译医疗保健环境中的互动。语音对语音翻译可以让患者和医疗保健提供者用自己的语言自由交流。
基于数据安全考虑,这款应用程序是私有的——它不保存或发送数据——人工智能模型可以在手机上本地运行。Sjöberg告诉SlatorCon的观众:“这意味着它可以在没有网络的情况下使用,比如在飞机上,甚至在防空洞里。”
bydhouse AI是一款用于战略商业沟通的AI解释工具。
“(想象一下)你与制造商品的公司合作,”霍说。“在供应方面,你需要与国外的供应商合作。在需求方面,你有消费者或零售合作伙伴,你可以与他们合作,扩大市场。”
霍说,因此,bydhouse AI被设想为“产品开发和不同语言国际销售电话的一体化解决方案”。
这两个人工智能应用程序都将三个人工智能过程串在一起:语音识别、机器翻译和语音合成。
Mabel AI从开源模型开始,Sjöberg和她的团队对这些模型进行了微调,包括医学对话、药物名称和医学术语。
Sjöberg解释说:“我们的模型接受了广泛的声音训练,这在医疗保健领域当然非常重要。我们还接受了背景噪音的训练,因为医院不是安静的环境。”
一个关键的挑战是,公共领域中可用的许多语音数据都是人们阅读文本的数据,比如有声读物。这位首席执行官说:“在医院里,当人们感到疼痛和疲劳时,他们说话的方式是非常不同的,而且他们使用的口语并不总是在数据集中。”
bydhouse AI将专门的机器翻译引擎与大型语言模型(llm)相结合,以实现更自然和更适合上下文的翻译。使用专有数据集执行微调,该数据集包含特定于行业的词汇表和特定于公司的术语。
对于这两种产品,延迟都是一个关键参数。“因为它是实时的,所以延迟非常重要,”霍向SlatorCon的观众强调。
有时需要在延迟和准确性之间进行权衡。霍解释说:“语音翻译行业面临的一个挑战是,你必须等待文本稳定下来,才能让声音开始说话。”
bydhouse尝试找到一个阈值,以最佳方式平衡这两个变量。
霍总结道:“我们发现,大约4秒(语音对语音)的时间点可以让你获得良好的体验,而不会觉得时间太长,而且仍然能够创造出准确有效的翻译。”
霍还指出,与语音到文本的翻译相比,客户对音频翻译的延迟有更高的容忍度。“如果在几个章节之后出现了标题,那就很重要了,”她说。“在伯德豪斯,我们试图使它尽可能快而稳定,现在不到300毫秒。”
这款名为Mabel的人工智能应用不仅面向公共部门,也面向B2B市场。最初,这家初创公司专注于在没有翻译的情况下通常会发生的互动,比如在病房或养老院与护理相关的互动。
Sjöberg解释说:“我估计,在医疗保健中,大约90%的语言障碍互动是在没有翻译的情况下进行的。”“所以这是一个巨大的需求。”
2024年6月13日,总部位于瑞典的Mabel AI宣布与德国汉诺威医院(Sophienklinik Hannover)合作,提供基于人工智能的口译服务。
bydhouse AI自己的客户发现之旅始于内部。霍的团队在每次外部和内部会议上都使用这个工具,“我们能够在公开发布之前快速迭代,”霍解释道。
然后将重点转移到bydhouse的外部客户,这些客户主要集中在制造业和国际组织部门。“我们和他们成了最好的朋友,”霍告诉SlatorCon的观众。“我们想知道——他们从伯德豪斯身上发现了什么价值?”他们是如何使用它的?为什么这对他们很重要?”
霍说,实时人工智能语音翻译工具现在对这些公司来说“就像止痛药”,他详细解释说,“这是一个必须拥有的解决方案。没有它,他们的业务就无法运作。”
这个范围广泛的小组还讨论了业务扩张、语音人工智能的进展以及人类口译员的作用等问题。录音可以通过Slator的Pro和Enterprise计划获得。
你也可以在Slator 2024 50 under 50 Language AI初创公司列表中阅读更多关于Mabel AI和bydhouse AI的信息。
机器翻译,轻度译后编辑,仅供参考。
编辑:陈驭格
https://slator.com/how-to-build-a-startup-in-real-time-ai-speech-translation/