OpenAI、Google和Meta都将他们的聊天机器人设想为旅行等的数字助理。他们还不完美,但他们越来越接近了。
过去几周,生成式人工智能取得了巨大飞跃,这是自18个月前问世以来最重大的进步。
OpenAI、谷歌和Meta都在今年春天发布了更新的人工智能模型。他们都展示了他们如何将聊天机器人想象成可以理解文本、视频、照片和音频的个人助理。
他们每个人都用与旅游相关的例子来展示他们希望用户如何采用这些助手——这可能会破坏旅游公司发布基于OpenAI和谷歌技术的产品。
这个话题将是6月4日在纽约市举行的Skift首届数据和人工智能峰会期间讨论的一部分。微软的谢恩·奥弗莱厄蒂(Shane O’Flaherty)和旅行规划创业专家吉拉德·贝伦斯坦(Gilad Berenstein)等演讲者将讨论该行业如何采用人工智能,以及如何不采用人工智能。
一些初步测试表明,OpenAI最新的生成式人工智能模型仍然会产生事实错误(它承认这一点),其他所有模型都是如此。
但关键是这些公司都在向前推进,未来的高科技数字旅行礼宾更近了一点。
下面是这些人工智能聊天机器人——ChatGPT、Gemini和Meta AI——如何成为更好的翻译、导游和旅行规划者的详细例子和分析。
Skift已经测试了一些方面,但并不是所有方面都可用。
语音翻译
OpenAI将在未来几周发布新的语音翻译功能,这可能会为国际旅行者打开新的目的地。
根据demos的说法,这是因为ChatGPT移动应用程序的机器人声音——不可思议地像人类——将充当翻译。
自2023年以来,移动用户已经能够与ChatGPT进行语音对话,但与OpenAI接下来的内容相比,今天存在的内容很简单。
新的语音机器人将能够理解非语言线索,如呼气和语调,当被打断时停下来听,它可以识别群体对话中的不同声音。
OpenAI还表示,它可以改变语气(比如说话更兴奋或讽刺),唱歌和大笑。根据演示,它似乎也可以用适当的口音说语言,而现有的声音似乎总是带有美国口音。
这可以打破阻碍旅行者访问某些目的地的语言障碍。
现有的文本翻译,如谷歌翻译,其能力受到严重限制。除了沉闷,他们甚至很难在普通语言之间翻译,通常会误解俚语和习语。对于不常见的语言,它们几乎毫无用处。
ChatGPT语音机器人今天听起来像人类,但本质上是通过听到声音,将其转化为文本,翻译文本,然后大声朗读翻译来操作的——多个步骤会降低速度,并可能导致故障。
即将到来的版本是纯语音的,OpenAI展示了它的即时响应,就像与人类交谈一样。
在一个简短的Skift测试中,现有的聊天机器人能够理解和翻译匈牙利语、加泰罗尼亚语和海地克里奥尔语的片段,这是三种相对不常见的语言。它还能够理解墨西哥俚语,解释它的意思,并提供何时适合使用的上下文。OpenAI表示,ChatGPT的语言能力越来越强。
OpenAI发表了一篇博文,用多个演示展示了它是如何工作的。在同一篇文章的底部附近,它还显示了聊天机器人可能会遇到问题的地方。
谷歌表示,今年夏天将为Gemini发布类似的语音功能,尽管它尚未展示这项技术。
视觉翻译
OpenAI和Meta也都在推动他们技术的视觉翻译能力。他们都用了翻译菜单的例子。
当餐馆没有旅行者母语的菜单时,这种类型的工具可以成为一个很大的问题解决者。即使对于另一种语言说得相当好的人来说,破译菜单也是困难的,因为它们经常包含日常生活中不使用的单词。
OpenAI在一篇博客文章中表示,用户现在可以给菜单拍照,并要求ChatGPT翻译,还可以提供一道菜的文化信息,并就点什么提出建议。
Skift在ChatGPT移动应用程序上做了一个简短的测试,对于照片和PDF文件来说,翻译工作得相当好,但并不完美。用户可以跟进关于不熟悉的菜肴或配料的问题。
Meta在最近发布的最新版本的雷朋Meta智能眼镜中也强调了这一功能——尽管Skift尚未测试它们。据Meta称,如果用户在法国旅行,需要帮助翻译菜单,眼镜可以显示翻译后的文本,而无需看手机屏幕。
导游
OpenAI、谷歌和Meta都表示,他们的聊天机器人将能够实时看到和听到他们周围的环境。这基本上可以把他们变成虚拟导游。
谷歌副总裁兼Gemini experiences总经理Sissie Hsiao在上周的一次会议上表示:“我们对Gemini应用程序的愿景是让你直接接触谷歌最新的人工智能模型,成为最有帮助的个人人工智能助手。”
Meta最近宣布,它已经将最新的Meta AI模型整合到雷朋Meta智能眼镜中。马克·扎克伯格甚至在上个月的财报电话会议上将这款眼镜描述为“人工智能助手”:“你可以让他们看到你看到的,听到你听到的。因此,他们对你周围发生的事情有全面的了解,无论你想做什么,他们都会帮助你。”
技术影响者Cleo Abram展示了他们如何通过与Meta和Ray-Ban的付费合作在纽约市充当导游。
亚伯兰在广告中说:“他们是通过Meta AI来做这一切的。”“当我说‘看’时,它就是拍一张照片,分析它,然后用一个大型语言模型给我一个答案。”
当她透过眼镜看华盛顿纪念碑时,她给出了一个提示:“嘿,梅塔:看着告诉我,那个纪念碑有什么历史?”
聊天机器人的回应是:“它是为了纪念乔治·华盛顿就任总统一百周年而建造的。”
另一个问题:“嘿,梅塔:看着告诉我,那是什么教堂?”
回应:“这座建筑的名字是华盛顿广场卫理公会教堂。”
ChatGPT和Gemini要到今年晚些时候才能看到现场视频,但他们可以看照片。
Skift测试显示ChatGPT做得很好。它不是无所不知的,但它可以利用上下文做出很好的猜测。
奥兰多国际机场内中庭的一张照片引起了这样的回应:“这张照片似乎是在一座大型建筑的中庭内拍摄的,可能是机场航站楼或酒店。棕榈树、喷泉和多层阳台的存在表明它可能是美国佛罗里达州的奥兰多国际机场。建筑和室内景观是这个地方的特色。”
这是ChatGPT给出的瓦伦西亚海鲜饭的背景,它准确地描述为有兔子、鸡肉、一种青豆和蜗牛。
另一方面,Gemini在识别照片方面还做得不太好。当被问及同一张照片时,这是一个回答:“对不起,我还不能帮助拍摄人物的图像。”
重新设想的搜索和旅行计划
谷歌上周展示了三个具体的例子,展示了它如何通过Gemini和传统的搜索栏投资人工智能驱动的旅行规划。
与竞争对手相比,这是一个重大举措,表明谷歌对帮助客户计划旅行是认真的,而不仅仅是预订旅行。
付费Gemini Advanced平台的旅行规划功能尚未发布,但Skift已经在测试重新设计的搜索栏是如何工作的。这可能有点挑剔,但它清楚地展示了谷歌搜索结果未来的样子:人工智能生成的摘要位于顶部和整个顶部,加上中间的一些列表和视频,穿插的传统链接较少。
Meta还在推广其升级后的聊天机器人的旅行规划功能。Meta AI聊天机器人现在可以在Messenger、Whatsapp和Instagram的群聊中回答旅行问题。因此,如果一个团队计划在Whatsapp上一起旅行,有人可以要求Meta AI建议在一个新城市要做的事情,或者分享航班可用性信息。
自2022年生成式人工智能首次发布以来,旅游专家预测,谷歌和其他大公司将是最大的赢家,小酒店和旅游运营商可能会受到最大的影响,因为他们的网站在页面上被进一步推低。
对于互联网流量低的旅游公司,如目的地营销组织,新设想的搜索可能是棺材上的钉子,除非他们重新思考如何运营。
结论:
OpenAI在创建可以充当导游的虚拟个人助理方面走得最远。
谷歌在创建与预订选项集成的有用的旅行规划工具方面走得最远。
Meta的眼镜提供了一个有趣的数字导游选项,但它们是眼镜的事实限制了用户可以用它们做什么。由于通过Whatsapp和其他应用程序的Meta AI还不能看照片,聊天机器人在成为全方位有用的助手方面是最落后的。
(机器翻译,轻度译后编辑,仅供参考)
编辑:刘慧