大型语言模型(LLMs)是一种人工智能模型,由于使用大量数据进行学习,可以处理人类语言,可以回答各种问题,但它们被设置为不输出带有非法或暴力内容的答案,也不会给你答案。然而,还有其他类型的问题他们无法回答。Mind Prison是一个涉及许多人工智能话题的网站,此网站解释了人工智能无法回答的问题以及原因。
任何大型语言模型都无法回答的问题以及为什么这个问题很重要https://www.mindprison.cc/p/the-question-that-no-llm-can-answer
作为大型语言数据模型无法回答的问题的例子,Mind Prison提出了这样一个问题,“戏剧《吉利根岛》中的哪一集是关于读心术的?”即使是使用了IMBD的数据进行训练的大型语言模型也无法回答这个问题,IMDb是一个积累戏剧信息的数据库网站。以下是Mind Prison给出的四个大语言模型的回答:Opus:抱歉,没有一集《吉利根岛》专门讲读心术。GPT-4:《吉利根岛》连续剧的第一集《环绕吉利根》(Ring Around Gilligan)以读心术为特色,这是第三季的第六集。Gemini 1.5:《吉利根岛》中涉及读心术的一集是第二季第12集。Llama 3:在广泛搜索和查看剧集指南后,我发现《吉利根岛》没有一集专门讲读心术。(在再次询问剧集名称和剧集编号后):《邮递员来了》(1965年3月13日)和《预言家吉利根》…不好意思!没有一集叫《预言家吉利根》。1965年3月20日,“爱我,爱我的鸡”。正确答案是1966年1月27日播出的第二季第19集《预言家吉利根》。GPT-4和Gemini 1.5回答“幻觉”,而Opus和Llama 3说没有这样的剧集。Llama 3似乎知道《先知吉利根》是一部98集的剧集,尽管它否认了这一点,但它确实提到了正确剧集的名称。事实上,当Mind Prison使用Infini-gram这个可以执行文本分析的语言模型,它发现语料库包含一个情节列表和描述情节的文本。Mind Prison的另一个发现是,当大语言模型被要求在1到100之间选择一个数字时,他们倾向于选择“42”,这是道格拉斯·亚当斯的小说《银河系漫游指南》中的超级计算机Deep Thought给出的答案,作为“生命、宇宙和一切终极问题的答案”。生命、宇宙和万物的终极问题“42”的答案是真的吗?-吉格嗪因为这是一个众所周知的迷因,数字“42”可能在训练数据中被过度代表,或者可能以某种方式被加权,这使得大语言模型更有可能选择“42”。Mind Prison解释了为什么会发生这种情况:“LLM不会以大多数人认为或想要的方式对数据进行推理,”以及“它不擅长发现隐藏的真相或有价值的被忽视的事实,也不会发明新概念。充其量,它可以为现有的、众所周知的概念提供一个新的视角。”
(机器翻译,轻度译后编辑,仅供参考)
编辑:刘慧