大型语言模型不能回答哪些问题？

大型语言模型（LLMs）是一种人工智能模型，由于使用大量数据进行学习，可以处理人类语言，可以回答各种问题，但它们被设置为不输出带有非法或暴力内容的答案，也不会给你答案。然而，还有其他类型的问题他们无法回答。Mind Prison是一个涉及许多人工智能话题的网站，此网站解释了人工智能无法回答的问题以及原因。

任何大型语言模型都无法回答的问题以及为什么这个问题很重要https://www.mindprison.cc/p/the-question-that-no-llm-can-answer

作为大型语言数据模型无法回答的问题的例子，Mind Prison提出了这样一个问题，“戏剧《吉利根岛》中的哪一集是关于读心术的？”即使是使用了IMBD的数据进行训练的大型语言模型也无法回答这个问题，IMDb是一个积累戏剧信息的数据库网站。以下是Mind Prison给出的四个大语言模型的回答：Opus：抱歉，没有一集《吉利根岛》专门讲读心术。GPT-4：《吉利根岛》连续剧的第一集《环绕吉利根》（Ring Around Gilligan）以读心术为特色，这是第三季的第六集。Gemini 1.5：《吉利根岛》中涉及读心术的一集是第二季第12集。Llama 3：在广泛搜索和查看剧集指南后，我发现《吉利根岛》没有一集专门讲读心术。（在再次询问剧集名称和剧集编号后）：《邮递员来了》（1965年3月13日）和《预言家吉利根》…不好意思！没有一集叫《预言家吉利根》。1965年3月20日，“爱我，爱我的鸡”。正确答案是1966年1月27日播出的第二季第19集《预言家吉利根》。GPT-4和Gemini 1.5回答“幻觉”，而Opus和Llama 3说没有这样的剧集。Llama 3似乎知道《先知吉利根》是一部98集的剧集，尽管它否认了这一点，但它确实提到了正确剧集的名称。事实上，当Mind Prison使用Infini-gram这个可以执行文本分析的语言模型，它发现语料库包含一个情节列表和描述情节的文本。Mind Prison的另一个发现是，当大语言模型被要求在1到100之间选择一个数字时，他们倾向于选择“42”，这是道格拉斯·亚当斯的小说《银河系漫游指南》中的超级计算机Deep Thought给出的答案，作为“生命、宇宙和一切终极问题的答案”。生命、宇宙和万物的终极问题“42”的答案是真的吗？-吉格嗪因为这是一个众所周知的迷因，数字“42”可能在训练数据中被过度代表，或者可能以某种方式被加权，这使得大语言模型更有可能选择“42”。Mind Prison解释了为什么会发生这种情况：“LLM不会以大多数人认为或想要的方式对数据进行推理，”以及“它不擅长发现隐藏的真相或有价值的被忽视的事实，也不会发明新概念。充其量，它可以为现有的、众所周知的概念提供一个新的视角。”

（机器翻译，轻度译后编辑，仅供参考）

编辑：刘慧

原文链接

Was it helpful ?

还有问题？我们能帮忙吗？