什么是向量搜索?
开发人员正涌向向量搜索,以使他们的应用程序更适应他们的用户。向量搜索中的搜索意味着,向量搜索通过使用向量这一工具用于查找和比较对象.简单地说,它帮助你找到对象之间的相似点,允许您在数据中找到复杂的、上下文感知的关系。这是一项支持下一代搜索相关应用的技术。
向量搜索是一项现代数据平台中的人工智能赋能的搜索功能,例如向量数据库,帮助用户构建更灵活的应用程序。你不再局限于基本的关键字搜索;相反,您可以在各种类型的数字媒体中找到语义相似的信息。
它的核心系统是机器学习系统中的一个,由许多大小和复杂程度不尽相同的大型语言模型赋能。这些都可以通过数据库和传统平台获得,甚至可以在移动设备上运行的。
了解有关向量搜索、相关术语以及它如何应用于人工智能现代数据库技术创新的更多信息,请继续读。
向量是什么意思?
向量是数据结构它包含一个数字数组。在我们的例子中,这指的是存储它们所代表的数据集的数字表达的向量。它可以被认为是指纹或摘要,但正式名称为嵌入(embedding).下面是一个简单的例子:
|
|
向量搜索的好处
向量搜索为数据库和使用它们的应用程序提供了一系列新功能。简而言之,向量搜索帮助用户在一个大的信息集合(又名语料库)中找到更多上下文适配的匹配。接近度(closeness)很重要——向量搜索从统计角度将对象分组在一起,以显示它们的相似程度或相关性。这不仅仅适用于文本,尽管我们的许多例子都是基于文本的,以便与传统的搜索系统进行比较。
获得广博的常识
向量搜索也是将人工智能工具引入应用程序的一种很好的方式,提供了仅用传统搜索工具无法实现的自适应灵活性。由于大量可用的公共LLM,任何公司都可以采用一个,并将其作为其应用程序中搜索的基础。因为LLMs存储了大量信息,所以搜索它们的结果可以为您的应用程序增加指数级的价值,而不必编写任何复杂的代码。这是许多应用程序更新新的强大功能的一种方式。
超能力搜索与传统搜索
幸运的是,在更复杂的场景中,向量搜索也是一种更快的搜索方法。传统的基于关键字的搜索系统可以进行优化,以便在文档中找到匹配的文本,但是一旦您需要应用复杂的模糊匹配算法或极端的布尔谓词变通方法(例如,许多WHERE子句),它就会变得更慢、更复杂。
向量搜索可以避免在复杂环境中成功搜索所需的各种权衡。然而,为了实现这一点你将需要一个具有足够资源的服务级API(例如OpenAI)来帮助您将应用程序连接到LLM。根据向量搜索系统背后的LLM,你也有所选择和受到相应的限制。
(机器翻译,轻度译后编辑,仅供参考)
编辑:胡跃