Vector Database
Embeddings用数值形式的向量,在高维空间表示数据(通常是文本等非结构化的数据)。传统的关系型数据库并不适合存储和搜索这些向量表示。
向量存储库能够使用相似度算法对相似向量进行索引和快速搜索,使得应用程序能够在给定目标向量的情况下找到相关向量。
例如,在个性化聊天机器人的案例中,用户会向生成式人工智能模型输入一个提示词。该模型运用相似性搜索算法,在一系列文档中搜索相似文本。随后,所得信息会被用于生成极具个性化且准确的回应。这种信息检索是通过向量存储中的嵌入和向量索引实现的。