使用 Amazon RDS for SQL Server 作为向量数据存储的生成性 AI 用例

关键要点

生成性人工智能AI正在变革客户服务和解决方案，它依赖于深度学习和基础模型来提供特定和相关的AI解决方案。检索增强生成RAG技术通过提供上下文来增强生成能力。本文中展示了如何使用 Amazon RDS for SQL Server 作为向量数据存储，支持相似性搜索的生成性 AI 用例。

在生成性人工智能AI的快速发展中，利用用户查询生成相关响应正变得愈发重要。通过将生成性能力集成到面向客户的服务和解决方案中，企业可以获得更好的用户体验。本文将介绍如何使用 Amazon RDS for SQL Server 作为向量数据存储，以实现一个涉及相似性搜索的生成性 AI 用例。

生成性 AI 的当前技术基于机器学习和深度学习模型，而基础模型的使用使这种转变成为可能。尽管这些通用模型功能强大，但单靠它们无法产生特定的AI解决方案。因此，需要额外的领域上下文来生成更有用的响应。检索增强生成RAG是一种常用技术，核心在于向量嵌入，它将非结构化数据转化为多维数值表示。本文将展示如何利用 Amazon RDS for SQL Server 支持 RAG 的生成性 AI 用例。

解决方案架构概述

本文中实现的 RAG 工作流涉及以下 AWS 服务： Amazon RDS for SQL Server Amazon SageMaker Amazon Bedrock，特别是 Amazon Titan G1 文本嵌入模型

工作流程如下：

用户的问题提示通过 Amazon Titan 模型转换为向量嵌入，通过在 SageMaker 笔记本中调用 Amazon Bedrock API 实现。该新向量作为输入传递给向量数据存储中的余弦相似度函数。该函数对存储在数据库中的向量嵌入进行相似性搜索，并将结果返回至 SageMaker。

前提条件

为了实现示例，您需要在 AWS 账户中启用以下资源和服务： Amazon RDS for SQL Server 实例向量数据存储 Amazon SageMaker 示例笔记本 Amazon Bedrock Python 库申请访问特定基础模型以使用 Amazon Bedrock。

创建 Amazon RDS for SQL Server 向量数据存储

在 AWS 控制台中创建一个 RDS for SQL Server 实例并按照以下步骤进行配置，确保选择以下选项：引擎选项：选择 Microsoft SQL Server 引擎版本：选择 SQL Server 2019 150043455v1 版别：选择 SQL Server Standard Edition DB 实例类型：选择 dbt3xlarge 存储类型：选择 GP3 公共访问：选择是

一个使用 Amazon RDS for SQL Server 作为向量数据存储的生成 AI 用例数

通过此环境，您可以运行 SQL Server 数据库并操作向量数据。创建完成后，您应该能够浏览到名为 vectordbwiki 的数据库，其中包含多个表格以支持生成性 AI 的操作。

配置 SageMaker 笔记本

在上传示例 Amazon SageMaker 笔记本之前，需要设置一个 Amazon SageMaker 笔记本实例。在 AWS 控制台中导航至 SageMaker 服务，选择 Notebook 实例选项并点击创建笔记本实例。

设置完成后，您将进入 JupyterLab IDE，接着需要运行一些命令，以安装 SQL Server ODBC 驱动程序和其他必要的库。

运行相似性搜索

在运行相似性搜索用例之前，需要启动 IAM 角色以作为所有 API 调用的安全上下文。按照指示设置所需的 IAM 角色。接下来，引入所需库并配置 Amazon Bedrock 客户端，确保设置正确的账户号码和角色名称。

此后，您将执行 API 调用以将用户提示向量化，并利用余弦距离算法与向量数据存储进行连接，执行相似性搜索请求。

加速器安卓下载免费

清理

运行完此演示后，您可能不再需要这些 AWS 资源，请务必删除不再使用的 Amazon RDS for SQL Server 和 SageMaker Notebook 实例，以避免不必要的费用。

结论

检索增强生成RAG是一种强大的技术，通过结合领域特定的信息和基础模型，可以提升生成性 AI 应用中的响应有效性。本文展示了使用 Amazon RDS for SQL Server、SageMaker 和 Amazon Bedrock 实现的相似性搜索用例，并证明了 Amazon RDS for SQL Server 作为向量数据存储的有效性。我们建议客户在生产环境中部署解决方案之前进行全面的性能和规模测试，以确保相似性搜索响应时间符合预期。有关向量数据存储在生成性 AI 应用中的作用，请查看我们关于向量数据存储在生成性 AI 应用中的作用的概述。

作者介绍

Joshua Jin 是亚马逊网络服务AWS的一名数据库基准工程师，专注于评估数据库性能。

Camilo Leon 是AWS的一名首席解决方案架构师，专注于数据库，提供架构指导与技术支持，帮助客户设计、部署及管理 AWS 关系数据库工作负载。

Sudarshan Roy 是 AWS 全球数据库服务组织的高级数据库专家，擅长企业客户的大规模数据库迁移与现代化。

Barry Ooi 是 AWS 的高级数据库专家解决方案架构师，专注于使用云原生服务为客户设计与实施数据平台解决方案。