0

0

利用稀疏GSI实现DynamoDB条件性索引

聖光之護

聖光之護

发布时间:2025-10-13 10:57:49

|

964人浏览过

|

来源于php中文网

原创

利用稀疏GSI实现DynamoDB条件性索引

dynamodb的全局二级索引(gsi)不支持直接的条件表达式投影。但可以通过创建稀疏gsi实现条件性索引,即仅当基础表项中存在gsi分区键属性时,该项才会被包含在索引中。通过应用层逻辑动态添加或移除此gsi键属性,可以有效地控制哪些记录进入或离开索引,从而实现基于特定字段值的条件性索引需求。

在构建DynamoDB应用时,我们经常需要对数据进行灵活的查询。全局二级索引(GSI)是实现这一目标的关键工具,它允许我们使用不同于主表的键属性进行查询。然而,有时我们希望GSI只包含满足特定条件的数据项,例如,只索引处于“中间状态”的记录。DynamoDB的GSI本身不提供基于表达式的条件投影功能,但我们可以利用其“稀疏索引”(Sparse Index)的特性来巧妙地实现这一目标。

理解稀疏GSI的工作原理

DynamoDB的GSI有一个核心行为:一个数据项只有在其GSI分区键属性(以及GSI排序键属性,如果定义了)存在于基础表项中时,才会被包含在GSI内。如果这些GSI键属性不存在,或者在更新操作中被移除,那么该数据项就不会出现在GSI中。这就是“稀疏索引”的本质——索引只包含基础表的一个子集。

通过利用这一特性,我们可以将条件逻辑从DynamoDB服务本身转移到应用程序层。应用程序负责根据业务规则,动态地在基础表项中添加或移除一个专门用于GSI的键属性。

实现条件性索引的步骤

假设我们有一个名为 Attachment 的基础表,其中包含 customerState 和 isIntermediateState 字段。customerState 可以是 Attaching、Detaching、Attached 或 Detached。isIntermediateState 字段在 customerState 为 Attaching 或 Detaching 时为 1,在 customerState 为 Attached 或 Detached 时为 0。我们的目标是创建一个GSI,只包含 isIntermediateState = 1 的记录。

  1. 定义GSI的专用键属性: 在基础表的数据模型中,引入一个专门用于GSI的属性。例如,我们可以命名为 intermediateStateGSI_PK。

  2. GSI配置: 创建一个新的全局二级索引,将其分区键设置为我们刚才定义的 intermediateStateGSI_PK。GSI的投影属性可以根据查询需求选择 KEYS_ONLY、INCLUDE 或 ALL。

  3. 应用程序逻辑管理GSI键属性: 在应用程序进行 PutItem 或 UpdateItem 操作时,根据 isIntermediateState 的值或 customerState 的具体状态,动态地管理 intermediateStateGSI_PK 属性。

    • 当满足条件时(例如 isIntermediateState = 1): 在数据项中添加 intermediateStateGSI_PK 属性,并赋予一个固定值(例如 'ACTIVE_INTERMEDIATE_STATE')。这个固定值将作为GSI的分区键,允许我们查询所有处于中间状态的附件。

      示例数据项(中间状态):

      {
        "PK": "ATTACHMENT#123",
        "SK": "METADATA",
        "customerState": "Attaching",
        "isIntermediateState": 1,
        "intermediateStateGSI_PK": "ACTIVE_INTERMEDIATE_STATE", // GSI键存在
        "otherAttribute": "value"
      }
    • 当不满足条件时(例如 isIntermediateState = 0): 确保数据项中不包含 intermediateStateGSI_PK 属性。如果之前存在,则通过 UpdateItem 操作将其移除。

      示例数据项(最终状态):

      MOKI
      MOKI

      MOKI是美图推出的一款AI短片创作工具,旨在通过AI技术自动生成分镜图并转为视频素材。

      下载
      {
        "PK": "ATTACHMENT#123",
        "SK": "METADATA",
        "customerState": "Attached",
        "isIntermediateState": 0,
        // intermediateStateGSI_PK 已被移除或从未添加
        "otherAttribute": "value"
      }

DynamoDB的索引更新机制

DynamoDB的GSI是异步且自动更新的。这意味着,当基础表中的数据项被创建、更新或删除时,DynamoDB会自动检测GSI键属性的变化,并相应地更新GSI。

  • 添加GSI键属性: 如果一个数据项之前没有 intermediateStateGSI_PK 属性,而现在被更新并添加了该属性,那么这个数据项就会被添加到GSI中。
  • 移除GSI键属性: 如果一个数据项之前有 intermediateStateGSI_PK 属性,而现在被更新并移除了该属性,那么这个数据项就会从GSI中移除。
  • 修改GSI键属性: 如果 intermediateStateGSI_PK 的值发生变化,GSI也会相应地更新。

因此,GSI会持续地反映基础表的最新状态,而不是只在初始添加记录时决定是否包含。

示例代码片段(概念性)

以下是使用AWS SDK(以JavaScript为例)进行 UpdateItem 操作以管理GSI键属性的概念性代码:

const AWS = require('aws-sdk');
const ddb = new AWS.DynamoDB.DocumentClient();

async function updateAttachmentState(attachmentId, newCustomerState) {
    let updateExpression = "SET #cs = :newCs, #is = :newIs";
    let expressionAttributeNames = {
        "#cs": "customerState",
        "#is": "isIntermediateState"
    };
    let expressionAttributeValues = {
        ":newCs": newCustomerState
    };

    let isIntermediateStateValue;
    let gsiKeyAction = null; // 'add' or 'remove'

    if (newCustomerState === 'Attaching' || newCustomerState === 'Detaching') {
        isIntermediateStateValue = 1;
        gsiKeyAction = 'add';
    } else if (newCustomerState === 'Attached' || newCustomerState === 'Detached') {
        isIntermediateStateValue = 0;
        gsiKeyAction = 'remove';
    } else {
        throw new Error("Invalid customer state.");
    }

    expressionAttributeValues[":newIs"] = isIntermediateStateValue;

    if (gsiKeyAction === 'add') {
        updateExpression += ", #gsiPk = :gsiPkVal";
        expressionAttributeNames["#gsiPk"] = "intermediateStateGSI_PK";
        expressionAttributeValues[":gsiPkVal"] = "ACTIVE_INTERMEDIATE_STATE";
    } else if (gsiKeyAction === 'remove') {
        updateExpression += " REMOVE #gsiPk";
        expressionAttributeNames["#gsiPk"] = "intermediateStateGSI_PK";
    }

    const params = {
        TableName: "Attachment",
        Key: {
            "PK": `ATTACHMENT#${attachmentId}`,
            "SK": "METADATA"
        },
        UpdateExpression: updateExpression,
        ExpressionAttributeNames: expressionAttributeNames,
        ExpressionAttributeValues: expressionAttributeValues,
        ReturnValues: "ALL_NEW"
    };

    try {
        const result = await ddb.update(params).promise();
        console.log("Update successful:", result.Attributes);
        return result.Attributes;
    } catch (error) {
        console.error("Error updating item:", error);
        throw error;
    }
}

// 示例调用
// updateAttachmentState("123", "Attaching"); // 会添加 GSI 键
// updateAttachmentState("123", "Attached");  // 会移除 GSI 键

注意事项

  • GSI键的命名: 为GSI专用键选择一个清晰、不易与业务属性混淆的名称。
  • 一致性: 确保所有写入操作(PutItem、UpdateItem)都遵循相同的逻辑来管理GSI键属性,以保证数据在GSI中的一致性。
  • 写入容量单位(WCU): 添加或移除GSI键属性会消耗额外的写入容量单位,因为这涉及到基础表和GSI的更新。在设计时应考虑其对成本和性能的影响。
  • 查询: 一旦GSI设置完毕,你可以通过查询 intermediateStateGSI_PK = 'ACTIVE_INTERMEDIATE_STATE' 来高效地检索所有处于中间状态的附件。

总结

尽管DynamoDB的全局二级索引不直接支持基于表达式的条件投影,但通过巧妙地利用稀疏索引的特性,我们可以通过应用程序层逻辑来模拟实现这一功能。核心思想是引入一个GSI专用键属性,并根据业务条件动态地在基础表项中添加或移除该属性。这种方法不仅灵活有效,而且能够充分利用DynamoDB的强大索引能力,为复杂查询需求提供解决方案。

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
Python 自然语言处理(NLP)基础与实战
Python 自然语言处理(NLP)基础与实战

本专题系统讲解 Python 在自然语言处理(NLP)领域的基础方法与实战应用,涵盖文本预处理(分词、去停用词)、词性标注、命名实体识别、关键词提取、情感分析,以及常用 NLP 库(NLTK、spaCy)的核心用法。通过真实文本案例,帮助学习者掌握 使用 Python 进行文本分析与语言数据处理的完整流程,适用于内容分析、舆情监测与智能文本应用场景。

9

2026.01.27

拼多多赚钱的5种方法 拼多多赚钱的5种方法
拼多多赚钱的5种方法 拼多多赚钱的5种方法

在拼多多上赚钱主要可以通过无货源模式一件代发、精细化运营特色店铺、参与官方高流量活动、利用拼团机制社交裂变,以及成为多多进宝推广员这5种方法实现。核心策略在于通过低成本、高效率的供应链管理与营销,利用平台社交电商红利实现盈利。

107

2026.01.26

edge浏览器怎样设置主页 edge浏览器自定义设置教程
edge浏览器怎样设置主页 edge浏览器自定义设置教程

在Edge浏览器中设置主页,请依次点击右上角“...”图标 > 设置 > 开始、主页和新建标签页。在“Microsoft Edge 启动时”选择“打开以下页面”,点击“添加新页面”并输入网址。若要使用主页按钮,需在“外观”设置中开启“显示主页按钮”并设定网址。

13

2026.01.26

苹果官方查询网站 苹果手机正品激活查询入口
苹果官方查询网站 苹果手机正品激活查询入口

苹果官方查询网站主要通过 checkcoverage.apple.com/cn/zh/ 进行,可用于查询序列号(SN)对应的保修状态、激活日期及技术支持服务。此外,查找丢失设备请使用 iCloud.com/find,购买信息与物流可访问 Apple (中国大陆) 订单状态页面。

121

2026.01.26

npd人格什么意思 npd人格有什么特征
npd人格什么意思 npd人格有什么特征

NPD(Narcissistic Personality Disorder)即自恋型人格障碍,是一种心理健康问题,特点是极度夸大自我重要性、需要过度赞美与关注,同时极度缺乏共情能力,背后常掩藏着低自尊和不安全感,影响人际关系、工作和生活,通常在青少年时期开始显现,需由专业人士诊断。

6

2026.01.26

windows安全中心怎么关闭 windows安全中心怎么执行操作
windows安全中心怎么关闭 windows安全中心怎么执行操作

关闭Windows安全中心(Windows Defender)可通过系统设置暂时关闭,或使用组策略/注册表永久关闭。最简单的方法是:进入设置 > 隐私和安全性 > Windows安全中心 > 病毒和威胁防护 > 管理设置,将实时保护等选项关闭。

6

2026.01.26

2026年春运抢票攻略大全 春运抢票攻略教你三招手【技巧】
2026年春运抢票攻略大全 春运抢票攻略教你三招手【技巧】

铁路12306提供起售时间查询、起售提醒、购票预填、候补购票及误购限时免费退票五项服务,并强调官方渠道唯一性与信息安全。

112

2026.01.26

个人所得税税率表2026 个人所得税率最新税率表
个人所得税税率表2026 个人所得税率最新税率表

以工资薪金所得为例,应纳税额 = 应纳税所得额 × 税率 - 速算扣除数。应纳税所得额 = 月度收入 - 5000 元 - 专项扣除 - 专项附加扣除 - 依法确定的其他扣除。假设某员工月工资 10000 元,专项扣除 1000 元,专项附加扣除 2000 元,当月应纳税所得额为 10000 - 5000 - 1000 - 2000 = 2000 元,对应税率为 3%,速算扣除数为 0,则当月应纳税额为 2000×3% = 60 元。

33

2026.01.26

oppo云服务官网登录入口 oppo云服务登录手机版
oppo云服务官网登录入口 oppo云服务登录手机版

oppo云服务https://cloud.oppo.com/可以在云端安全存储您的照片、视频、联系人、便签等重要数据。当您的手机数据意外丢失或者需要更换手机时,可以随时将这些存储在云端的数据快速恢复到手机中。

101

2026.01.26

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
React 教程
React 教程

共58课时 | 4.2万人学习

TypeScript 教程
TypeScript 教程

共19课时 | 2.5万人学习

Bootstrap 5教程
Bootstrap 5教程

共46课时 | 3万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号