DBT模型依赖管理：通过选择器和标签实现灵活的模型运行与跳过策略

DDD

发布时间：2025-11-03 11:21:01

496人浏览过

来源于php中文网

原创

DBT模型依赖管理：通过选择器和标签实现灵活的模型运行与跳过策略

本文探讨了在data build tool (dbt) 中，当一个模型被禁用（`enabled: false`）但仍被其他模型引用时导致的错误。传统的禁用方法会从dag中移除模型，使引用失败。本教程将介绍如何利用dbt的选择器（selectors）和标签（tags）机制，实现更灵活的模型运行策略，允许在特定执行中跳过某些模型的构建，同时确保依赖模型能继续读取这些已存在的数据表，从而有效管理复杂的项目依赖。

理解DBT中禁用模型的挑战

在DBT项目中，我们经常需要控制哪些模型在特定运行时需要构建。一个常见的做法是在模型配置中使用 enabled: false 来禁用某个模型：

{{config(
        materialized='incremental',
        enabled=false
    )}}

SELECT * FROM ...

然而，这种方法有一个重要的副作用：当一个模型被设置为 enabled: false 时，DBT会将其完全从项目的有向无环图（DAG）中移除。这意味着，如果其他模型通过 {{ ref("MODEL_NAME") }} 引用了这个被禁用的模型，DBT将在解析依赖关系时抛出错误，因为它无法找到这个“不存在”的模型。

对于那些希望在某些运行中跳过模型构建，但在其他运行中又需要其下游依赖能够访问其已存在数据表的场景，enabled: false 显然不是一个理想的解决方案。它强制我们必须在“运行”或“完全禁用并破坏依赖”之间做出选择。

解决方案：利用DBT选择器和标签

DBT提供了一个强大且灵活的机制——选择器（selectors）和标签（tags），来精确控制哪些模型应该包含在特定的 dbt run 命令中。通过结合使用这两者，我们可以在不修改模型 enabled 状态的情况下，动态地决定哪些模型需要构建，同时允许未被构建的模型作为现有数据表被引用。

核心思路是：

给需要跳过的模型打上特定标签。
定义一个选择器，在运行DBT时排除带有该标签的模型。

步骤一：为模型添加标签

首先，在那些你希望能够选择性跳过构建的模型中，为其 config 块添加一个自定义标签。例如，我们可以使用 dont_run 标签：

-- models/my_project/some_long_running_model.sql
{{
  config({
    "materialized": 'incremental',
    "unique_key": 'some_unique_key',
    "tags": ["dont_run"], -- 添加自定义标签
  })
}}

SELECT
  column1,
  column2
FROM {{ source('my_source', 'raw_data') }}
WHERE some_condition;

这个标签本身不会影响模型的构建行为，它只是一个元数据标记。

雾象

WaytoAGI推出的AI动画生成引擎

下载

步骤二：定义选择器

在你的DBT项目根目录（与 dbt_project.yml 同级）下，创建一个名为 selectors.yml 的文件。在这个文件中，你可以定义一个或多个选择器，用于指定在 dbt run 命令中包含或排除哪些模型。

为了实现跳过带有 dont_run 标签的模型，我们可以定义一个选择器，它首先选择所有模型（fqn: "*"），然后明确排除带有 dont_run 标签的模型：

# selectors.yml
selectors:
  - name: my_project_with_tags_ignored # 选择器名称
    definition:
      # 联合操作：选择所有模型，然后排除带有"dont_run"标签的模型
      union:
        - method: fqn
          value: "*" # 选择所有模型
        - exclude:
            - method: tag
              value: dont_run # 排除带有"dont_run"标签的模型

解释：

name: 这是你将在 dbt run 命令中使用的选择器名称。
definition: 定义选择器的逻辑。
union: 允许你组合多个选择规则。
method: fqn 和 value: "*": 这是一个通配符，表示选择项目中的所有模型、种子、快照等。
exclude: 指定要从上述选择中排除的节点。
method: tag 和 value: dont_run: 表示排除所有带有 dont_run 标签的节点。

步骤三：使用选择器运行DBT

现在，当你想要执行整个项目，但跳过那些标记为 dont_run 的模型时，可以在命令行中使用你定义的选择器：

dbt run --selector my_project_with_tags_ignored

执行此命令后，DBT会：

解析整个项目的DAG，包括所有模型，无论它们是否有 dont_run 标签。
根据 my_project_with_tags_ignored 选择器的定义，从执行计划中移除所有带有 dont_run 标签的模型。
构建剩余的模型。
对于那些被排除但被其他模型引用的模型（例如 some_long_running_model），DBT会假定其对应的数据表已经存在于数据库中，并允许依赖模型正常读取这些表。

这种方法的优势

不破坏依赖关系： 与 enabled: false 不同，使用选择器和标签不会从DAG中移除模型定义，只是在特定运行中跳过其构建。因此，下游模型仍然可以成功地 ref() 这些模型。
灵活性： 你可以根据需要创建多个选择器，以应对不同的运行场景（例如，运行所有模型、只运行特定标签的模型、排除特定路径的模型等）。
清晰的项目结构： 模型的 config 块保持简洁，enabled 状态保持为 true，避免了复杂的Jinaj条件判断来切换 ref 和 source。
易于维护： 标签和选择器是DBT的内置功能，有良好的文档支持，比自定义的Jinaj宏更易于理解和维护。

注意事项与最佳实践

数据表必须存在： 当你使用选择器跳过某个模型的构建时，DBT会期望该模型对应的数据表已经存在于数据库中。如果数据表不存在，而依赖模型尝试 SELECT 它，则会遇到数据库级别的错误。因此，这种方法适用于那些已经构建过且数据相对稳定的模型。
完整运行： 当你需要更新所有模型（包括那些通常被跳过的模型）时，只需执行标准的 dbt run 命令（不带 --selector 参数），或者创建一个包含所有模型的选择器。
组合选择器： DBT的选择器功能非常强大，你可以根据模型名称、路径、标签等多种属性进行组合选择。详细用法请参考DBT官方文档：DBT Node Selection - YAML Selectors。
版本控制： selectors.yml 文件应纳入版本控制，以便团队成员共享和理解运行策略。

总结

通过巧妙地利用DBT的选择器和标签机制，我们可以优雅地解决禁用模型在被引用时导致的依赖错误。这种方法提供了一种灵活且非破坏性的方式来控制DBT项目的执行流程，使得在复杂的数据转换项目中，能够根据业务需求动态地跳过某些模型的构建，同时保持数据依赖的完整性。它避免了对 enabled 配置的误用，并提供了一个更健壮、可维护的解决方案。

Node.js版本升级后node-gyp构建错误及解决方案

Node.js 版本升级中 node-gyp 错误排查与 Yarn 解决方案

Node.js版本升级中Node-gyp错误解析与解决方案

Python 链表遍历详解：理解节点与链表的关系

解决macOS上NVM安装后nvm命令无效的问题

相关专题

c语言union的用法

c语言union的用法是一种特殊的数据类型，它允许在相同的内存位置存储不同的数据类型，union的使用可以帮助我们节省内存空间，并且可以方便地在不同的数据类型之间进行转换。使用union时需要注意对应的成员是有效的，并且只能同时访问一个成员。本专题为大家提供union相关的文章、下载、课程内容，供大家免费下载体验。

129

2023.09.27

数据库三范式

数据库三范式是一种设计规范，用于规范化关系型数据库中的数据结构，它通过消除冗余数据、提高数据库性能和数据一致性，提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

386

2023.06.29

如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构，作用包括：1、释放存储空间；2、确保数据的安全性；3、提高数据库的整体性能，加速查询和操作的执行速度。尽管删除数据库具有一些好处，但在执行任何删除操作之前，务必谨慎操作，并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构，无法回滚。

2111

2023.08.14

vb怎么连接数据库

在VB中，连接数据库通常使用ADO（ActiveX 数据对象）或 DAO（Data Access Objects）这两个技术来实现：1、引入ADO库；2、创建ADO连接对象；3、配置连接字符串；4、打开连接；5、执行SQL语句；6、处理查询结果；7、关闭连接即可。

357

2023.08.31

MySQL恢复数据库

MySQL恢复数据库的方法有使用物理备份恢复、使用逻辑备份恢复、使用二进制日志恢复和使用数据库复制进行恢复等。本专题为大家提供MySQL数据库相关的文章、下载、课程内容，供大家免费下载体验。

259

2023.09.05

vb中怎么连接access数据库

vb中连接access数据库的步骤包括引用必要的命名空间、创建连接字符串、创建连接对象、打开连接、执行SQL语句和关闭连接。本专题为大家提供连接access数据库相关的文章、下载、课程内容，供大家免费下载体验。

329

2023.10.09

数据库对象名无效怎么解决

数据库对象名无效解决办法：1、检查使用的对象名是否正确，确保没有拼写错误；2、检查数据库中是否已存在具有相同名称的对象，如果是，请更改对象名为一个不同的名称，然后重新创建；3、确保在连接数据库时使用了正确的用户名、密码和数据库名称；4、尝试重启数据库服务，然后再次尝试创建或使用对象；5、尝试更新驱动程序，然后再次尝试创建或使用对象。

420

2023.10.16

vb连接access数据库的方法

vb连接access数据库方法：1、使用ADO连接，首先导入System.Data.OleDb模块，然后定义一个连接字符串，接着创建一个OleDbConnection对象并使用Open() 方法打开连接；2、使用DAO连接，首先导入 Microsoft.Jet.OLEDB模块，然后定义一个连接字符串，接着创建一个JetConnection对象并使用Open()方法打开连接即可。

478

2023.10.16

C# ASP.NET Core微服务架构与API网关实践

本专题围绕 C# 在现代后端架构中的微服务实践展开，系统讲解基于 ASP.NET Core 构建可扩展服务体系的核心方法。内容涵盖服务拆分策略、RESTful API 设计、服务间通信、API 网关统一入口管理以及服务治理机制。通过真实项目案例，帮助开发者掌握构建高可用微服务系统的关键技术，提高系统的可扩展性与维护效率。

2026.03.11

热门下载

网站特效

网站源码

网站素材

前端模板