解决PostgreSQL数据迁移时数据丢失问题：.env配置排查与数据库连接管理

聖光之護

发布时间：2025-08-23 20:16:01

659人浏览过

来源于php中文网

原创

解决postgresql数据迁移时数据丢失问题：.env配置排查与数据库连接管理

本文旨在帮助开发者解决在使用Python和psycopg3进行PostgreSQL数据库迁移时遇到的数据丢失问题。通过分析代码结构和问题描述，重点排查了.env配置文件和数据库连接管理，并提供详细的检查步骤和潜在解决方案，确保数据迁移的稳定性和可靠性。

在进行数据库迁移时，数据丢失是一个严重的问题。根据您提供的信息，当您在新的数据库 "zno_db_norm" 中创建表时，原始数据库 "zno_db" 中的数据会被删除。这通常不是预期行为，并且可能由多种原因引起。最常见的原因之一是配置错误，导致您的代码意外地对错误的数据库执行了删除操作。

诊断与排查

根据您提供的代码，问题很可能出在数据库连接配置上。以下是一些需要仔细检查的关键点：

1. 检查 .env 配置文件

这是最可能导致问题的地方。请务必仔细检查以下两个 .env 文件：

config/zno.env: 用于连接原始数据库 "zno_db"。
config/zno_norm.env: 用于连接新的数据库 "zno_db_norm"。

确认这两个文件中的以下变量是否正确且指向不同的数据库：

DB_USERNAME: 数据库用户名
DB_PASSWORD: 数据库密码
DB_DATABASE: 数据库名称 - 确保 zno.env 指向 "zno_db"，zno_norm.env 指向 "zno_db_norm"。
DB_HOST: 数据库主机地址
DB_PORT: 数据库端口

特别注意： 即使文件名不同，也要确保 DB_DATABASE 变量的值确实指向不同的数据库。这是最容易出错的地方。

2. connect.py 中的连接逻辑

您的 connect.py 文件中的 get_conn 函数负责建立数据库连接。请确保该函数能够正确地从 .env 文件中读取配置，并且连接参数被正确传递给 psycopg.connect 函数。

import psycopg
import time
from dotenv import load_dotenv
import os


def get_conn(envpath="config/zno.env"):
    load_dotenv(envpath)

    username = os.getenv("DB_USERNAME")
    password = os.getenv("DB_PASSWORD")
    database = os.getenv("DB_DATABASE")
    host = os.getenv("DB_HOST")
    port = os.getenv("DB_PORT")

    try:
        conn = psycopg.connect(user=username, password=password, dbname=database, host=host, port=port)
        return conn
    except Exception as e:  # 捕获更广泛的异常
        print(f"连接失败: {e}")  # 打印异常信息
        print("Reconnecting...")
        time.sleep(5)
        return get_conn() # 递归调用，确保最终返回连接

改进建议：

在 try...except 块中捕获更广泛的异常 Exception，并打印异常信息，以便更好地诊断连接问题。
确保 get_conn() 函数在连接失败时最终返回一个连接对象，避免程序无限循环。

3. table.py 中的 SQL 执行

table.py 文件中的 table 函数负责读取 SQL 文件并执行。请确保传递给 get_conn 函数的 envpath 参数是正确的，以便连接到正确的数据库。

Cutout.Pro抠图

AI批量抠图去背景

下载

from connect import get_conn

def table(filepath, envpath, message):
    try:
        conn = get_conn(envpath)
        cur = conn.cursor()
        print(filepath, envpath)
        #cur.execute()
        with open(filepath, "r") as sql_file:
            sql_code = sql_file.read()
            cur.execute(sql_code)


        conn.commit()
        cur.close()
        conn.close()
        print(message)
    except Exception as e: # 捕获更广泛的异常
        print(f"执行SQL失败: {e}")  # 打印异常信息
        table(filepath, envpath, message)

改进建议：

在 try...except 块中捕获更广泛的异常 Exception，并打印异常信息，以便更好地诊断 SQL 执行问题。

4. main.py 中的调用顺序和参数

在 main.py 文件中，您按照特定的顺序调用 table 函数。请确保每次调用都传递了正确的 envpath 参数，以便连接到正确的数据库。

from table import table
from insert import insert_data, migrate_data
from result import get_result



if __name__ == "__main__":
    table("sql/1_CREATE_TABLE.sql", "config/zno.env", "Create table zno\n")
    insert_data()
    get_result()

    table("sql/2_NORMAL_TABLE.sql", "config/zno.env", "Norming tables\n")
    table("sql/3_MIGRATION.sql", "config/zno.env", "Migrations\n")
    table("sql/2_NORMAL_TABLE.sql", "config/zno_norm.env", "Creating second bd\n")

重点： 请特别注意最后一行 table("sql/2_NORMAL_TABLE.sql", "config/zno_norm.env", "Creating second bd\n")，确保它确实使用了 zno_norm.env 文件。

5. SQL 脚本中的 DROP TABLE 语句

2_NORMAL_TABLE.sql 脚本中包含 DROP TABLE IF EXISTS 语句。这可能是导致数据丢失的原因之一，特别是如果连接到了错误的数据库。

DROP TABLE IF EXISTS educate_organisation, participants, loc, test, participants_eo;

CREATE TABLE loc (
    locid SERIAL PRIMARY KEY,
    locname varchar,
    locregname varchar,
    locareaname varchar,
    loctername varchar,
    UNIQUE(locname, locregname, loctername)
);

-- ... 其他 CREATE TABLE 语句 ...

重要： 确保此脚本仅在目标数据库 "zno_db_norm" 中执行，并且在执行之前已经正确连接到该数据库。

解决方案

仔细检查 .env 文件： 这是最重要的一步。确保 zno.env 和 zno_norm.env 文件中的 DB_DATABASE 变量指向不同的数据库。
添加日志记录： 在 connect.py 和 table.py 文件中添加日志记录，以便跟踪连接和 SQL 执行过程。例如，在 get_conn 函数中打印连接参数，在 table 函数中打印 SQL 代码。
逐步执行代码： 使用调试器逐步执行 main.py 文件，观察每次 table 函数调用时连接到的数据库。
备份数据： 在执行任何可能导致数据丢失的操作之前，务必备份您的数据。
避免在生产环境中使用 DROP TABLE： 在生产环境中，应尽量避免使用 DROP TABLE 语句。如果需要清理表，可以考虑使用 TRUNCATE TABLE 语句，该语句会删除表中的所有数据，但保留表结构。

总结

数据库迁移是一个复杂的过程，需要仔细的规划和执行。通过仔细检查配置文件、连接逻辑和 SQL 脚本，您可以避免数据丢失和其他潜在问题。在进行任何更改之前，务必备份您的数据，并使用调试器逐步执行代码，以便更好地了解代码的行为。希望本文能够帮助您解决问题，并成功完成数据库迁移。

Python 字符串与字节串的区别与转换

如何批量重命名多级子目录中的PDF文件（以父文件夹名为前缀）

Python pytest 在真实项目中的应用

如何安全地在异步 Python 中并发写入多个文件（避免数据损坏）

Python 多进程并发模型解析

相关专题

数据分析工具有哪些

数据分析工具有Excel、SQL、Python、R、Tableau、Power BI、SAS、SPSS和MATLAB等。详细介绍：1、Excel，具有强大的计算和数据处理功能；2、SQL，可以进行数据查询、过滤、排序、聚合等操作；3、Python，拥有丰富的数据分析库；4、R，拥有丰富的统计分析库和图形库；5、Tableau，提供了直观易用的用户界面等等。

751

2023.10.12