TensorFlow中高效实现多项式回归：从深度网络到特征工程

花韻仙語

发布时间：2025-09-12 13:28:11

540人浏览过

来源于php中文网

原创

TensorFlow中高效实现多项式回归：从深度网络到特征工程

本文探讨了在TensorFlow中处理简单多项式回归问题时，如何避免过度复杂的深度神经网络模型。通过引入多项式特征工程，并结合一个简洁的线性模型，可以显著提高模型的训练效率和预测精度，从而有效解决诸如y=10x或y=x^3这类看似简单却容易被误用复杂模型的问题。

问题概述：深度网络在简单回归中的困境

在构建机器学习模型时，我们常常倾向于使用更深、更复杂的神经网络来解决问题。然而，对于某些特定类型的回归问题，例如简单的线性关系（y = ax + b）或多项式关系（y = ax^3 + bx^2 + cx + d），过度复杂的模型结构反而可能导致训练困难、收敛缓慢，甚至无法达到理想的预测精度。

例如，当尝试使用一个包含多个隐藏层和Dropout层的深度神经网络来拟合y=10x或y=x^3这样的简单函数时，模型可能会表现出极高的损失值（如2000到200000），即使尝试不同的激活函数（如ReLU或tanh）也无济于事。这通常是因为模型被赋予了学习过于复杂的特征映射任务，而这些任务对于底层数据关系来说是不必要的。原始模型示例如下：

import tensorflow as tf
from tensorflow.keras import layers, models

def PolynomialModel_Complex():
    inp = layers.Input((1))
    l = layers.Dense(16, activation='tanh')(inp)
    l = layers.Dense(8, activation='tanh')(l)
    l = layers.Dropout(.5)(l)
    l = layers.Dense(4, activation='tanh')(l)
    l = layers.Dropout(.5)(l)
    output = layers.Dense(1, activation='tanh')(l) # 注意这里的tanh激活函数
    return models.Model(inp, output)

# 假设要拟合 y = 10x
# model_complex = PolynomialModel_Complex()
# model_complex.compile(loss='mean_squared_error', optimizer='adam')
# x_data = tf.linspace(-10, 10, 1000)
# y_data = 10.0 * x_data
# model_complex.fit(x_data, y_data, epochs=100) # 可能会观察到高损失

上述模型的问题在于：

层数过多：对于简单关系，不需要多层非线性变换。
Dropout层：Dropout是为了防止过拟合，但在数据量不大且模型已经过于复杂时，反而可能阻碍模型学习基本模式。
输出层激活函数：tanh激活函数将输出限制在[-1, 1]之间，这对于需要预测任意实数值的回归问题来说是不合适的，除非目标值本身就在这个范围内。

核心概念：多项式特征工程

解决上述问题的关键在于理解多项式回归的本质：它实际上是线性回归的一种形式，只是作用于原始特征的多项式变换上。例如，对于函数y = ax^3 + bx^2 + cx + d，我们可以将其视为对特征向量[x^0, x^1, x^2, x^3]进行线性组合。这里的x^0即为常数项。

因此，与其让神经网络尝试从原始输入x中学习如何生成x^2或x^3这样的复杂特征，不如我们直接在输入阶段就将这些多项式特征计算好，然后提供给一个简单的线性模型。这样，模型只需学习这些多项式特征的线性组合权重即可。

构建高效的多项式回归模型

我们将通过手动创建多项式特征并结合一个极简的TensorFlow模型来演示这一方法。

1. 模型架构

对于一个degree次的多项式回归问题，我们需要的输入特征是[x^0, x^1, ..., x^degree]，即degree + 1个特征。模型本身只需要一个简单的全连接层（Dense层）来学习这些特征的线性组合，且输出层不应使用限制范围的激活函数（默认的线性激活即可）。

68爱写

专业高质量AI4.0论文写作平台，免费生成大纲，支持无线改稿

下载

import tensorflow as tf
from tensorflow.keras import layers, models, optimizers

def PolynomialModel(degree):
    """
    构建一个用于多项式回归的简单Keras模型。
    输入层大小为 degree + 1，对应 [x^0, x^1, ..., x^degree]
    输出层为单个神经元，使用线性激活。
    """
    inp = layers.Input((degree + 1)) # 输入大小为 degree + 1
    out = layers.Dense(1, activation='linear')(inp) # 线性激活是回归的默认选择
    return models.Model(inp, out, name=f"PolynomialRegressor_Degree{degree}")

这个模型非常简洁，只包含一个输入层和一个输出层。Dense(1, activation='linear')意味着它将执行一个线性回归操作：y_pred = w_0*x^0 + w_1*x^1 + ... + w_degree*x^degree + b。

2. 数据准备

假设我们要拟合函数y = x^3。这是一个三阶多项式。因此，我们的degree为3，输入特征需要包括x^0, x^1, x^2, x^3。

# 设定多项式次数
degree = 3

# 生成训练数据
x_data = tf.linspace(-20.0, 20.0, 1000) # 从-20到20生成1000个点
y_true = x_data**3 # 目标函数 y = x^3

# 构建多项式特征矩阵 X
# X 的每一行是一个样本的特征向量 [x^0, x^1, x^2, x^3]
X_features = tf.transpose(tf.convert_to_tensor([x_data**p for p in range(degree + 1)], dtype=tf.float32))

# 确保y_true也是float32
y_true = tf.cast(y_true, dtype=tf.float32)

print(f"X_features shape: {X_features.shape}") # 预期 (1000, 4)
print(f"y_true shape: {y_true.shape}")     # 预期 (1000,)

3. 模型训练与评估

现在，我们可以使用构建好的模型和准备好的数据进行训练。我们将使用均方误差（MSE）作为损失函数，并选择Adam优化器。

# 实例化模型
model = PolynomialModel(degree)

# 编译模型
model.compile(loss='mean_squared_error', optimizer=optimizers.Adam(learning_rate=0.1))

# 打印模型摘要，查看参数数量
model.summary()

# 训练模型
print("\n开始训练模型...")
history = model.fit(X_features, y_true, epochs=200, verbose=0) # verbose=0 减少输出

# 打印最终损失
print(f"最终训练损失: {history.history['loss'][-1]:.2e}")

# 进行预测
# 预测 x=4 时 y 的值，即 4^3 = 64
test_x_features = tf.constant([[4**0, 4**1, 4**2, 4**3]], dtype=tf.float32)
prediction_4 = model.predict(test_x_features)
print(f"\n预测 4^3 的结果: {prediction_4[0][0]:.2f} (实际值: 64)")

# 预测 x=3 时 y 的值，即 3^3 = 27
test_x_features_3 = tf.constant([[3**0, 3**1, 3**2, 3**3]], dtype=tf.float32)
prediction_3 = model.predict(test_x_features_3)
print(f"预测 3^3 的结果: {prediction_3[0][0]:.2f} (实际值: 27)")

训练输出示例： （实际训练过程中的损失值会快速下降）

Model: "PolynomialRegressor_Degree3"
_________________________________________________________________
 Layer (type)                Output Shape              Param #   
=================================================================
 input_1 (InputLayer)        [(None, 4)]               0         

 dense (Dense)               (None, 1)                 5         

=================================================================
Total params: 5 (20.00 Byte)
Trainable params: 5 (20.00 Byte)
Non-trainable params: 0 (0.00 Byte)
_________________________________________________________________

开始训练模型...
最终训练损失: 1.44e-11

预测 4^3 的结果: 64.00 (实际值: 64)
预测 3^3 的结果: 27.00 (实际值: 27)

从model.summary()可以看出，模型只有5个参数（4个权重对应x^0到x^3，1个偏置项），这与我们期望的线性模型完全吻合。训练损失迅速降至极低水平（1.44e-11），预测结果也与真实值高度一致，证明了这种方法的有效性。

关键考量与最佳实践

模型的简洁性：对于已知具有多项式关系的数据，一个简单的线性模型（即单层Dense层）结合预先计算的多项式特征，通常比复杂的深度网络更有效、训练更快、更易于解释。
特征工程的重要性：当数据底层关系清晰时，进行适当的特征工程（如本例中的多项式特征）可以大大简化模型的学习任务，提高效率。sklearn.preprocessing.PolynomialFeatures是另一个用于自动生成多项式特征的强大工具，在处理更复杂的特征组合时非常有用。
输出层激活函数：在进行一般回归任务时，输出层应使用linear激活函数（或不指定激活函数，Dense层默认即为线性），以允许模型预测任意范围的实数值。避免使用tanh、sigmoid等限制输出范围的激活函数，除非你的目标值确实被限制在特定区间内。
Dropout的适用性：Dropout是一种正则化技术，用于防止过拟合。但在模型本身就非常简单，且数据量适中、关系明确的情况下，Dropout通常是不必要的，甚至可能阻碍模型学习。
理解数据：在构建模型之前，深入理解数据的内在结构和潜在关系至关重要。这有助于选择合适的模型架构和特征工程策略。

总结

本文通过一个具体的TensorFlow示例，展示了在处理简单多项式回归问题时，如何通过多项式特征工程和简洁的线性模型来替代复杂的深度神经网络。这种方法不仅能够显著提升模型的训练效率和预测精度，还能使模型更具可解释性。核心思想是：当数据的底层关系可以通过简单的数学变换（如多项式展开）来表示时，直接提供这些变换后的特征给模型，比让模型自己去“发现”这些特征更为高效。在实践中，我们应始终从最简单的模型开始，并根据数据的复杂性逐步增加模型的复杂度。

Python dataclass 与类型提示的协同设计

如何在ROS2 Humble中正确运行Python节点

Python 包的查找路径是如何确定的？

如何判断一个路径是否在当前工作目录的子目录内

Python 如何让 dict.setdefault() 创建的默认值是真正独立的实例

相关专题

Python AI机器学习PyTorch教程_Python怎么用PyTorch和TensorFlow做机器学习

PyTorch 是一种用于构建深度学习模型的功能完备框架，是一种通常用于图像识别和语言处理等应用程序的机器学习。使用Python 编写，因此对于大多数机器学习开发者而言，学习和使用起来相对简单。 PyTorch 的独特之处在于，它完全支持GPU，并且使用反向模式自动微分技术，因此可以动态修改计算图形。

2025.12.22

Python 深度学习框架与TensorFlow入门

本专题深入讲解 Python 在深度学习与人工智能领域的应用，包括使用 TensorFlow 搭建神经网络模型、卷积神经网络（CNN）、循环神经网络（RNN）、数据预处理、模型优化与训练技巧。通过实战项目（如图像识别与文本生成），帮助学习者掌握如何使用 TensorFlow 开发高效的深度学习模型，并将其应用于实际的 AI 问题中。

2026.01.07

windows激活码分享 windows一键激活教程指南

Windows 10/11一键激活可以通过PowerShell脚本或KMS工具实现永久或长期激活。最推荐的简便方法是打开PowerShell（管理员），运行 irm https://get.activated.win | iex 脚本，按提示选择数字激活（选项1）。其他方法包括使用HEU KMS Activator工具进行智能激活。

2026.01.21

excel表格操作技巧大全表格制作excel教程

Excel表格操作的核心技巧在于熟练使用快捷键、数据处理函数及视图工具，如Ctrl+C/V（复制粘贴）、Alt+=（自动求和）、条件格式、数据验证及数据透视表。掌握这些可大幅提升数据分析与办公效率，实现快速录入、查找、筛选和汇总。

2026.01.21

毒蘑菇显卡测试网站入口毒蘑菇测试官网volumeshader_bm

毒蘑菇VOLUMESHADER_BM测试网站网址为https://toolwa.com/vsbm/，该平台基于WebGL技术通过渲染高复杂度三维分形图形评估设备图形处理能力，用户可通过拖动彩色物体观察画面流畅度判断GPU与CPU协同性能；测试兼容多种设备，但中低端手机易卡顿或崩溃，高端机型可能因发热降频影响表现，桌面端需启用独立显卡并使用支持WebGL的主流浏览器以确保准确结果

2026.01.21

github中文官网入口 github中文版官网网页进入

github中文官网入口https://docs.github.com/zh/get-started，GitHub 是一种基于云的平台，可在其中存储、共享并与他人一起编写代码。通过将代码存储在GitHub 上的“存储库”中，你可以： “展示或共享”你的工作。持续“跟踪和管理”对代码的更改。

2026.01.21

windows安全中心怎么关闭打开_windows安全中心操作指南

Windows安全中心可以通过系统设置轻松开关。暂时关闭：打开“设置” -> “隐私和安全性” -> “Windows安全中心” -> “病毒和威胁防护” -> “管理设置”，将“实时保护”关闭。打开：同样路径将开关开启即可。如需彻底关闭，需在组策略(gpedit.msc)或注册表中禁用Windows Defender。

2026.01.21

C++游戏开发Unreal Engine_C++怎么用Unreal Engine开发游戏

虚幻引擎（Unreal Engine, 简称UE）是由Epic Games开发的一款功能强大的工业级3D游戏引擎，以高品质实时渲染（如Nanite和Lumen）闻名。它基于C++语言，为开发者提供高效率的框架、强大的可视化脚本系统（蓝图）、以及针对PC、主机和移动端的完整开发工具，广泛用于游戏、电影制片等领域。

2026.01.21

Python GraphQL API 开发实战

本专题系统讲解 Python 在 GraphQL API 开发中的实际应用，涵盖 GraphQL 基础概念、Schema 设计、Query 与 Mutation 实现、权限控制、分页与性能优化，以及与现有 REST 服务和数据库的整合方式。通过完整示例，帮助学习者掌握使用 Python 构建高扩展性、前后端协作友好的 GraphQL 接口服务，适用于中大型应用与复杂数据查询场景。

2026.01.21

热门下载

网站特效

网站源码

网站素材

前端模板