
第一段引用上面的摘要:本文旨在解决 AWS Lambda 函数中使用 Python requests.get() 方法时遇到的超时和连接重置问题。通过分析网络配置,特别是 Lambda 函数的 VPC 设置,解释了为何会出现这些问题,并提供了两种解决方案:配置 NAT 网关以允许 Lambda 函数访问互联网,或者将 Lambda 函数配置为不在 VPC 中运行。
当你在 AWS Lambda 函数中使用 Python 的 requests 库向外部服务(例如 https://linkedin.com)发起请求时,可能会遇到超时或连接重置错误,例如 ConnectionError: ('Connection aborted.', ConnectionResetError(104, 'Connection reset by peer'))。这些问题通常与 Lambda 函数的网络配置有关,尤其是当 Lambda 函数部署在 Virtual Private Cloud (VPC) 中时。
问题根源:VPC 和公网访问
当 Lambda 函数配置在 VPC 中时,默认情况下它不会自动获得公网 IP 地址。这意味着 Lambda 函数无法直接访问互联网上的服务。即使你的 Lambda 安全组允许所有出站流量,也无法解决根本问题。
你在同一子网中的另一台机器上使用 curl 命令可以成功访问目标网站,是因为该机器很可能具有公网 IP 地址,可以直接与互联网通信。而 Lambda 函数在 VPC 中则不具备此能力。
立即学习“Python免费学习笔记(深入)”;
解决方案一:配置 NAT 网关
要允许 VPC 中的 Lambda 函数访问互联网,你需要配置一个 NAT(网络地址转换)网关。NAT 网关允许私有子网中的实例(包括 Lambda 函数)连接到互联网,同时阻止互联网发起与这些实例的连接。
步骤如下:
- 创建 NAT 网关: 在你的 VPC 中创建一个 NAT 网关。你需要选择一个公有子网来放置 NAT 网关,并为其分配一个弹性 IP 地址。
- 配置路由表: 为你的私有子网配置路由表,将所有目标地址为 0.0.0.0/0 的流量路由到你刚刚创建的 NAT 网关。
- 配置 Lambda 函数: 确保你的 Lambda 函数配置为仅在这些私有子网中运行。
注意事项:
- NAT 网关会产生费用,请根据你的实际需求进行配置。
- 确保你的 VPC 具有足够的可用 IP 地址来支持 NAT 网关和 Lambda 函数。
解决方案二:移除 VPC 配置
如果你的 Lambda 函数不需要访问 VPC 内部的任何资源,最简单的解决方案是将 Lambda 函数配置为不在 VPC 中运行。
步骤如下:
- 更新 Lambda 函数配置: 在 AWS Lambda 控制台中,找到你的 Lambda 函数,并编辑其 VPC 配置。
- 移除 VPC 配置: 将 VPC 配置设置为 "No VPC"。
注意事项:
- 移除 VPC 配置后,Lambda 函数将无法访问 VPC 内部的任何资源,例如数据库或内部 API。请确保你的 Lambda 函数不需要这些资源。
- 如果 Lambda 函数需要访问 AWS 服务,例如 S3 或 DynamoDB,它将通过公共互联网访问这些服务。
代码示例
以下是一个 Python 代码示例,展示了如何使用 requests 库发起 HTTP 请求,并设置超时时间:
import requests
def lambda_handler(event, context):
try:
response = requests.get("https://linkedin.com", timeout=10)
response.raise_for_status() # 检查 HTTP 状态码是否为 200 OK
print(response.status_code)
print(response.content)
return {
'statusCode': 200,
'body': 'Request successful!'
}
except requests.exceptions.RequestException as e:
print(f"Request failed: {e}")
return {
'statusCode': 500,
'body': f'Request failed: {e}'
}代码解释:
- requests.get("https://linkedin.com", timeout=10): 使用 requests.get() 方法向 https://linkedin.com 发起 GET 请求,并设置超时时间为 10 秒。如果请求在 10 秒内没有完成,将会抛出一个 Timeout 异常。
- response.raise_for_status(): 检查 HTTP 状态码是否为 200 OK。如果状态码不是 200,将会抛出一个 HTTPError 异常。
- requests.exceptions.RequestException: 捕获所有 requests 库可能抛出的异常,例如 Timeout, ConnectionError, HTTPError 等。
总结
在 AWS Lambda 函数中使用 requests 库发起 HTTP 请求时,需要特别注意网络配置。当 Lambda 函数部署在 VPC 中时,需要配置 NAT 网关才能访问互联网。如果 Lambda 函数不需要访问 VPC 内部的资源,可以将其配置为不在 VPC 中运行。通过合理配置网络,可以避免超时和连接重置等问题,确保 Lambda 函数的正常运行。










