使用 FastAPI 和机器学习构建实时信用卡欺诈检测系统

WBOY
发布: 2024-08-13 09:13:43
转载
585人浏览过

使用 fastapi 和机器学习构建实时信用卡欺诈检测系统

介绍

信用卡欺诈对金融业构成重大威胁,每年造成数十亿美元的损失。为了解决这个问题,人们开发了机器学习模型来实时检测和防止欺诈交易。在本文中,我们将逐步介绍使用 fastapi(python 的现代 web 框架)以及在 kaggle 流行的信用卡欺诈检测数据集上训练的随机森林分类器构建实时信用卡欺诈检测系统的过程。

项目概况

该项目的目标是创建一个 web 服务来预测信用卡交易欺诈的可能性。该服务接受交易数据,对其进行预处理,然后返回预测以及欺诈概率。该系统设计快速、可扩展且易于集成到现有的金融系统中。

关键部件

  1. 机器学习模型:经过训练以区分欺诈交易和合法交易的随机森林分类器。
  2. 数据预处理:交易特征标准化,确保模型达到最佳性能。
  3. api:使用 fastapi 构建的 restful api,用于实时处理预测请求。

第 1 步:准备数据集

本项目使用的数据集是来自 kaggle 的信用卡欺诈检测数据集,其中包含 284,807 笔交易,其中只有 492 笔是欺诈交易。这种类别不平衡带来了挑战,但可以通过对少数类别进行过采样来解决。

数据预处理

首先使用 scikit-learn 的 standardscaler 对这些功能进行标准化。然后将数据集分为训练集和测试集。鉴于不平衡,在训练模型之前应用 randomoversampler 技术来平衡类别。

from sklearn.preprocessing import standardscaler
from imblearn.over_sampling import randomoversampler

# standardize features
scaler = standardscaler()
x_scaled = scaler.fit_transform(x)

# balance the dataset
ros = randomoversampler(random_state=42)
x_resampled, y_resampled = ros.fit_resample(x_scaled, y)
登录后复制

第 2 步:训练机器学习模型

我们训练了一个随机森林分类器,它非常适合处理不平衡的数据集并提供可靠的预测。该模型在过采样数据上进行训练,并使用准确度、精确度、召回率和 auc-roc 曲线来评估其性能。

from sklearn.ensemble import randomforestclassifier
from sklearn.metrics import classification_report, roc_auc_score

# train the model
model = randomforestclassifier(n_estimators=100, random_state=42)
model.fit(x_resampled, y_resampled)

# evaluate the model
y_pred = model.predict(x_test_scaled)
print(classification_report(y_test, y_pred))
print("auc-roc:", roc_auc_score(y_test, model.predict_proba(x_test_scaled)[:, 1]))
登录后复制

第 3 步:构建 fastapi 应用程序

使用 joblib 保存训练好的模型和缩放器后,我们继续构建 fastapi 应用程序。选择 fastapi 是因为它的速度和易用性,使其成为实时应用程序的理想选择。

创建 api

fastapi 应用程序定义了一个 post 端点 /predict/,它接受交易数据、处理数据并返回模型的预测和概率。

Natural Language Playlist
Natural Language Playlist

探索语言和音乐之间丰富而复杂的关系,并使用 Transformer 语言模型构建播放列表。

Natural Language Playlist 67
查看详情 Natural Language Playlist
from fastapi import fastapi, httpexception
from pydantic import basemodel
import joblib
import pandas as pd

# load the trained model and scaler
model = joblib.load("random_forest_model.pkl")
scaler = joblib.load("scaler.pkl")

app = fastapi()

class transaction(basemodel):
    v1: float
    v2: float
    # include all other features used in your model
    amount: float

@app.post("/predict/")
def predict(transaction: transaction):
    try:
        data = pd.dataframe([transaction.dict()])
        scaled_data = scaler.transform(data)
        prediction = model.predict(scaled_data)
        prediction_proba = model.predict_proba(scaled_data)
        return {"fraud_prediction": int(prediction[0]), "probability": float(prediction_proba[0][1])}
    except exception as e:
        raise httpexception(status_code=400, detail=str(e))
登录后复制

第 4 步:部署应用程序

要在本地测试应用程序,您可以使用 uvicorn 运行 fastapi 服务器并向 /predict/ 端点发送 post 请求。该服务将处理传入的请求,扩展数据,并返回交易是否存在欺诈。

本地运行 api

uvicorn main:app --reload
登录后复制

然后您可以使用curl或postman等工具测试api:

curl -X POST http://127.0.0.1:8000/predict/ \
-H "Content-Type: application/json" \
-d '{"V1": -1.359807134, "V2": -0.072781173, ..., "Amount": 149.62}'
登录后复制

api 将返回一个 json 对象,其中包含欺诈预测和相关概率。

结论

在本文中,我们构建了一个实时信用卡欺诈检测系统,该系统将机器学习与现代 web 框架相结合。 github 链接在这里。该系统旨在处理实时交易数据并提供即时预测,使其成为金融机构打击欺诈的宝贵工具。

通过使用 fastapi 部署此模型,我们确保服务不仅快速而且可扩展,能够同时处理多个请求。该项目可以通过更复杂的模型、改进的特征工程或与生产环境的集成来进一步扩展。

下一步

要进一步增强系统,请考虑以下事项:

  1. 模型改进:尝试更高级的模型,如 xgboost 或神经网络。
  2. 特征工程:探索可能提高模型准确性的其他功能。
  3. 真实世界部署:将应用程序部署在 aws 或 gcp 等云平台上以供生产使用。

以上就是使用 FastAPI 和机器学习构建实时信用卡欺诈检测系统的详细内容,更多请关注php中文网其它相关文章!

360借条
360借条

3分钟审核,最快5分钟放款,极速到账,低服务费,年化综合息费率7.2%起。

下载
来源:dev.to网
本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系admin@php.cn
最新问题
开源免费商场系统广告
热门教程
更多>
最新下载
更多>
网站特效
网站源码
网站素材
前端模板
关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新 English
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送
PHP中文网APP
随时随地碎片化学习

Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号