0

0

【机器学习】数据预处理之将类别数据转换为数值

PHP中文网

PHP中文网

发布时间:2017-07-05 18:13:06

|

2786人浏览过

|

来源于php中文网

原创

在进行python数据分析的时候,首先要进行数据预处理。

有时候不得不处理一些非数值类别的数据,嗯, 今天要说的就是面对这些数据该如何处理。

目前了解到的大概有三种方法:

SERCMS游戏币交易系统
SERCMS游戏币交易系统

这套系统是之前为一个朋友开发的一套游戏币交易系统,开发语言asp+javascript 数据库是Access。现在提供免费下载给新人学习,请不要用于商业用处。大分类为:商品管理现金转虚拟币管理 虚拟币转现金管理 历史转换记录 ID搜索虚拟币管理用户管理前台用户管理 被停权的会员 后台管理员添加 后台用户员管理 数据表备份分类管理游戏名称管理 服务器名管理数据统计查询交易类型数据信息管理修改重要公告

下载

1,通过LabelEncoder来进行快速的转换;

2,通过mapping方式,将类别映射为数值。不过这种方法适用范围有限;

3,通过get_dummies方法来转换。

 1 import pandas as pd
 2 from io import StringIO
 3 
 4 csv_data = '''A,B,C,D
 5 1,2,3,4
 6 5,6,,8
 7 0,11,12,'''
 8 
 9 df = pd.read_csv(StringIO(csv_data))
10 print(df)
11 #统计为空的数目
12 print(df.isnull().sum())
13 print(df.values)
14 
15 #丢弃空的
16 print(df.dropna())
17 print('after', df)
18 from sklearn.preprocessing import Imputer
19 # axis=0 列   axis = 1 行
20 imr = Imputer(missing_values='NaN', strategy='mean', axis=0)
21 imr.fit(df) # fit  构建得到数据
22 imputed_data = imr.transform(df.values) #transform 将数据进行填充
23 print(imputed_data)
24 
25 df = pd.DataFrame([['green', 'M', 10.1, 'class1'],
26                    ['red', 'L', 13.5, 'class2'],
27                    ['blue', 'XL', 15.3, 'class1']])
28 df.columns =['color', 'size', 'price', 'classlabel']
29 print(df)
30 
31 size_mapping = {'XL':3, 'L':2, 'M':1}
32 df['size'] = df['size'].map(size_mapping)
33 print(df)
34 
35 ## 遍历Series
36 for idx, label in enumerate(df['classlabel']):
37     print(idx, label)
38 
39 #1, 利用LabelEncoder类快速编码,但此时对color并不适合,
40 #看起来,好像是有大小的
41 from sklearn.preprocessing import LabelEncoder
42 class_le = LabelEncoder()
43 color_le = LabelEncoder()
44 df['classlabel'] = class_le.fit_transform(df['classlabel'].values)
45 #df['color'] = color_le.fit_transform(df['color'].values)
46 print(df)
47 
48 #2, 映射字典将类标转换为整数
49 import numpy as np
50 class_mapping = {label: idx for idx, label in enumerate(np.unique(df['classlabel']))}
51 df['classlabel'] = df['classlabel'].map(class_mapping)
52 print('2,', df)
53 
54 
55 #3,处理1不适用的
56 #利用创建一个新的虚拟特征
57 from sklearn.preprocessing import OneHotEncoder
58 pf = pd.get_dummies(df[['color']])
59 df = pd.concat([df, pf], axis=1)
60 df.drop(['color'], axis=1, inplace=True)
61 print(df)

 

热门AI工具

更多
DeepSeek
DeepSeek

幻方量化公司旗下的开源大模型平台

豆包大模型
豆包大模型

字节跳动自主研发的一系列大型语言模型

通义千问
通义千问

阿里巴巴推出的全能AI助手

腾讯元宝
腾讯元宝

腾讯混元平台推出的AI助手

文心一言
文心一言

文心一言是百度开发的AI聊天机器人,通过对话可以生成各种形式的内容。

讯飞写作
讯飞写作

基于讯飞星火大模型的AI写作工具,可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

即梦AI
即梦AI

一站式AI创作平台,免费AI图片和视频生成。

ChatGPT
ChatGPT

最最强大的AI聊天机器人程序,ChatGPT不单是聊天机器人,还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

相关专题

更多
java入门学习合集
java入门学习合集

本专题整合了java入门学习指南、初学者项目实战、入门到精通等等内容,阅读专题下面的文章了解更多详细学习方法。

2

2026.01.29

java配置环境变量教程合集
java配置环境变量教程合集

本专题整合了java配置环境变量设置、步骤、安装jdk、避免冲突等等相关内容,阅读专题下面的文章了解更多详细操作。

2

2026.01.29

java成品学习网站推荐大全
java成品学习网站推荐大全

本专题整合了java成品网站、在线成品网站源码、源码入口等等相关内容,阅读专题下面的文章了解更多详细推荐内容。

0

2026.01.29

Java字符串处理使用教程合集
Java字符串处理使用教程合集

本专题整合了Java字符串截取、处理、使用、实战等等教程内容,阅读专题下面的文章了解详细操作教程。

0

2026.01.29

Java空对象相关教程合集
Java空对象相关教程合集

本专题整合了Java空对象相关教程,阅读专题下面的文章了解更多详细内容。

3

2026.01.29

clawdbot ai使用教程 保姆级clawdbot部署安装手册
clawdbot ai使用教程 保姆级clawdbot部署安装手册

Clawdbot是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

25

2026.01.29

clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址
clawdbot龙虾机器人官网入口 clawdbot ai官方网站地址

clawdbot龙虾机器人官网入口:https://clawd.bot/,clawdbot ai是一个“有灵魂”的AI助手,可以帮用户清空收件箱、发送电子邮件、管理日历、办理航班值机等等,并且可以接入用户常用的任何聊天APP,所有的操作均可通过WhatsApp、Telegram等平台完成,用户只需通过对话,就能操控设备自动执行各类任务。

16

2026.01.29

Golang 网络安全与加密实战
Golang 网络安全与加密实战

本专题系统讲解 Golang 在网络安全与加密技术中的应用,包括对称加密与非对称加密(AES、RSA)、哈希与数字签名、JWT身份认证、SSL/TLS 安全通信、常见网络攻击防范(如SQL注入、XSS、CSRF)及其防护措施。通过实战案例,帮助学习者掌握 如何使用 Go 语言保障网络通信的安全性,保护用户数据与隐私。

8

2026.01.29

俄罗斯Yandex引擎入口
俄罗斯Yandex引擎入口

2026年俄罗斯Yandex搜索引擎最新入口汇总,涵盖免登录、多语言支持、无广告视频播放及本地化服务等核心功能。阅读专题下面的文章了解更多详细内容。

622

2026.01.28

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
Django 教程
Django 教程

共28课时 | 3.6万人学习

SciPy 教程
SciPy 教程

共10课时 | 1.3万人学习

Sass 教程
Sass 教程

共14课时 | 0.8万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号