生信人

找回密码
立即注册
搜索
热搜: 活动 交友 discuz
发新帖

0

收听

12

听众

318

主题
发表于 2024-3-14 21:54:31 | 查看: 1118| 回复: 1

背景

动手学深度学习pytorch:2.2.2处理缺失值报错

inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
inputs = inputs.fillna(inputs.mean())
print(inputs)

报错如下

TypeError: can only concatenate str (not "int") to str

解决方案

我们看出报错是因为第二列数据是字符串不是数字,修改代码即可。

inputs, outputs = data.iloc[:, 0:2], data.iloc[:, 2]
inputs = inputs.fillna(inputs.select_dtypes(include='number').mean())
print(inputs)

成功输出

   NumRooms Alley
0       3.0  Pave
1       2.0   NaN
2       4.0   NaN
3       3.0   NaN

收藏回复 显示全部楼层 道具 举报

发表于 2024-3-14 22:11:42

接着报错

inputs = pd.get_dummies(inputs, dummy_na=True)
print(inputs)

输出

   NumRooms  Alley_Pave  Alley_nan
0       3.0        True      False
1       2.0       False       True
2       4.0       False       True
3       3.0       False       True

并不是教程中的0和1,而是布尔值。 这会引起后续转成张量的报错

TypeError: can't convert np.ndarray of type numpy.object_. The only supported types are: float64, float32, float16, complex64, complex128, int64, int32, int16, int8, uint8, and bool.

原因

get_dummies函数在pandas1.6.0版本之前返回numpy.uint8,无符号八位整数。

在1.6.0版本开始更改为返回numpy.bool_,numpy布尔值。

解决方案

添加dtype,完成输出0和1,且后续不报错

inputs = pd.get_dummies(inputs, dummy_na=True, dtype = 'uint8')
print(inputs)

回复 显示全部楼层 道具 举报

您需要登录后才可以回帖 登录 | 立即注册

QQ|Archiver|手机版|小黑屋|生信人 ( 萌ICP备20244422号 )

GMT+8, 2024-11-21 20:47 , Processed in 0.084404 second(s), 31 queries .

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表