机器学习入门iris数据加载

调用sklearn模块里的datasets

from sklearn import datasets
iris=datasets.load_iris()

把iris的参数数据赋值给x

把iris的结果数据值赋值给y

x=iris.data
y=iris.target

验证下x,y的数据类型

print(x[0])
[5.1 3.5 1.4 0.2]
print(type(x))
print(type(y))
<class 'numpy.ndarray'>
<class 'numpy.ndarray'>

为多维数组numpy.ndarray。

可以通过target_names来查看iris的物种名称

print(iris.target_names)
print(type(iris.target_names))
['setosa' 'versicolor' 'virginica']
<class 'numpy.ndarray'>

数据类型为数组。

通过feature_names来查看具体数据的参数名称

print(iris.feature_names)
print(type(iris.feature_names))
['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
<class 'list'>

数据类型为list。

查看数组数据的维度是通过调用shape实现

print(iris.data.shape)
(150, 4)

可以看出是150行,4列

print(iris.target.shape)
(150,)
print(iris.target_names.shape)
(3,)
print(iris.feature_names.shape)
---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
/var/folders/bh/f6wjknsj69xdm6frzffrl0000000gn/T/ipykernel_840/597494878.py in <module>
----> 1 print(iris.feature_names.shape)

AttributeError: 'list' object has no attribute 'shape'

报了属性错误,说明feature_names数据是列表,不是数组


版权声明:本文为dfly_zx原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。