机器学习入门iris数据加载

调用sklearn模块里的datasets

from sklearn import datasets
iris=datasets.load_iris()

把iris的参数数据赋值给x

把iris的结果数据值赋值给y

x=iris.data
y=iris.target

验证下x,y的数据类型

print(x[0])
[5.1 3.5 1.4 0.2]
print(type(x))
print(type(y))
<class 'numpy.ndarray'>
<class 'numpy.ndarray'>

为多维数组numpy.ndarray。

可以通过target_names来查看iris的物种名称

print(iris.target_names)
print(type(iris.target_names))

['setosa' 'versicolor' 'virginica']
<class 'numpy.ndarray'>

数据类型为数组。

通过feature_names来查看具体数据的参数名称

print(iris.feature_names)
print(type(iris.feature_names))

['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
<class 'list'>

数据类型为list。

查看数组数据的维度是通过调用shape实现

print(iris.data.shape)

(150, 4)

可以看出是150行，4列

print(iris.target.shape)

(150,)

print(iris.target_names.shape)

(3,)

print(iris.feature_names.shape)

---------------------------------------------------------------------------
AttributeError                            Traceback (most recent call last)
/var/folders/bh/f6wjknsj69xdm6frzffrl0000000gn/T/ipykernel_840/597494878.py in <module>
----> 1 print(iris.feature_names.shape)

AttributeError: 'list' object has no attribute 'shape'

报了属性错误，说明feature_names数据是列表，不是数组

原文链接：https://blog.csdn.net/dfly_zx/article/details/124013573