本案例将使用随机森林算法针对天气温度数据进行建模,实现对天气最高温度进行预测。
我们需要对数据进行预处理,然后观察特征,完成建模并进行可视化展示和分析。
下面我们将按照代码顺序,逐步完成本案例:
1、数据读取
import pandas as pd
features = pd.read_csv('data/temps.csv')
features.head(5)
数据表中:
- year,moth,day,week:分别表示的具体的时间
- temp_2:前天的最高温度值
- temp_1:昨天的最高温度值
- average:在历史中,每年这一天的平均最高温度值
- actual:这就是我们的标签值了,当天的真实最高温度
- friend:这一列可能是凑热闹的,你的朋友猜测的可能值,咱们不管它就好了
查看数据量大小:
print('The shape of our features is:', features.shape)
结果显示
版权声明:本文为zy_dreamer原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。