Kaggle下载criteo数据集

Kaggle下载Criteo数据集

1. 帐号准备

登陆Kaggle并注册帐号。
Account->API->Create New Token 生成配置文件 kaggle.json

2. Kaggle API安装

https://github.com/Kaggle/kaggle-api

$	pip install --upgrade kaggle

把第一步的 kaggle.json放到/root/.kaggle/下。

3. 下载数据

https://www.kaggle.com/c/criteo-display-ad-challenge/data
https://github.com/Kaggle/kaggle-api

$	kaggle competitions download -c criteo-display-ad-challenge

数据会下载到当前目录下。

原始数据(1TB)已失效,实验可用:https://labs.criteo.com/2014/02/download-dataset/


版权声明:本文为songbinxu原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。