这两天无聊 分析抖音带货主播的货盘数据,但是飞瓜的有数据有点离散,想着整合处理一下,所以这篇主要记录一下这个处理脚本啦

原始数据太丑了,没有我要的指标
#数据切箱
datetime='621-627/'
#datetime = ['524-530/','531-606/','607-613','614-620/']
data_all = []
b=0
#for i in datetime:
inputPath = 'D:/直播数据分析/'+datetime
for input_file in glob.glob(os.path.join(inputPath,'*.xls')):
#a=pd.read_excel(input_file)
a=input_file
a=a.replace('\\','/')
print(a)
df = pd.read_excel(a)
df.drop(['商品链接','讲解时长','上架时间','下架时间','商品品牌'],axis=1,inplace=True)
df.drop(df[df['转化率']=='--'].index,inplace=True)
df.drop(df[df['销量']=='--'].index,inplace=True)
df.drop(df[df['销售额']=='--'].index,inplace=True)
m=[]
for i in df.转化率 :
i=i.replace('%','')
# print(i)
m.append(i)
df['转化率']=m
df['转化率']=df['转化率'].astype('float64')/100
df['销量']=df['销量'].astype('int')
df['销量贡献']=df['销量']/df['销量'].sum()
df['销售额']=df['销售额'].astype('float32').apply(lambda x : round(x,2))
df['销额贡献']=df['销售额']/df['销售额'].sum()
df['商品访客数']=(df['销量'].astype('float')/df['转化率'].astype('float64'))
df['商品访客数']=df['商品访客数'].astype('int')
df['商品点击率'] = df['商品访客数']/df['商品访客数'].sum()
df['券后价']=df['券后价'].astype('float32').apply(lambda x : round(x,2))
df['销量']=df['销量'].astype('int')
df['转化率']=df['转化率'].apply(lambda x : round(x,2))
df['销量贡献']=df['销量贡献'].apply(lambda x : round(x,2))
df['销额贡献']=df['销额贡献'].apply(lambda x : round(x,2))
df['商品点击率'] =df['商品点击率'].apply(lambda x : round(x,2))
df=df[['商品名', '券后价', '销量', '销量贡献','销售额', '销额贡献','转化率', '商品访客数',
'商品点击率', '商品品类','关联小店']]
df1=df
df1['区间']=pd.cut(df1.券后价,[0,10,20,50,100,300,500,1000,np.inf],labels= ['0-10','10-20','20-50','50-100','100-300','300-500','500-1000','1000+'])
data = df1.groupby('区间').sum()
data['SKU数量'] = df1.groupby('区间').size()
data=data.drop('券后价',axis=1)
data['转化率']=data.销量/data.商品访客数
writer = pd.ExcelWriter('D:/汇总/0621-0627/'+a[23:-10]+'.xls')#0524-0530
df.to_excel(writer,'Sheet1',index=False)
data.to_excel(writer,'汇总')
writer.save()
# data.to_excel('D:/汇总/0531-0606/'+a[23:-10]+'.xls',sheet_name=a[33:-10]+'汇总')
清洗一下

几百个头部主播的带货产品数据就有啦。
当然只到这里手动也能拼接,不过这个脚本就是实现大规模的数据处理。
当然 还要做点有趣的事情
datetime= ['0614-0620/','0621-0627/']
#datetime = ['0524-0530/','0531-0606/','0607-0613','0614-0620/','0620-0627/']
data_all = []
for i in datetime:
inputPath = 'D:/汇总/'+i
for input_file in glob.glob(os.path.join(inputPath,'*.xls')):
#a=pd.read_excel(input_file)
a=input_file
a=a.replace('\\','/')
print(a)
df = pd.read_excel(a)
df['直播场名'] = a[16:-4]
data_all.append(df)

统计了150场单场销售1000w以上的直播间的带货数据。

分别获取销售额、销售量、访客数都排名前500的商品,有115个产品。目的是获取头部主播的带货品类。其实很容易发现6月最火的抖音带货品类是美妆和食品冲饮。

对每一个品类的聚合销量,销售、访客,然后给他们一个权重分数,得出上表。
最后去逐个分析top主播带货的产品品牌,价位,毛利以及是否可搭建类似供应链,不过我弄着玩的。诸君当笑话看看就好。
datetime='531-606/'
#datetime = ['524-530/','531-606/','607-613','614-620/']
data_all = []
b=0
#for i in datetime:
inputPath = 'D:/直播数据分析/'+datetime
for input_file in glob.glob(os.path.join(inputPath,'*.xls')):
#a=pd.read_excel(input_file)
a=input_file
a=a.replace('\\','/')
print(a)
df = pd.read_excel(a)
df.drop(['商品链接','讲解时长','上架时间','下架时间','商品品牌'],axis=1,inplace=True)
df.drop(df[df['转化率']=='--'].index,inplace=True)
df.drop(df[df['销量']=='--'].index,inplace=True)
df.drop(df[df['销售额']=='--'].index,inplace=True)
m=[]
for i in df.转化率 :
i=i.replace('%','')
# print(i)
m.append(i)
df['转化率']=m
df['转化率']=df['转化率'].astype('float64')/100
df['商品访客数']=(df['销量'].astype('float')/df['转化率'].astype('float64'))
df['商品访客数']=df['商品访客数'].astype('int')
df['券后价']=df['券后价'].astype('float32').apply(lambda x : round(x,2))
df['销量']=df['销量'].astype('int')
df['销售额']=df['销售额'].astype('float32').apply(lambda x : round(x,2))
df['转化率']=df['转化率'].apply(lambda x : round(x,2))
df['销量贡献']=df['销量']/df['销量'].sum()
df['销额贡献']=df['销售额']/df['销售额'].sum()
df['商品点击率'] = df['商品访客数']/df['商品访客数'].sum()
df['销量贡献']=df['销量贡献'].apply(lambda x : round(x,2))
df['销额贡献']=df['销额贡献'].apply(lambda x : round(x,2))
df['商品点击率'] =df['商品点击率'].apply(lambda x : round(x,2))
df=df[['商品名', '券后价', '销量', '销量贡献','销售额', '销额贡献','转化率', '商品访客数',
'商品点击率', '商品品类','关联小店']]
df.to_excel('D:/汇总/0531-0606/'+a[23:-10]+'.xls',index=False)
版权声明:本文为lisenby原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。