抖音top主播的直播带货数据分析。

这两天无聊 分析抖音带货主播的货盘数据,但是飞瓜的有数据有点离散,想着整合处理一下,所以这篇主要记录一下这个处理脚本啦

在这里插入图片描述

原始数据太丑了,没有我要的指标

#数据切箱


datetime='621-627/'
#datetime = ['524-530/','531-606/','607-613','614-620/']
data_all = []
b=0
#for i in datetime:
inputPath = 'D:/直播数据分析/'+datetime
for input_file in glob.glob(os.path.join(inputPath,'*.xls')):
        #a=pd.read_excel(input_file)
    a=input_file
    a=a.replace('\\','/')
    print(a)
    df = pd.read_excel(a)
    df.drop(['商品链接','讲解时长','上架时间','下架时间','商品品牌'],axis=1,inplace=True)
    df.drop(df[df['转化率']=='--'].index,inplace=True)
    df.drop(df[df['销量']=='--'].index,inplace=True)
    df.drop(df[df['销售额']=='--'].index,inplace=True)
    m=[]
    for i in  df.转化率 :
        i=i.replace('%','')
    #    print(i)
        m.append(i)

    df['转化率']=m
    df['转化率']=df['转化率'].astype('float64')/100
    df['销量']=df['销量'].astype('int')
    df['销量贡献']=df['销量']/df['销量'].sum()
    df['销售额']=df['销售额'].astype('float32').apply(lambda x : round(x,2))
    df['销额贡献']=df['销售额']/df['销售额'].sum()
    df['商品访客数']=(df['销量'].astype('float')/df['转化率'].astype('float64'))
    df['商品访客数']=df['商品访客数'].astype('int')
    df['商品点击率'] = df['商品访客数']/df['商品访客数'].sum()
    df['券后价']=df['券后价'].astype('float32').apply(lambda x : round(x,2))
    df['销量']=df['销量'].astype('int')
    
    df['转化率']=df['转化率'].apply(lambda x : round(x,2))

    df['销量贡献']=df['销量贡献'].apply(lambda x : round(x,2))
    df['销额贡献']=df['销额贡献'].apply(lambda x : round(x,2))
    df['商品点击率'] =df['商品点击率'].apply(lambda x : round(x,2))
    df=df[['商品名', '券后价', '销量',  '销量贡献','销售额', '销额贡献','转化率', '商品访客数', 
       '商品点击率', '商品品类','关联小店']]
    df1=df
    df1['区间']=pd.cut(df1.券后价,[0,10,20,50,100,300,500,1000,np.inf],labels= ['0-10','10-20','20-50','50-100','100-300','300-500','500-1000','1000+'])
    data = df1.groupby('区间').sum()
    data['SKU数量'] = df1.groupby('区间').size()
    data=data.drop('券后价',axis=1)
    data['转化率']=data.销量/data.商品访客数
    writer = pd.ExcelWriter('D:/汇总/0621-0627/'+a[23:-10]+'.xls')#0524-0530
    df.to_excel(writer,'Sheet1',index=False)
    data.to_excel(writer,'汇总')
    writer.save()
  #  data.to_excel('D:/汇总/0531-0606/'+a[23:-10]+'.xls',sheet_name=a[33:-10]+'汇总')
清洗一下

在这里插入图片描述
几百个头部主播的带货产品数据就有啦。

当然只到这里手动也能拼接,不过这个脚本就是实现大规模的数据处理。

当然 还要做点有趣的事情

datetime= ['0614-0620/','0621-0627/']
#datetime = ['0524-0530/','0531-0606/','0607-0613','0614-0620/','0620-0627/']
data_all = []
for i in datetime:
    inputPath = 'D:/汇总/'+i
    for input_file in glob.glob(os.path.join(inputPath,'*.xls')):
        #a=pd.read_excel(input_file)
        a=input_file
        a=a.replace('\\','/')
        print(a)
        df = pd.read_excel(a)
        df['直播场名'] = a[16:-4]
        data_all.append(df)

在这里插入图片描述
统计了150场单场销售1000w以上的直播间的带货数据。

在这里插入图片描述
分别获取销售额、销售量、访客数都排名前500的商品,有115个产品。目的是获取头部主播的带货品类。其实很容易发现6月最火的抖音带货品类是美妆和食品冲饮。

在这里插入图片描述
对每一个品类的聚合销量,销售、访客,然后给他们一个权重分数,得出上表。

最后去逐个分析top主播带货的产品品牌,价位,毛利以及是否可搭建类似供应链,不过我弄着玩的。诸君当笑话看看就好。

datetime='531-606/'
#datetime = ['524-530/','531-606/','607-613','614-620/']
data_all = []
b=0
#for i in datetime:
inputPath = 'D:/直播数据分析/'+datetime
for input_file in glob.glob(os.path.join(inputPath,'*.xls')):
        #a=pd.read_excel(input_file)
    a=input_file
    a=a.replace('\\','/')
    print(a)
    df = pd.read_excel(a)
    df.drop(['商品链接','讲解时长','上架时间','下架时间','商品品牌'],axis=1,inplace=True)
    df.drop(df[df['转化率']=='--'].index,inplace=True)
    df.drop(df[df['销量']=='--'].index,inplace=True)
    df.drop(df[df['销售额']=='--'].index,inplace=True)
    m=[]
    for i in  df.转化率 :
        i=i.replace('%','')
    #    print(i)
        m.append(i)

    df['转化率']=m
    df['转化率']=df['转化率'].astype('float64')/100
    df['商品访客数']=(df['销量'].astype('float')/df['转化率'].astype('float64'))
    df['商品访客数']=df['商品访客数'].astype('int')
    df['券后价']=df['券后价'].astype('float32').apply(lambda x : round(x,2))
    df['销量']=df['销量'].astype('int')
    df['销售额']=df['销售额'].astype('float32').apply(lambda x : round(x,2))
    df['转化率']=df['转化率'].apply(lambda x : round(x,2))
    df['销量贡献']=df['销量']/df['销量'].sum()
    df['销额贡献']=df['销售额']/df['销售额'].sum()
    df['商品点击率'] = df['商品访客数']/df['商品访客数'].sum()
    df['销量贡献']=df['销量贡献'].apply(lambda x : round(x,2))
    df['销额贡献']=df['销额贡献'].apply(lambda x : round(x,2))
    df['商品点击率'] =df['商品点击率'].apply(lambda x : round(x,2))
    df=df[['商品名', '券后价', '销量',  '销量贡献','销售额', '销额贡献','转化率', '商品访客数', 
       '商品点击率', '商品品类','关联小店']]
    df.to_excel('D:/汇总/0531-0606/'+a[23:-10]+'.xls',index=False)

版权声明:本文为lisenby原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。