推荐系统架构与机器学习基础理论

推荐系统架构与机器学习基础理论

机器学习之推荐系统发展概述与架构原理
  1. 机器学习“思维”
  2. 推荐系统的应用场景
  3. 推荐系统的架构
机器学习出现的原因

在这里插入图片描述

优化问题与凸优化问题

在这里插入图片描述

一维与多维

在这里插入图片描述

推荐系统的出现背景

信息过载

  1. 分类导航:信息缺乏,用户主动寻找信息
  2. 搜索引擎:信息丰富,用户主动寻找信息
  3. 推荐系统:信息泛滥,信息寻找用户
搜索引擎与推荐系统的区别

搜索引擎与推荐系统的主要区别:

  1. 搜索引擎:满足用户有明确目的时主动查找的需求
  2. 推荐系统:帮助用户在没有明确目的时,发现感兴趣的 内容
对舰系统的构成

在这里插入图片描述

推荐系统架构

在这里插入图片描述

推荐系统的再次认识

在这里插入图片描述

80/20原则与长尾效应

本节目标
  1. 物品流行度分析
  2. 长尾效应的解决思路
80/20原则
  • 80/20原则: 80%的销售额来源于20%的热门商品
  • 原因:喜爱热门商品的用户数更多,如果不知道用户的喜好,推 荐热门商品更加保险
长尾效应

在这里插入图片描述

长尾效应的解决思路
  1. 用户分析
    新用户:倾向于浏览热门商品
    老用户:逐渐开始浏览冷门物品
  2. 新颖度
  3. 覆盖度
总结
  1. 物品流行度分析
  2. 长尾效应的解决思路

新算法上线流程与用户满意度手机策略

新算法上线流程

第一步:离线实验
第二步:用户调查
第三步:在线AB测试

离线实验:
  1. 日志生成标准数据集
  2. 数据集分为训练集和测试集
  3. 训练集上训练模型,测试集上进行预测
  4. 根据指标,评价预测结果
用户调查:
  1. 高预测准确率不等于用户满意度
  2. 算法上线测试之前需要真实用户来参与测试

注: 要保证参与测试的用户与实际用户分布相同

在线实验:
  1. AB测试:新算法与旧算法进行比较

注: 在线实验的成本更高,只有离线实验和用户调查中表现都很 好的算法才可以进行

新算法最终上线的条件:
  1. 在离线指标上优于现有算法
  2. 用户调查满意度不低于现有算法
  3. 在线AB测试结果优于现有算法

用户满意度收集策略

  1. 调查问卷
  2. 点击率
  3. 用户停留时间
  4. 转化率
  5. 标签反馈

总结

  1. 新算法上线流程:
    离线实验、用户调查、在线AB测试
  2. 用户满意度的收集策略

RMSE与MAE评价准确度

RMSE和MAE

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

准确率与召回率

在这里插入图片描述
在这里插入图片描述

信息熵与基尼系数衡量覆盖率

  1. 理解信息熵和基尼系数
  2. 覆盖度公式与分析
信息熵

在这里插入图片描述

基尼系数

在这里插入图片描述

覆盖度

在这里插入图片描述

多样性的度量——相似度

多样性

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

抵御行为注入攻击策略

行为注入攻击

在这里插入图片描述

行为注入攻击的防范
防范方式: 
	1. 使用高代价的用户行为 
	2. 使用数据前进行攻击检测,对数据清理

版权声明:本文为weixin_44659258原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。