大数据下的信息安全

        在人们享受互联网带来的便捷和高效时,有一批 人将其黑手伸向了 领域,他们利用某些网站的技术和业务漏洞进行作弊,从而满足自 己的灰色利益需求。恶意传播色 情、诈骗、谣言、暴力等不正当信息,给互联网环境造成了很大的威胁。
         随着作弊场景和手法的不断变化,各个维度的安 全技术 也在不断升 级保护正常用户免受黑色利益链条的侵害,其中包括物理安全、网络安 全、应用安全、数据安全等方面。
1敏感信息保护(加密,物理隔离),在使用过程中清洗过滤掉敏感信息(ETL脱敏)
 
2针对网络攻击,智能监控预警:通过采集审计日志信息,通过kafka传输给spark/flink(机器学习)
 
 
2针对非人为操作(通过自动化程序进行网络攻击),采用防火墙和网关识别网络攻击,黑名单屏蔽

3识别欺诈信息,通过大数据手段识别(

有监督学习(用于预测)

通过正负样本标记、特征提取、模型训练及预测等过程来识别作弊行为。比如在账户反欺诈场景下,以账户的 属性信息和行为数据作为模型特征输人,以历史的欺诈事件作为标记样本,通过训练分类模型对当前账户的作弊风险进行预测评估。
 
无监督学习(分类, 辅以 一定 的业务知识来综合判断行为的风险情况。
在此类方法中较常见的是异常检测算法,该方法假设作弊行为极其 见且在某些特征维度下和正常行为能够明显地区分开来。所以,假设 检验、统计分析、聚类分析等手段常被用来做异常检测。比如我们发现账户的网站访问时间段分布有一定的规律,和人们日常的作息时间具有相关性,如果某个账户长期在凌晨发生大量的访问行为且转化率较低, 那么就需要适当提高对应账户的风险等级。

 


版权声明:本文为zhuwentaolove原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。