这期来聊一聊DBA种的一些热 温 冷 数据

按照数据被使用的频繁程度,数据可以被分为热数据、温数据和冷数据。

热数据,比如可以是半年以内的数据,用户经常会查询它们,适合放在数据库中存储,比如MySql、MongoDB和HBase,其中HBase是:

Hadoop Database,是一个高可靠性、高性能、面向列、可伸缩的分布式存储系统,利用HBase技术可在廉价PC Server上搭建起大规模结构化存储集群。

温数据,比如可以是半年到一年的数据,用户有时也需要在线查询一年内的数据,这些数据也适合存在数据库中,如果数据量不大,也可以不区分温数据和热数据。

冷数据,就是不怎么使用的数据,这些数据可以存储在性能较低、价格较便宜的文件系统里,比如HDFS:

Hadoop分布式文件系统(HDFS)是指被设计成适合运行在通用硬件(commodity hardware)上的分布式文件系统(Distributed File System)。

冷数据通常适合离线的分析,比如机器学习中的模型训练或者大数据分析。


版权声明:本文为weixin_43792741原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。