大数据计算技术架构解析

大数据计算体系层次

在这里插入图片描述

在这里插入图片描述

1数据应用系统

在这里插入图片描述

2数据计算处理系统​​​​​​​​

​​​​​​​​在这里插入图片描述
在这里插入图片描述
计算模型(计算模式)的概念:
计算模型针对领域问题提出技术解决方案的基础模型、数据结构和算法

其中不同的计算模型的衡量标准:
在这里插入图片描述

3数据存储系统

在这里插入图片描述

3.1功能

3.1.1数据清洗、抽取和建模

在这里插入图片描述

3.1.1.1建模

在这里插入图片描述
​​在这里插入图片描述

3.1.1.1.1概念模型

(定义基于业务的实体类)

3.1.1.1.2逻辑模型

(给出实体类的更多表的细节(主键、外键等)在纸上表达的对数据(关系等)的抽象,数据库提供了数据的逻辑存储结构)

3.1.1.1.3物理模型(存储)

( 把实体数据存储到磁盘或者内存中,分布式文件系统提供数据的物理存储结构)

3.1.2数据存储架构

在这里插入图片描述
在这里插入图片描述

3.1.3数据仓库和数据服务

3.1.4统一数据接口

在这里插入图片描述
传统的数据库接口:ODBC、JDBC

  1. 在这里插入图片描述
    在这里插入图片描述

问题:如果数据库既需要支持java编写的应用程序,也要支持c++写的程序,所以:

在这里插入图片描述
目前的大数据采用的是:统一数据读写接口

3.2层次单元

3.2.1分布式文件系统:提供物理存储架构

(对数据的物理存储架构,如果没有,则无法长期、持久保存数据)
例如:HDFS、GFS都采用主从架构
主节点管理一组从节点
数据划分为小的数据块,又生成备份,都会存储到文件系统中
在这里插入图片描述

3.2.2分布式数据库:not only sql database

在这里插入图片描述


版权声明:本文为Taylor_Ocean原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。