建模杂谈系列168 APIFunc的存储约定

说明

APIFunc的核心是处理,从数据存储来看,通过APIFunc处理已经可以不必把中间过程数据存下来,而仅仅要求存储规则表(元数据)。

但是在节点中,必然有前道流程和后道流程的数据IO,也就意味着这里需要数据的持久化存储。最早是希望使用Mongo来进行全程的存储,后来发现是不太能满足需求的。主要是当数据来自于实时请求,Mongo就很难应付大量的,零散的数据请求。

项目在运行中还发现了一些很基础的问题:理论上前表和后表的数据(主键)应当一致,但实际上存在数据差,目前就需要手动处理,这个一定要解决。

内容

1 目标

技术上:

  • 1 足够快的IO吞吐
  • 2 足够简洁的数据节点记录
  • 3 能够记录每条数据处理细节的数据

应用上:

  • 1 看到数据的流转
  • 2 随时debug数据

2 结构

以下是基于APIFunc的数据处理流转图
在这里插入图片描述

静态数据点

把整个数据处理看成一个系统,中间会有若干的数据点。例如要处理一万条数据的变换,那么step1_data、step2_data都会是一万条。

关于step_data有几点是要注意的:

  • 1 【数量】不建议超过5个。一方面从数据处理的复杂性上没有必要,另一方面每个数据点记录数都会和原

版权声明:本文为yukai08008原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。