caffe中Blob数据结构

    Blob数据结构是caffe中基本的数据存储单元,它主要存储的数据是网络中的中间数据变量,比如各层的输入和输出;代价函数关于网络各层参数的梯度。为什么要专门为数据设计一个存储结构,我的理解是这样保证的网络中的数据存储结构的统一性,由于网络中每个网络的计算过程都是相似的,所以如果能把数据存储也统一起来,使得整个程序也就很有结构。

    1,Blob中除了存储重要的数据之外,还有一些标记数据的参数,下面就罗列一下Blob中的数据成员:

protected:
  shared_ptr<SyncedMemory> data_;
  shared_ptr<SyncedMemory> diff_;
  shared_ptr<SyncedMemory> shape_data_;
  vector<int> shape_;
  int count_;
  int capacity_;

    data_:表示网络各层的输入和输出;

    diff_:表示代价函数相对于各层参数的梯度;

    shape_:是一个可变数组,shape_中主要存储4个变量:num表示一个batch中的样本数量,从这我们可以看出Blob的存储是以batch为基本单位的;chennels表示对应层的通道,比如卷积层有20个卷积核,channels的值就是20;height和width就表示单个数据的尺寸,可能是一副图像的尺寸,也可能表示卷积核的尺寸,在每一层所代表的含义也不相同。

    count_:表示这个Blob里已经存储的元素的个数;

    capacity_:表示这个Blob的容量;

    网上说可以把Blob看作一个四维的数组,其实是可以从这个角度看,但是本质上Blob还是一维的存储结构,只不过是利用四个参数来进行寻址(shape_里的四个参数)。所以说Blob其实并不是含有什么复杂的结构。

    2,Blob中除了数据成员之外,也有很多用于操作数据的函数成员,下面就说几个比较重要的:

    void Blob<Dtype>::Reshape():这个函数是在原来分配的内存不够的情况下重新分配内存。

    const Dtype* Blob<Dtype>::cpu_data():这个是获取Blob结构体中的data_数据的指针,同时限制不能对返回的指针指向的内容进行更改。

    const Dtype* Blob<Dtype>::cpu_diff():这个是获取Blob结构体中的diff_数据的指针,同时限制不能对返回的指针指向的内容进行更改。

    Dtype* Blob<Dtype>::mutable_cpu_data():获取Blob结构体中的data_数据的指针,同时可以对指针指向的内容更改。

    Dtype* Blob<Dtype>::mutable_cpu_diff():获取Blob结构体中的diff_数据的指针,同时可以对指针指向的内容更改。

    void Blob<Dtype>::ShareData(const Blob& other):让其他Blob的data_数据和当前Blob共享。

    void Blob<Dtype>::ShareDiff(const Blob& other):让其他Blob的diff_和当前的Blob共享。   

    这就是关于Blob的主要内容,关于Blob中的SyncedMemory数据类型,这里不深究,现在只知道data_和diff_都是使用这种数据类型构造数据。


版权声明:本文为Buyi_Shizi原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。