cuda 在GPU和CPU之间复制数组

cuda 内存结构

设备内存:

1 全局内存,通过CUDA内核指针访问
2 常量内存,只读
本地内存,
纹理内存,(CUDA数组形式)通过纹理与表面加载/存储指令访问

CPU GPU之间复制数组

cudaMemcpy(sendbuff[i], h_arr, size*sizeof(float), cudaMemcpyHostToDevice); //将数据从CPU传递到GPU
cudaMemcpy(recvCPU, sendbuff[i], sizeof(float) * size, cudaMemcpyDeviceToHost); //将数据从cuda 拷贝到cpu

版权声明:本文为weixin_32820767原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。