背景

医学图像是非常巨大的，我们将整张图称作是WSI，也就是whole slide image。在实际处理的时候我们肯定不能用这么大的图，所以我们使用的一般是一个个小patch，这些patch就是从原图中切下来的。

为了方便叙述，我们假定有一个(h, w)的大图。

level是什么

切图的时候首先就涉及到一个level的问题。如果是level 0，那么我们就直接在这个(h, w)的图片上进行切图。如果是level 1，那么我们就是在(h/downsample_factor, w/downsample_factor)这个图上切，换言之就是大图首先被缩小了。如果是level 2，那图的大小就变成了[h/(downsample_factor^2), w/(downsample_factor^2)]，也就是进一步缩小。也就是说这个图在切图之前会被首先调整为[h/(downsample_factor^level), w/(downsample_factor^level)]。

好了，那么level和downsample_factor是什么关系呢？我们不妨这样来查看。读取医学图像一般使用的是openslide这个包，代码如下。

slide = openslide.open_slide(str(filename))

slide就是一个实例化之后的对象，我们去看看它的属性slide.level_downsamples。这个里面其实就是一个列表，在本示例中，这个列表是[1.0, 4.0, 16.0, …]，也就是说，这就是在不同level下降采样的倍数。level=0的时候，downsample_factor是1.0，level=1的时候，downsample_factor是4.0。当然了，不同的情况下，这个列表里的数字不一定一样，要根据具体情况具体分析，并使用slide.level_downsamples去查看确认。

切图过程

先进行上一步放缩，然后去切图。我们可以设定patch的大小，比如256，这样我们切出来的图就都是256*256。如果我们要overlap，那么就要调整步长，比如不重叠的时候步长和patch一样，按照刚刚的示例，那就是256的步长。这些都搞定了之后，要看一下resize，也就是说最后我们要把patch给缩放到多大。

保存

由于图片名称里是有坐标的，所以我们必须明确这个坐标到底是什么。一般情况下，我们可以找到坐标定义的部分。

    row_cords = np.arange(0, w, args.stride * downsample_factor)
    col_cords = np.arange(0, h, args.stride * downsample_factor)

不难看出，坐标使用的是最初坐标，没有经过任何缩放，我们要根据自己的需要去使用适合的坐标。

原文链接：https://blog.csdn.net/Michael_Cretu_/article/details/125312311