【科研笔记】关于使用openslide切图的下采样倍数

【科研笔记】关于使用openslide切图的下采样倍数

背景

医学图像是非常巨大的,我们将整张图称作是WSI,也就是whole slide image。在实际处理的时候我们肯定不能用这么大的图,所以我们使用的一般是一个个小patch,这些patch就是从原图中切下来的。

为了方便叙述,我们假定有一个(h, w)的大图。

level是什么

切图的时候首先就涉及到一个level的问题。如果是level 0,那么我们就直接在这个(h, w)的图片上进行切图。如果是level 1,那么我们就是在(h/downsample_factor, w/downsample_factor)这个图上切,换言之就是大图首先被缩小了。如果是level 2,那图的大小就变成了[h/(downsample_factor^2), w/(downsample_factor^2)],也就是进一步缩小。也就是说这个图在切图之前会被首先调整为[h/(downsample_factor^level), w/(downsample_factor^level)]

好了,那么level和downsample_factor是什么关系呢?我们不妨这样来查看。读取医学图像一般使用的是openslide这个包,代码如下。

slide = openslide.open_slide(str(filename))

slide就是一个实例化之后的对象,我们去看看它的属性slide.level_downsamples。这个里面其实就是一个列表,在本示例中,这个列表是[1.0, 4.0, 16.0, …],也就是说,这就是在不同level下降采样的倍数。level=0的时候,downsample_factor是1.0,level=1的时候,downsample_factor是4.0。当然了,不同的情况下,这个列表里的数字不一定一样,要根据具体情况具体分析,并使用slide.level_downsamples去查看确认。

切图过程

先进行上一步放缩,然后去切图。我们可以设定patch的大小,比如256,这样我们切出来的图就都是256*256。如果我们要overlap,那么就要调整步长,比如不重叠的时候步长和patch一样,按照刚刚的示例,那就是256的步长。这些都搞定了之后,要看一下resize,也就是说最后我们要把patch给缩放到多大。

保存

由于图片名称里是有坐标的,所以我们必须明确这个坐标到底是什么。一般情况下,我们可以找到坐标定义的部分。

    row_cords = np.arange(0, w, args.stride * downsample_factor)
    col_cords = np.arange(0, h, args.stride * downsample_factor)

不难看出,坐标使用的是最初坐标,没有经过任何缩放,我们要根据自己的需要去使用适合的坐标。


版权声明:本文为Michael_Cretu_原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。