Pooling与马赛克的秘密

描述

 

说到Pooling,相信学习过CNN的朋友们都不会感到陌生。Pooling在中文当中的意思是“池化”,在神经网络当中非常常见,通常用的比较多的一种是Max Pooling,具体操作如下图:

神经网络

  结合图像理解,相信你也会大概明白其中的本意。不过Pooling并不是只可以选取2x2的窗口大小,即便是3x3,5x5等等没问题,步长(Stride)也是一个道理。除了在神经网络方面,Pooling为图片打马赛克也是可以取得不错的效果,结合几个例子看看。

神经网络

  我们可以用Max Pooling先看看效果如何:

神经网络

  Min Pooling和Average Pooling的操作也差不多,只不过把对应的操作函数变了而已。

  Min Pooling:

神经网络

  小动物的皮肤颜色都换了,再看看Average Pooling:

神经网络

  综上来看,Average Pooling似乎更加逼真一些,不过换一张图片可能效果就不一样了。

  以下是Pooling操作的代码:

import cv2
import numpy as np


def average_pooling(img, G=5):
    out = img.copy()

    H, W, C = img.shape
    Nh = H // G
    Nw = W // G

    for y in range(Nh):
        for x in range(Nw):
            for c in range(C):
                out[G*y:G*(y+1), G*x:G*(x+1), c] = np.mean(out[G*y:G*(y+1), G*x:G*(x+1), c]).astype(np.int64)

    return out
def max_pooling(img, G=5):
    out = img.copy()

    H, W, C = img.shape
    Nh = H // G
    Nw = W // G

    for y in range(Nh):
        for x in range(Nw):
            for c in range(C):
                out[G*y:G*(y+1), G*x:G*(x+1), c] = np.max(out[G*y:G*(y+1), G*x:G*(x+1), c]).astype(np.int64)

    return out
def min_pooling(img, G=5):
    out = img.copy()

    H, W, C = img.shape
    Nh = H // G
    Nw = W // G

    for y in range(Nh):
        for x in range(Nw):
            for c in range(C):
                out[G*y:G*(y+1), G*x:G*(x+1), c] = np.min(out[G*y:G*(y+1), G*x:G*(x+1), c]).astype(np.int64)

    return out

  由于是多颜色通道的图片,所以记得别漏了这个参数。


打开APP阅读更多精彩内容
声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人,不代表电子发烧友网立场。文章及其配图仅供工程师学习之用,如有内容侵权或者其他违规问题,请联系本站处理。 举报投诉

全部0条评论

快来发表一下你的评论吧 !

×
20
完善资料,
赚取积分