tensorlayer · Jun 28, 2022
diff --git a/‎srgan.py
+159-84 b/‎srgan.py
+159-84
diff --git a/‎train.py
+14-8 b/‎train.py
+14-8
diff --git a/‎vgg.py
+8-4 b/‎vgg.py
+8-4
@@ -1,6 +1,6 @@
 from tensorlayerx.nn import Module
 import tensorlayerx as tlx
-from tensorlayerx.nn import Conv2d, BatchNorm2d,Elementwise,SubpixelConv2d, UpSampling2d, Flatten, Sequential
+from tensorlayerx.nn import Conv2d, BatchNorm2d, Elementwise, SubpixelConv2d, UpSampling2d, Flatten, Sequential
 from tensorlayerx.nn import Linear, MaxPool2d
 
 W_init = tlx.initializers.TruncatedNormal(stddev=0.02)
@@ -11,10 +11,16 @@ class ResidualBlock(Module):
 
     def __init__(self):
         super(ResidualBlock, self).__init__()
-        self.conv1 = Conv2d(out_channels=64, kernel_size=(3,3), stride=(1,1), act=None, padding='SAME', W_init=W_init, b_init = None)
-        self.bn1 = BatchNorm2d(num_features=64, act=tlx.ReLU, gamma_init=G_init)
-        self.conv2 = Conv2d(out_channels=64, kernel_size=(3,3), stride=(1,1), act=None, padding='SAME', W_init=W_init, b_init = None)
-        self.bn2 = BatchNorm2d(num_features=64, act=None,  gamma_init=G_init)
+        self.conv1 = Conv2d(
+            out_channels=64, kernel_size=(3, 3), stride=(1, 1), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn1 = BatchNorm2d(num_features=64, act=tlx.ReLU, gamma_init=G_init, data_format='channels_first')
+        self.conv2 = Conv2d(
+            out_channels=64, kernel_size=(3, 3), stride=(1, 1), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn2 = BatchNorm2d(num_features=64, act=None, gamma_init=G_init, data_format='channels_first')
 
     def forward(self, x):
         z = self.conv1(x)
@@ -24,21 +30,30 @@ def forward(self, x):
         x = x + z
         return x
 
+
 class SRGAN_g(Module):
     """ Generator in Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
     feature maps (n) and stride (s) feature maps (n) and stride (s)
     """
+
     def __init__(self):
-        super(SRGAN_g,self).__init__()
-        self.conv1 = Conv2d(out_channels=64, kernel_size=(3,3), stride=(1,1), act=tlx.ReLU, padding='SAME', W_init=W_init)
+        super(SRGAN_g, self).__init__()
+        self.conv1 = Conv2d(
+            out_channels=64, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME', W_init=W_init,
+            data_format='channels_first'
+        )
         self.residual_block = self.make_layer()
-        self.conv2  = Conv2d(out_channels=64, kernel_size=(3,3), stride=(1,1),padding='SAME', W_init=W_init, b_init = None)
-        self.bn1 = BatchNorm2d(num_features=64, act=None, gamma_init=G_init)
-        self.conv3 = Conv2d(out_channels=256, kernel_size=(3,3), stride=(1,1),padding='SAME', W_init = W_init)
-        self.subpiexlconv1 = SubpixelConv2d(scale=2, act = tlx.ReLU)
-        self.conv4 = Conv2d(out_channels=256, kernel_size=(3,3), stride=(1,1), padding='SAME', W_init=W_init)
-        self.subpiexlconv2 = SubpixelConv2d(scale=2, act = tlx.ReLU)
-        self.conv5 = Conv2d(3, kernel_size=(1,1), stride=(1,1), act=tlx.Tanh, padding='SAME', W_init=W_init)
+        self.conv2 = Conv2d(
+            out_channels=64, kernel_size=(3, 3), stride=(1, 1), padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn1 = BatchNorm2d(num_features=64, act=None, gamma_init=G_init, data_format='channels_first')
+        self.conv3 = Conv2d(out_channels=256, kernel_size=(3, 3), stride=(1, 1), padding='SAME', W_init=W_init, data_format='channels_first')
+        self.subpiexlconv1 = SubpixelConv2d(data_format='channels_first', scale=2, act=tlx.ReLU)
+        self.conv4 = Conv2d(out_channels=256, kernel_size=(3, 3), stride=(1, 1), padding='SAME', W_init=W_init, data_format='channels_first')
+        self.subpiexlconv2 = SubpixelConv2d(data_format='channels_first', scale=2, act=tlx.ReLU)
+        self.conv5 = Conv2d(3, kernel_size=(1, 1), stride=(1, 1), act=tlx.Tanh, padding='SAME', W_init=W_init, data_format='channels_first')
+
     def make_layer(self):
         layer_list = []
         for i in range(16):
@@ -61,7 +76,6 @@ def forward(self, x):
         return x
 
 
-
 class SRGAN_g2(Module):
     """ Generator in Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
     feature maps (n) and stride (s) feature maps (n) and stride (s)
@@ -70,22 +84,34 @@ class SRGAN_g2(Module):
 
     Use Resize Conv
     """
+
     def __init__(self):
-        super(SRGAN_g2,self).__init__()
-        self.conv1 = Conv2d(out_channels=64, kernel_size=(3,3), stride=(1,1), act=None, padding='SAME', W_init=W_init)
+        super(SRGAN_g2, self).__init__()
+        self.conv1 = Conv2d(
+            out_channels=64, kernel_size=(3, 3), stride=(1, 1), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first'
+        )
         self.residual_block = self.make_layer()
-        self.conv2 = Conv2d(out_channels=64, kernel_size=(3, 3), stride=(1, 1), padding='SAME', W_init=W_init,
-                            b_init=None)
-        self.bn1 = BatchNorm2d(act=None,  gamma_init=G_init)
-        self.upsample1 = UpSampling2d(scale=(2,2), method='bilinear')
-        self.conv3 = Conv2d(out_channels=64, kernel_size=(3, 3), stride=(1, 1), padding='SAME', W_init=W_init,
-                            b_init=None)
-        self.bn2 = BatchNorm2d(act= tlx.ReLU, gamma_init=G_init)
-        self.upsample2 = UpSampling2d(scale=(4,4),method='bilinear')
-        self.conv4 = Conv2d(out_channels=32, kernel_size=(3, 3), stride=(1, 1), padding='SAME', W_init=W_init,
-                            b_init=None)
-        self.bn3 = BatchNorm2d(act = tlx.ReLU, gamma_init=G_init)
-        self.conv5 = Conv2d(out_channels=3, kernel_size=(1,1), stride=(1,1), act = tlx.Tanh, padding='SAME', W_init=W_init)
+        self.conv2 = Conv2d(
+            out_channels=64, kernel_size=(3, 3), stride=(1, 1), padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn1 = BatchNorm2d(act=None, gamma_init=G_init, data_format='channels_first')
+        self.upsample1 = UpSampling2d(data_format='channels_first', scale=(2, 2), method='bilinear')
+        self.conv3 = Conv2d(
+            out_channels=64, kernel_size=(3, 3), stride=(1, 1), padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn2 = BatchNorm2d(act=tlx.ReLU, gamma_init=G_init, data_format='channels_first')
+        self.upsample2 = UpSampling2d(data_format='channels_first', scale=(4, 4), method='bilinear')
+        self.conv4 = Conv2d(
+            out_channels=32, kernel_size=(3, 3), stride=(1, 1), padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn3 = BatchNorm2d(act=tlx.ReLU, gamma_init=G_init, data_format='channels_first')
+        self.conv5 = Conv2d(
+            out_channels=3, kernel_size=(1, 1), stride=(1, 1), act=tlx.Tanh, padding='SAME', W_init=W_init
+        )
 
     def make_layer(self):
         layer_list = []
@@ -109,27 +135,53 @@ def forward(self, x):
         x = self.conv5(x)
         return x
 
+
 class SRGAN_d2(Module):
     """ Discriminator in Photo-Realistic Single Image Super-Resolution Using a Generative Adversarial Network
     feature maps (n) and stride (s) feature maps (n) and stride (s)
     """
+
     def __init__(self, ):
         super(SRGAN_d2, self).__init__()
-        self.conv1 = Conv2d(out_channels=64, kernel_size=(3,3), stride=(1,1), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME', W_init=W_init)
-        self.conv2 = Conv2d(out_channels=64, kernel_size=(3,3), stride=(2,2), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME', W_init=W_init, b_init=None)
-        self.bn1 = BatchNorm2d( gamma_init=G_init)
-        self.conv3 = Conv2d(out_channels=128, kernel_size=(3,3), stride=(1,1), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME', W_init=W_init, b_init=None)
-        self.bn2 = BatchNorm2d( gamma_init=G_init)
-        self.conv4 = Conv2d(out_channels=128, kernel_size=(3,3), stride=(2,2), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME', W_init=W_init, b_init=None)
-        self.bn3 = BatchNorm2d(gamma_init=G_init)
-        self.conv5 = Conv2d(out_channels=256, kernel_size=(3,3), stride=(1,1), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME', W_init=W_init, b_init=None)
-        self.bn4 = BatchNorm2d( gamma_init=G_init)
-        self.conv6 = Conv2d(out_channels=256, kernel_size=(3,3), stride=(2,2), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME', W_init=W_init, b_init=None)
-        self.bn5 = BatchNorm2d( gamma_init=G_init)
-        self.conv7 = Conv2d(out_channels=512, kernel_size=(3,3), stride=(1,1), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME', W_init=W_init, b_init=None)
-        self.bn6 = BatchNorm2d( gamma_init=G_init)
-        self.conv8 = Conv2d(out_channels=512, kernel_size=(3,3), stride=(2,2), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME', W_init=W_init, b_init=None)
-        self.bn7 = BatchNorm2d( gamma_init=G_init)
+        self.conv1 = Conv2d(
+            out_channels=64, kernel_size=(3, 3), stride=(1, 1), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME',
+            W_init=W_init, data_format='channels_first'
+        )
+        self.conv2 = Conv2d(
+            out_channels=64, kernel_size=(3, 3), stride=(2, 2), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME',
+            W_init=W_init, data_format='channels_first', b_init=None
+        )
+        self.bn1 = BatchNorm2d(gamma_init=G_init, data_format='channels_first')
+        self.conv3 = Conv2d(
+            out_channels=128, kernel_size=(3, 3), stride=(1, 1), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME',
+            W_init=W_init, data_format='channels_first', b_init=None
+        )
+        self.bn2 = BatchNorm2d(gamma_init=G_init, data_format='channels_first')
+        self.conv4 = Conv2d(
+            out_channels=128, kernel_size=(3, 3), stride=(2, 2), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME',
+            W_init=W_init, data_format='channels_first', b_init=None
+        )
+        self.bn3 = BatchNorm2d(gamma_init=G_init, data_format='channels_first')
+        self.conv5 = Conv2d(
+            out_channels=256, kernel_size=(3, 3), stride=(1, 1), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME',
+            W_init=W_init, data_format='channels_first', b_init=None
+        )
+        self.bn4 = BatchNorm2d(gamma_init=G_init, data_format='channels_first')
+        self.conv6 = Conv2d(
+            out_channels=256, kernel_size=(3, 3), stride=(2, 2), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME',
+            W_init=W_init, data_format='channels_first', b_init=None
+        )
+        self.bn5 = BatchNorm2d(gamma_init=G_init, data_format='channels_first')
+        self.conv7 = Conv2d(
+            out_channels=512, kernel_size=(3, 3), stride=(1, 1), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME',
+            W_init=W_init, data_format='channels_first', b_init=None
+        )
+        self.bn6 = BatchNorm2d(gamma_init=G_init, data_format='channels_first')
+        self.conv8 = Conv2d(
+            out_channels=512, kernel_size=(3, 3), stride=(2, 2), act=tlx.LeakyReLU(negative_slope=0.2), padding='SAME',
+            W_init=W_init, data_format='channels_first', b_init=None
+        )
+        self.bn7 = BatchNorm2d(gamma_init=G_init, data_format='channels_first')
         self.flat = Flatten()
         self.dense1 = Linear(out_features=1024, act=tlx.LeakyReLU(negative_slope=0.2))
         self.dense2 = Linear(out_features=1)
@@ -158,43 +210,67 @@ def forward(self, x):
         return n, logits
 
 
-
-
 class SRGAN_d(Module):
 
-    def __init__(self, dim = 64):
-        super(SRGAN_d,self).__init__()
-        self.conv1 = Conv2d(out_channels=dim, kernel_size=(4,4), stride=(2,2), act=tlx.LeakyReLU, padding='SAME', W_init=W_init)
-        self.conv2 = Conv2d(out_channels=dim * 2, kernel_size=(4,4), stride=(2,2), act=None, padding='SAME', W_init=W_init, b_init=None)
-        self.bn1 = BatchNorm2d(num_features=dim * 2, act=tlx.LeakyReLU, gamma_init=G_init)
-        self.conv3 = Conv2d(out_channels=dim * 4, kernel_size=(4,4), stride=(2,2), act=None, padding='SAME', W_init=W_init, b_init=None)
-        self.bn2 = BatchNorm2d(num_features=dim * 4,act=tlx.LeakyReLU,  gamma_init=G_init)
-        self.conv4 = Conv2d(out_channels=dim * 8, kernel_size=(4, 4), stride=(2, 2), act=None, padding='SAME',W_init=W_init, b_init=None)
-        self.bn3 = BatchNorm2d(num_features=dim * 8, act=tlx.LeakyReLU,  gamma_init=G_init)
-        self.conv5 = Conv2d(out_channels=dim * 16, kernel_size=(4, 4), stride=(2, 2), act=None, padding='SAME',
-                            W_init=W_init, b_init=None)
-        self.bn4 = BatchNorm2d(num_features=dim * 16, act=tlx.LeakyReLU,  gamma_init=G_init)
-        self.conv6 = Conv2d(out_channels=dim * 32, kernel_size=(4, 4), stride=(2, 2), act=None, padding='SAME',
-                            W_init=W_init, b_init=None)
-        self.bn5 = BatchNorm2d(num_features=dim * 32,act=tlx.LeakyReLU,  gamma_init=G_init)
-        self.conv7 = Conv2d(out_channels=dim * 16, kernel_size=(1, 1), stride=(1, 1), act=None, padding='SAME',
-                            W_init=W_init, b_init=None)
-        self.bn6 = BatchNorm2d(num_features=dim * 16,act=tlx.LeakyReLU,  gamma_init=G_init)
-        self.conv8 = Conv2d(out_channels=dim * 8, kernel_size=(1, 1), stride=(1, 1), act=None, padding='SAME',
-                            W_init=W_init, b_init=None)
-        self.bn7 = BatchNorm2d(num_features=dim * 8,act=None,  gamma_init=G_init)
-        self.conv9 = Conv2d(out_channels=dim * 2, kernel_size=(1, 1), stride=(1, 1), act=None, padding='SAME',
-                            W_init=W_init, b_init=None)
-        self.bn8 = BatchNorm2d(num_features=dim * 2,act=tlx.LeakyReLU,  gamma_init=G_init)
-        self.conv10 = Conv2d(out_channels=dim * 2, kernel_size=(3, 3), stride=(1, 1), act=None, padding='SAME',
-                            W_init=W_init, b_init=None)
-        self.bn9 = BatchNorm2d(num_features=dim * 2,act=tlx.LeakyReLU,  gamma_init=G_init)
-        self.conv11 = Conv2d(out_channels=dim * 8, kernel_size=(3, 3), stride=(1, 1), act=None, padding='SAME',
-                            W_init=W_init, b_init=None)
-        self.bn10 = BatchNorm2d(num_features=dim * 8, gamma_init=G_init)
+    def __init__(self, dim=64):
+        super(SRGAN_d, self).__init__()
+        self.conv1 = Conv2d(
+            out_channels=dim, kernel_size=(4, 4), stride=(2, 2), act=tlx.LeakyReLU, padding='SAME', W_init=W_init,
+            data_format='channels_first'
+        )
+        self.conv2 = Conv2d(
+            out_channels=dim * 2, kernel_size=(4, 4), stride=(2, 2), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn1 = BatchNorm2d(num_features=dim * 2, act=tlx.LeakyReLU, gamma_init=G_init, data_format='channels_first')
+        self.conv3 = Conv2d(
+            out_channels=dim * 4, kernel_size=(4, 4), stride=(2, 2), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn2 = BatchNorm2d(num_features=dim * 4, act=tlx.LeakyReLU, gamma_init=G_init, data_format='channels_first')
+        self.conv4 = Conv2d(
+            out_channels=dim * 8, kernel_size=(4, 4), stride=(2, 2), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn3 = BatchNorm2d(num_features=dim * 8, act=tlx.LeakyReLU, gamma_init=G_init, data_format='channels_first')
+        self.conv5 = Conv2d(
+            out_channels=dim * 16, kernel_size=(4, 4), stride=(2, 2), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn4 = BatchNorm2d(num_features=dim * 16, act=tlx.LeakyReLU, gamma_init=G_init, data_format='channels_first')
+        self.conv6 = Conv2d(
+            out_channels=dim * 32, kernel_size=(4, 4), stride=(2, 2), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn5 = BatchNorm2d(num_features=dim * 32, act=tlx.LeakyReLU, gamma_init=G_init, data_format='channels_first')
+        self.conv7 = Conv2d(
+            out_channels=dim * 16, kernel_size=(1, 1), stride=(1, 1), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn6 = BatchNorm2d(num_features=dim * 16, act=tlx.LeakyReLU, gamma_init=G_init, data_format='channels_first')
+        self.conv8 = Conv2d(
+            out_channels=dim * 8, kernel_size=(1, 1), stride=(1, 1), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn7 = BatchNorm2d(num_features=dim * 8, act=None, gamma_init=G_init, data_format='channels_first')
+        self.conv9 = Conv2d(
+            out_channels=dim * 2, kernel_size=(1, 1), stride=(1, 1), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn8 = BatchNorm2d(num_features=dim * 2, act=tlx.LeakyReLU, gamma_init=G_init, data_format='channels_first')
+        self.conv10 = Conv2d(
+            out_channels=dim * 2, kernel_size=(3, 3), stride=(1, 1), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn9 = BatchNorm2d(num_features=dim * 2, act=tlx.LeakyReLU, gamma_init=G_init, data_format='channels_first')
+        self.conv11 = Conv2d(
+            out_channels=dim * 8, kernel_size=(3, 3), stride=(1, 1), act=None, padding='SAME', W_init=W_init,
+            data_format='channels_first', b_init=None
+        )
+        self.bn10 = BatchNorm2d(num_features=dim * 8, gamma_init=G_init, data_format='channels_first')
         self.add = Elementwise(combine_fn=tlx.add, act=tlx.LeakyReLU)
         self.flat = Flatten()
-        self.dense = Linear(out_features=1,  W_init=W_init)
+        self.dense = Linear(out_features=1, W_init=W_init)
 
     def forward(self, x):
 
@@ -227,37 +303,36 @@ def forward(self, x):
         return x
 
 
-
 class Vgg19_simple_api(Module):
 
     def __init__(self):
-        super(Vgg19_simple_api,self).__init__()
+        super(Vgg19_simple_api, self).__init__()
         """ conv1 """
         self.conv1 = Conv2d(out_channels=64, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
         self.conv2 = Conv2d(out_channels=64, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
-        self.maxpool1 = MaxPool2d(kernel_size=(2,2), stride=(2,2), padding='SAME')
+        self.maxpool1 = MaxPool2d(kernel_size=(2, 2), stride=(2, 2), padding='SAME')
         """ conv2 """
         self.conv3 = Conv2d(out_channels=128, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
         self.conv4 = Conv2d(out_channels=128, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
-        self.maxpool2 = MaxPool2d(kernel_size=(2,2), stride=(2,2), padding='SAME')
+        self.maxpool2 = MaxPool2d(kernel_size=(2, 2), stride=(2, 2), padding='SAME')
         """ conv3 """
         self.conv5 = Conv2d(out_channels=256, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
         self.conv6 = Conv2d(out_channels=256, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
         self.conv7 = Conv2d(out_channels=256, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
         self.conv8 = Conv2d(out_channels=256, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
-        self.maxpool3 = MaxPool2d(kernel_size=(2,2), stride=(2,2), padding='SAME')
+        self.maxpool3 = MaxPool2d(kernel_size=(2, 2), stride=(2, 2), padding='SAME')
         """ conv4 """
         self.conv9 = Conv2d(out_channels=512, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
         self.conv10 = Conv2d(out_channels=512, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
         self.conv11 = Conv2d(out_channels=512, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
         self.conv12 = Conv2d(out_channels=512, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
-        self.maxpool4 = MaxPool2d(kernel_size=(2,2), stride=(2,2), padding='SAME') # (batch_size, 14, 14, 512)
+        self.maxpool4 = MaxPool2d(kernel_size=(2, 2), stride=(2, 2), padding='SAME')  # (batch_size, 14, 14, 512)
         """ conv5 """
         self.conv13 = Conv2d(out_channels=512, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
         self.conv14 = Conv2d(out_channels=512, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
         self.conv15 = Conv2d(out_channels=512, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
         self.conv16 = Conv2d(out_channels=512, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME')
-        self.maxpool5 = MaxPool2d(kernel_size=(2,2), stride=(2,2), padding='SAME') # (batch_size, 7, 7, 512)
+        self.maxpool5 = MaxPool2d(kernel_size=(2, 2), stride=(2, 2), padding='SAME')  # (batch_size, 7, 7, 512)
         """ fc 6~8 """
         self.flat = Flatten()
         self.dense1 = Linear(out_features=4096, act=tlx.ReLU)
 
@@ -1,18 +1,20 @@
 import os
-os.environ['TL_BACKEND'] = 'tensorflow' # Just modify this line, easily change to any framework! PyTorch will coming soon!
+# os.environ['TL_BACKEND'] = 'tensorflow' # Just modify this line, easily switch to any framework! PyTorch will coming soon!
 # os.environ['TL_BACKEND'] = 'mindspore'
 # os.environ['TL_BACKEND'] = 'paddle'
+os.environ['TL_BACKEND'] = 'torch'
 import time
 import numpy as np
 import tensorlayerx as tlx
 from tensorlayerx.dataflow import Dataset, DataLoader
 from srgan import SRGAN_g, SRGAN_d
 from config import config
-from tensorlayerx.vision.transforms import Compose, RandomCrop, Normalize, RandomFlipHorizontal, Resize
+from tensorlayerx.vision.transforms import Compose, RandomCrop, Normalize, RandomFlipHorizontal, Resize, HWC2CHW
 import vgg
 from tensorlayerx.model import TrainOneStep
 from tensorlayerx.nn import Module
 import cv2
+tlx.set_device('GPU')
 
 ###====================== HYPER-PARAMETERS ===========================###
 batch_size = 8
@@ -28,14 +30,16 @@
     RandomCrop(size=(384, 384)),
     RandomFlipHorizontal(),
 ])
-nor = Normalize(mean=(127.5), std=(127.5), data_format='HWC')
+nor = Compose([Normalize(mean=(127.5), std=(127.5), data_format='HWC'),
+              HWC2CHW()])
 lr_transform = Resize(size=(96, 96))
 
+train_hr_imgs = tlx.vision.load_images(path=config.TRAIN.hr_img_path, n_threads = 32)
 
 class TrainData(Dataset):
 
     def __init__(self, hr_trans=hr_transform, lr_trans=lr_transform):
-        self.train_hr_imgs = tlx.vision.load_images(path=config.TRAIN.hr_img_path)
+        self.train_hr_imgs = train_hr_imgs
         self.hr_trans = hr_trans
         self.lr_trans = lr_trans
 
@@ -104,12 +108,12 @@ def forward(self, lr, hr):
 
 G = SRGAN_g()
 D = SRGAN_d()
-VGG = vgg.VGG19(pretrained=False, end_with='pool4', mode='dynamic')
+VGG = vgg.VGG19(pretrained=True, end_with='pool4', mode='dynamic')
 # automatic init layers weights shape with input tensor.
 # Calculating and filling 'in_channels' of each layer is a very troublesome thing.
 # So, just use 'init_build' with input shape. 'in_channels' of each layer will be automaticlly set.
-G.init_build(tlx.nn.Input(shape=(8, 96, 96, 3)))
-D.init_build(tlx.nn.Input(shape=(8, 384, 384, 3)))
+G.init_build(tlx.nn.Input(shape=(8, 3, 96, 96)))
+D.init_build(tlx.nn.Input(shape=(8, 3, 384, 384)))
 
 
 def train():
@@ -176,15 +180,17 @@ def evaluate():
 
 
     valid_lr_img_tensor = np.asarray(valid_lr_img_tensor, dtype=np.float32)
+    valid_lr_img_tensor = np.transpose(valid_lr_img_tensor,axes=[2, 0, 1])
     valid_lr_img_tensor = valid_lr_img_tensor[np.newaxis, :, :, :]
     valid_lr_img_tensor= tlx.ops.convert_to_tensor(valid_lr_img_tensor)
     size = [valid_lr_img.shape[0], valid_lr_img.shape[1]]
 
     out = tlx.ops.convert_to_numpy(G(valid_lr_img_tensor))
     out = np.asarray((out + 1) * 127.5, dtype=np.uint8)
+    out = np.transpose(out[0], axes=[1, 2, 0])
     print("LR size: %s /  generated HR size: %s" % (size, out.shape))  # LR size: (339, 510, 3) /  gen HR size: (1, 1356, 2040, 3)
     print("[*] save images")
-    tlx.vision.save_image(out[0], file_name='valid_gen.png', path=save_dir)
+    tlx.vision.save_image(out, file_name='valid_gen.png', path=save_dir)
     tlx.vision.save_image(valid_lr_img, file_name='valid_lr.png', path=save_dir)
     tlx.vision.save_image(valid_hr_img, file_name='valid_hr.png', path=save_dir)
     out_bicu = cv2.resize(valid_lr_img, dsize = [size[1] * 4, size[0] * 4], interpolation = cv2.INTER_CUBIC)
 
@@ -103,7 +103,7 @@ def forward(self, inputs):
         """
 
 #         inputs = inputs * 255 - np.array([123.68, 116.779, 103.939], dtype=np.float32).reshape([1, 1, 1, 3])
-        inputs = inputs * 255. - tlx.convert_to_tensor(np.array([123.68, 116.779, 103.939], dtype=np.float32))
+        inputs = inputs * 255. - tlx.convert_to_tensor(np.array([123.68, 116.779, 103.939], dtype=np.float32).reshape(-1,1,1))
         out = self.make_layer(inputs)
         return out
 
@@ -126,18 +126,18 @@ def make_layers(config, batch_norm=False, end_with='outputs'):
                 layer_list.append(
                     Conv2d(
                         out_channels=n_filter, kernel_size=(3, 3), stride=(1, 1), act=tlx.ReLU, padding='SAME',
-                        in_channels=in_channels, name=layer_name
+                        in_channels=in_channels, name=layer_name, data_format='channels_first'
                     )
                 )
                 if batch_norm:
-                    layer_list.append(BatchNorm(num_features=n_filter))
+                    layer_list.append(BatchNorm(num_features=n_filter, data_format='channels_first'))
                 if layer_name == end_with:
                     is_end = True
                     break
         else:
             layer_name = layer_names[layer_group_idx]
             if layer_group == 'M':
-                layer_list.append(MaxPool2d(kernel_size=(2, 2), stride=(2, 2), padding='SAME', name=layer_name))
+                layer_list.append(MaxPool2d(kernel_size=(2, 2), stride=(2, 2), padding='SAME', name=layer_name, data_format='channels_first'))
             elif layer_group == 'O':
                 layer_list.append(Linear(out_features=1000, in_features=4096, name=layer_name))
             elif layer_group == 'F':
@@ -175,6 +175,10 @@ def restore_model(model, layer_type):
             if len(model.all_weights) == len(weights):
                 break
     # assign weight values
+    if tlx.BACKEND != 'tensorflow':
+        for i in range(len(weights)):
+            if len(weights[i].shape) == 4:
+                weights[i] = np.transpose(weights[i], axes=[3, 2, 0, 1])
     assign_weights(weights, model)
     del weights