class UnetResBlock(layers.Layer):
def __init__(self, spatial_dims, in_channels, out_channels, ...):
super().__init__()
# Main conv layers
self.conv1 = Convolution(...)
self.conv2 = Convolution(...)
self.norm1 = ...
self.norm2 = ...
# Residual path layers will be created in build()
self.res_conv = None
self.res_norm = None
def build(self, input_shape):
in_channels = input_shape[-1]
if in_channels != self.out_channels:
self.res_conv = Convolution(
in_channels=in_channels,
out_channels=self.out_channels,
kernel_size=1,
strides=self.stride,
)
self.res_norm = layers.BatchNormalization()
super().build(input_shape)
def call(self, x, training=False):
out = self.conv1(x, training=training)
...
if self.res_conv is not None:
x = self.res_conv(x, training=training)
Мой вопрос:
Я использую build(), чтобы отложить создание res_conv и res_norm до тех пор, пока я не узнаю входную форму, поскольку остаточному пути может потребоваться свертка 1x1 для сопоставления каналов.
Это подходящее использование build()?
Или build() предназначен только для отсрочки создания веса для текущего слоя, а создание подслоев здесь может привести к неожиданному поведению?
Есть ли какие-либо подводные камни при создании новых слоев в build() по сравнению с __init__?
Я реализую остаточный блок в стиле U-Net в Keras: [code]class UnetResBlock(layers.Layer): def __init__(self, spatial_dims, in_channels, out_channels, ...): super().__init__() # Main conv layers self.conv1 = Convolution(...) self.conv2 = Convolution(...) self.norm1 = ... self.norm2 = ... # Residual path layers will be created in build() self.res_conv = None self.res_norm = None
def call(self, x, training=False): out = self.conv1(x, training=training) ... if self.res_conv is not None: x = self.res_conv(x, training=training) [/code] Мой вопрос: Я использую build(), чтобы [b]отложить создание res_conv и res_norm до тех пор, пока я не узнаю входную форму[/b], поскольку остаточному пути может потребоваться свертка 1x1 для сопоставления каналов. [list] [*]Это [b]подходящее использование build()[/b]?
[*]Или build() предназначен [b]только для отсрочки создания веса для текущего слоя[/b], а создание подслоев здесь может привести к неожиданному поведению?
[*]Есть ли какие-либо подводные камни при создании новых слоев в build() по сравнению с __init__?