naswot/models/clone_weights.py

import torch
import torch.nn as nn


def copy_conv(module, init):
  assert isinstance(module, nn.Conv2d), 'invalid module : {:}'.format(module)
  assert isinstance(init  , nn.Conv2d), 'invalid module : {:}'.format(init)
  new_i, new_o = module.in_channels, module.out_channels
  module.weight.copy_( init.weight.detach()[:new_o, :new_i] )
  if module.bias is not None:
    module.bias.copy_( init.bias.detach()[:new_o] )

def copy_bn  (module, init):
  assert isinstance(module, nn.BatchNorm2d), 'invalid module : {:}'.format(module)
  assert isinstance(init  , nn.BatchNorm2d), 'invalid module : {:}'.format(init)
  num_features = module.num_features
  if module.weight is not None:
    module.weight.copy_( init.weight.detach()[:num_features] )
  if module.bias is not None:
    module.bias.copy_( init.bias.detach()[:num_features] )
  if module.running_mean is not None:
    module.running_mean.copy_( init.running_mean.detach()[:num_features] )
  if module.running_var  is not None:
    module.running_var.copy_( init.running_var.detach()[:num_features] )

def copy_fc  (module, init):
  assert isinstance(module, nn.Linear), 'invalid module : {:}'.format(module)
  assert isinstance(init  , nn.Linear), 'invalid module : {:}'.format(init)
  new_i, new_o = module.in_features, module.out_features
  module.weight.copy_( init.weight.detach()[:new_o, :new_i] )
  if module.bias is not None:
    module.bias.copy_( init.bias.detach()[:new_o] )

def copy_base(module, init):
  assert type(module).__name__ in ['ConvBNReLU', 'Downsample'], 'invalid module : {:}'.format(module)
  assert type(  init).__name__ in ['ConvBNReLU', 'Downsample'], 'invalid module : {:}'.format(  init)
  if module.conv is not None:
    copy_conv(module.conv, init.conv)
  if module.bn is not None:
    copy_bn  (module.bn, init.bn)

def copy_basic(module, init):
  copy_base(module.conv_a, init.conv_a)
  copy_base(module.conv_b, init.conv_b)
  if module.downsample is not None:
    if init.downsample is not None:
      copy_base(module.downsample, init.downsample)
    #else:
    # import pdb; pdb.set_trace()


def init_from_model(network, init_model):
  with torch.no_grad():
    copy_fc(network.classifier, init_model.classifier)
    for base, target in zip(init_model.layers, network.layers):
      assert type(base).__name__  == type(target).__name__, 'invalid type : {:} vs {:}'.format(base, target)
      if type(base).__name__ == 'ConvBNReLU':
        copy_base(target, base)
      elif type(base).__name__ == 'ResNetBasicblock':
        copy_basic(target, base)
      else:
        raise ValueError('unknown type name : {:}'.format( type(base).__name__ ))
Initial commit 2020-06-03 13:59:01 +02:00			`import torch`
			`import torch.nn as nn`


			`def copy_conv(module, init):`
			`assert isinstance(module, nn.Conv2d), 'invalid module : {:}'.format(module)`
			`assert isinstance(init , nn.Conv2d), 'invalid module : {:}'.format(init)`
			`new_i, new_o = module.in_channels, module.out_channels`
			`module.weight.copy_( init.weight.detach()[:new_o, :new_i] )`
			`if module.bias is not None:`
			`module.bias.copy_( init.bias.detach()[:new_o] )`

			`def copy_bn (module, init):`
			`assert isinstance(module, nn.BatchNorm2d), 'invalid module : {:}'.format(module)`
			`assert isinstance(init , nn.BatchNorm2d), 'invalid module : {:}'.format(init)`
			`num_features = module.num_features`
			`if module.weight is not None:`
			`module.weight.copy_( init.weight.detach()[:num_features] )`
			`if module.bias is not None:`
			`module.bias.copy_( init.bias.detach()[:num_features] )`
			`if module.running_mean is not None:`
			`module.running_mean.copy_( init.running_mean.detach()[:num_features] )`
			`if module.running_var is not None:`
			`module.running_var.copy_( init.running_var.detach()[:num_features] )`

			`def copy_fc (module, init):`
			`assert isinstance(module, nn.Linear), 'invalid module : {:}'.format(module)`
			`assert isinstance(init , nn.Linear), 'invalid module : {:}'.format(init)`
			`new_i, new_o = module.in_features, module.out_features`
			`module.weight.copy_( init.weight.detach()[:new_o, :new_i] )`
			`if module.bias is not None:`
			`module.bias.copy_( init.bias.detach()[:new_o] )`

			`def copy_base(module, init):`
			`assert type(module).__name__ in ['ConvBNReLU', 'Downsample'], 'invalid module : {:}'.format(module)`
			`assert type( init).__name__ in ['ConvBNReLU', 'Downsample'], 'invalid module : {:}'.format( init)`
			`if module.conv is not None:`
			`copy_conv(module.conv, init.conv)`
			`if module.bn is not None:`
			`copy_bn (module.bn, init.bn)`

			`def copy_basic(module, init):`
			`copy_base(module.conv_a, init.conv_a)`
			`copy_base(module.conv_b, init.conv_b)`
			`if module.downsample is not None:`
			`if init.downsample is not None:`
			`copy_base(module.downsample, init.downsample)`
			`#else:`
			`# import pdb; pdb.set_trace()`


			`def init_from_model(network, init_model):`
			`with torch.no_grad():`
			`copy_fc(network.classifier, init_model.classifier)`
			`for base, target in zip(init_model.layers, network.layers):`
			`assert type(base).__name__ == type(target).__name__, 'invalid type : {:} vs {:}'.format(base, target)`
			`if type(base).__name__ == 'ConvBNReLU':`
			`copy_base(target, base)`
			`elif type(base).__name__ == 'ResNetBasicblock':`
			`copy_basic(target, base)`
			`else:`
			`raise ValueError('unknown type name : {:}'.format( type(base).__name__ ))`