import os
import sys
import logging

os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' 
logging.disable(sys.maxsize)

import numpy as np

from ensign.cp_decomp import cp_als, write_cp_decomp_dir

import tensorflow as tf
from tensorflow.keras import datasets, utils, applications, models, layers, activations, optimizers, callbacks

import tensorflow_model_optimization as tfmot

MEM_LIMIT_GB = 100


def decompose_kernel(weights, rank, cutoff=1e-8, max_iter=100, directory=None):
    '''
    Wrapper for cp_als. Takes convolution kernel, creates sptensor file, decomposes, and cleans up.
    '''
    shape = weights.shape
    tensor = []
    prods = [np.prod(shape[i:]) for i in range(len(shape))] + [1]
    for i in range(prods[0]):
        idx = ()
        for d in prods[1:]:
            n = i // d
            idx += (n,)
            i -= n * d
        value = weights[idx]
        if np.abs(value) > cutoff:
            tensor.append(list(idx) + [value])

    out = open('tensor_data.txt', 'w')
    out.write('sptensor\n' + str(len(shape)) + '\n' + ' '.join(map(str, shape)) + '\n' + str(len(tensor)) + '\n')
    for entry in tensor:
        out.write(' '.join(map(str, entry)) + '\n')
    out.close()
    
    decomp = cp_als('./tensor_data.txt', rank, max_iter=max_iter, mem_limit_gb=MEM_LIMIT_GB)

    if directory:
        write_cp_decomp_dir(directory, decomp, True)
        
    os.remove('tensor_data.txt')
    
    return decomp

def factorized_conv(decomp, input_shape, strides, padding, bias, set_weights=True):
    '''
    Takes a decomposition of a convolutional kernel and returns a factorized layer
    '''
    
    rank = decomp.rank
    n_dims = decomp.order - 2
    factors = decomp.factors
    weights = decomp.weights 
    
    input_layer = layers.Input(shape=input_shape)

    x = layers.Conv1D(filters=factors[-2].shape[1], kernel_size=1, use_bias=False)(input_layer)
    
    for i in range(n_dims):
        permute = list(range(1, n_dims + 2))
        d = permute.pop(i)
        permute.insert(-1, d)
        x = layers.Permute(tuple(permute))(x)
        
        x = layers.Conv1D(filters=factors[i].shape[1], 
                          kernel_size=factors[i].shape[0], 
                          strides=strides[i],
                          padding=padding,
                          groups=rank, 
                          use_bias=False)(x)
        
        permute = list(range(1, n_dims + 2))
        d = permute.pop(-2)
        permute.insert(i, d)
        x = layers.Permute(tuple(permute))(x)
        
    x = layers.Conv1D(filters=factors[-1].shape[0], kernel_size=1, use_bias=True)(x)

    fact_conv = models.Model(inputs=[input_layer], outputs=[x])

    if set_weights:
        fact_conv.layers[1].set_weights([np.expand_dims(factors[-2], axis=0)])
        for i in range(n_dims):
            fact_conv.layers[3 + 3 * i].set_weights([np.expand_dims(factors[i], axis=1)])
        fact_conv.layers[-1].set_weights([np.expand_dims((factors[-1]*weights).T, axis=0), bias])

    return fact_conv


def replace_layers(model, layers_to_replace, fact_convs):
    '''
    Takes a model and decomposed layers and returns a new model with those layers substituted
    '''
    if type(layers_to_replace) != list:
        layers_to_replace = [layers_to_replace]
    if type(fact_convs) != list:
        fact_convs = [fact_convs]
    
    node_inputs_map = {} # map from input nodes to the names of those nodes
    layer_outputs = {} # map from layer names to functional outputs
    
    for l in model.layers:
        for n in l.outbound_nodes:
            if n not in node_inputs_map:
                node_inputs_map[n] = [l.name]
            else:
                node_inputs_map[n].append(l.name)
    
    # input layer
    x = model.layers[0].output
    layer_outputs[model.layers[0].name] = x
    
    # other layers
    for i, l in enumerate(model.layers[1:], start=1):
        assert len(l.inbound_nodes) == 1
        inputs = [layer_outputs[name] for name in node_inputs_map[l.inbound_nodes[0]]]
        inputs = inputs[0] if len(inputs) == 1 else inputs
        
        if i in layers_to_replace:
            idx = layers_to_replace.index(i)
            x = fact_convs[idx](inputs)
        else:
            x = l(inputs)
            
        layer_outputs[l.name] = x
    
    fact_model = models.Model(inputs=[model.layers[0].input], outputs=[x])
    for l in fact_model.layers:
        l.trainable = True
            
    return fact_model


def compute_rank(w, b, r):
    return int((r * (np.prod(w.shape) + b.shape[0]) - b.shape[0]) / np.sum(w.shape))

def factorized_cnn(model, rank=0.5, layers_to_factorize=None, directory=None, set_weights=True):
    '''
    Takes a model and indices of layers to decompose and returns a model with those layers factorized
    '''
    
    if not layers_to_factorize:
        layers_to_factorize = []
        for i, l in enumerate(model.layers):
            if type(l) in [layers.Conv1D, layers.Conv2D, layers.Conv3D]:
                layers_to_factorize.append(i)
    elif type(layers_to_factorize) != list:
        layers_to_factorize = [layers_to_factorize]
    
    fact_convs = []
    ranks = []
    for i in layers_to_factorize:
        layer = model.layers[i]
        weights, bias = layer.get_weights()
        r = rank if type(rank) == int else compute_rank(weights, bias, rank)
        layer_dir = '{}/layer_{}'.format(directory, i) if directory else None
        max_iter = 100 if set_weights else 1
        decomp = decompose_kernel(weights, r, max_iter=max_iter, directory=layer_dir)
        fact_conv = factorized_conv(decomp, 
                                    layer.input_shape[1:], 
                                    layer.strides, 
                                    layer.padding, 
                                    bias,
                                    set_weights)
        fact_convs.append(fact_conv)
    
    fact_model = replace_layers(model, layers_to_factorize, fact_convs)
    
    return fact_model


''' Model '''
model_dir = 'resnet_cifar'
model = models.load_model(model_dir)
resnet = model.layers[0]

''' Data '''
(x_train, y_train), (x_test, y_test) = datasets.cifar10.load_data()

x_train = applications.resnet50.preprocess_input(x_train)
x_test = applications.resnet50.preprocess_input(x_test)

y_train = utils.to_categorical(y_train, 10)
y_test = utils.to_categorical(y_test, 10)

k = int(0.7 * len(x_test))
x_val = x_test[:k]
y_val = y_test[:k]

x_test = x_test[k:]
y_test = y_test[k:]


_, base_acc = model.evaluate(x_test, y_test)
base_n_param = resnet.count_params()
print('Parameters: {}'.format(base_n_param))

94/94 [==============================] - 3s 9ms/step - loss: 0.6994 - accuracy: 0.7937
Parameters: 23587712


%%capture

conv_layers = []
for i, l in enumerate(resnet.layers):
    if type(l) == layers.Conv2D:
        conv_layers.append(i)

rank = 32
fact_resnet = factorized_cnn(resnet, rank, conv_layers, 
                        directory='{}_fact_data_all'.format(model_dir))

fact_input = layers.Input(shape=(32, 32, 3,))
x = fact_resnet(fact_input)
for l in model.layers[1:]: # re-use classifier for decomposed ResNet
    x = l(x)
fact_model = models.Model(inputs=[fact_input], outputs=[x])
for l in fact_model.layers:
    l.trainable = True


%%capture
fact_model.compile(optimizer=optimizers.Adam(learning_rate=0.0001), 
                    loss='categorical_crossentropy', 
                    metrics=['acc'])
history = fact_model.fit(x_train, y_train, 
                         epochs=50, batch_size=128, 
                         validation_data=(x_val, y_val))
directory = 'fact_network'
fact_model.save(directory)


_, acc = fact_model.evaluate(x_test, y_test)
n_param = fact_resnet.count_params()
print('Parameters: {}'.format(n_param))

94/94 [==============================] - 2s 14ms/step - loss: 1.2780 - acc: 0.7867
Parameters: 1709536


n_param / base_n_param, acc / base_acc

(0.0724757026031181, 0.9911802147824977)

Tensor Decomposition for Neural Network Compression¶

Table of Contents¶

Layer Decomposition ¶

Network Surgery ¶

Network Compression Wrapper ¶

Application to ResNet-50 ¶

Model and Data¶

Decomposition¶

Fine-tuning¶

Key Takeaways ¶