Add code to train plaintext MNIST model with approximate activation

WIP for NN Inference Task, see issue #11
MarbleHE · Aug 4, 2020 · 59bb416 · 59bb416
1 parent 0ddaf3e
commit 59bb416
Show file tree

Hide file tree

Showing 3 changed files with 186 additions and 0 deletions.
diff --git a/scripts/models/mnist/.gitignore b/scripts/models/mnist/.gitignore
@@ -0,0 +1,5 @@
+**/virt
+**/logs
+**/data
+**/model
+**/.idea
diff --git a/scripts/models/mnist/LeNet-5-large.py b/scripts/models/mnist/LeNet-5-large.py
@@ -0,0 +1,174 @@
+import gzip
+import os
+from time import time
+import os.path
+import errno
+
+from six.moves import urllib
+import numpy as np
+import tensorflow.compat.v1 as tf
+import tensorflow.keras.layers as layers
+from tensorflow.keras import utils
+from tensorflow.keras.preprocessing.image import ImageDataGenerator
+from tensorflow.keras.callbacks import TensorBoard
+from tensorflow.keras.layers import Layer
+from tensorflow.keras import backend as K
+from sklearn.model_selection import train_test_split
+
+# CVDF mirror of http://yann.lecun.com/exdb/mnist/
+SOURCE_URL = 'https://storage.googleapis.com/cvdf-datasets/mnist/'
+WORK_DIRECTORY = 'data'
+BATCH_SIZE = 64
+NUM_EPOCHS = 10
+
+
+def maybe_download(filename):
+    """Download the data from Yann's website, unless it's already here."""
+    if not tf.gfile.Exists(WORK_DIRECTORY):
+        tf.gfile.MakeDirs(WORK_DIRECTORY)
+    filepath = os.path.join(WORK_DIRECTORY, filename)
+    if not tf.gfile.Exists(filepath):
+        filepath, _ = urllib.request.urlretrieve(SOURCE_URL + filename, filepath)
+        with tf.gfile.GFile(filepath) as f:
+            size = f.size()
+        print('Successfully downloaded', filename, size, 'bytes.')
+    return filepath
+
+
+def read_mnist(images_path: str, labels_path: str):
+    with gzip.open(labels_path, 'rb') as labelsFile:
+        labels = np.frombuffer(labelsFile.read(), dtype=np.uint8, offset=8)
+
+    with gzip.open(images_path, 'rb') as imagesFile:
+        length = len(labels)
+        # Load flat 28x28 px images (784 px), and convert them to 28x28 px
+        features = np.frombuffer(imagesFile.read(), dtype=np.uint8, offset=16) \
+            .reshape(length, 784) \
+            .reshape(length, 28, 28, 1)
+        # Normalize Data to [-0.5, 0.5]
+        features = features / 255 - 0.5
+
+    return features, labels
+
+
+class PolyAct(Layer):
+    def __init__(self, **kwargs):
+        super(PolyAct, self).__init__(**kwargs)
+
+    def build(self, input_shape):
+        self.coeff = self.add_weight('coeff', shape=(2, 1), initializer="random_normal", trainable=True, )
+
+    def call(self, inputs):
+        return self.coeff[1] * K.square(inputs) + self.coeff[0] * inputs
+
+    def compute_output_shape(self, input_shape):
+        return input_shape
+
+
+# Taken from https://stackoverflow.com/a/600612/119527
+def mkdir_p(path):
+    try:
+        os.makedirs(path)
+    except OSError as exc:  # Python >2.5
+        if exc.errno == errno.EEXIST and os.path.isdir(path):
+            pass
+        else:
+            raise
+
+# Taken from https://stackoverflow.com/a/23794010/2227414
+def safe_open_w(path):
+    ''' Open "path" for writing, creating any parent directories as needed.
+    '''
+    mkdir_p(os.path.dirname(path))
+    return open(path, 'w')
+
+
+def main():
+    # Get the data.
+    train_data_filename = maybe_download('train-images-idx3-ubyte.gz')
+    train_labels_filename = maybe_download('train-labels-idx1-ubyte.gz')
+    test_data_filename = maybe_download('t10k-images-idx3-ubyte.gz')
+    test_labels_filename = maybe_download('t10k-labels-idx1-ubyte.gz')
+
+    # Extract the data
+    train, test, validation = {}, {}, {}
+    train['features'], train['labels'] = read_mnist('data/train-images-idx3-ubyte.gz',
+                                                    'data/train-labels-idx1-ubyte.gz')
+    test['features'], test['labels'] = read_mnist('data/t10k-images-idx3-ubyte.gz', 'data/t10k-labels-idx1-ubyte.gz')
+    train['features'], validation['features'], train['labels'], validation['labels'] = train_test_split(
+        train['features'], train['labels'], test_size=0.2, random_state=0)
+
+    # Define the model
+    model = tf.keras.Sequential()
+
+    approx = True
+
+    if approx:
+        internal_activation = None
+        add_activation_layer = lambda x: x.add(PolyAct())
+        pool = layers.AvgPool2D
+    else:
+        internal_activation = 'relu'
+        add_activation_layer = lambda _: None
+        pool = layers.MaxPool2D
+
+    model.add(layers.Conv2D(filters=32, kernel_size=(5, 5), input_shape=(28, 28, 1), padding='same',
+                            use_bias=True, activation=internal_activation))
+    add_activation_layer(model)
+    model.add(pool(pool_size=(2, 2), padding='same'))
+
+    model.add(
+        layers.Conv2D(filters=64, kernel_size=(5, 5), padding='same', use_bias=True, activation=internal_activation))
+    add_activation_layer(model)
+    model.add(pool(pool_size=(2, 2), padding='same'))
+
+    model.add(layers.Flatten())
+
+    model.add(layers.Dense(units=512, use_bias=True, activation=internal_activation))
+    add_activation_layer(model)
+
+    model.add(layers.Dropout(rate=0.5))
+
+    # TODO: How did EVA/CHET handle the final softmax?
+    model.add(layers.Dense(units=10, activation='softmax', use_bias=True))
+
+    # Model Summary
+    model.summary()
+
+    # Compile Model
+    model.compile(loss=tf.keras.losses.categorical_crossentropy, optimizer='ADAM', metrics=['accuracy'])
+
+    x_train, y_train = train['features'], utils.to_categorical(train['labels'])
+    x_validation, y_validation = validation['features'], utils.to_categorical(validation['labels'])
+
+    train_generator = ImageDataGenerator().flow(x_train, y_train, batch_size=BATCH_SIZE)
+    validation_generator = ImageDataGenerator().flow(x_validation, y_validation, batch_size=BATCH_SIZE)
+
+    print('# of training images:', train['features'].shape[0])
+    print('# of validation images:', validation['features'].shape[0])
+
+    steps_per_epoch = x_train.shape[0] // BATCH_SIZE
+    validation_steps = x_validation.shape[0] // BATCH_SIZE
+
+    model.fit_generator(train_generator, steps_per_epoch=steps_per_epoch, epochs=NUM_EPOCHS,
+                        validation_data=validation_generator, validation_steps=validation_steps,
+                        shuffle=True, callbacks=[TensorBoard(log_dir="logs\\{}".format(time()))])
+
+    score = model.evaluate(test['features'], utils.to_categorical(test['labels']))
+    print('Test loss:', score[0])
+    print('Test accuracy:', score[1])
+
+    for idx, layer in enumerate(model.layers):
+        prefix = './model/' + "{:02d}_".format(idx) + layer.get_config()['name']
+        with safe_open_w(prefix + '_config.txt') as config:
+            config.write(str(layer.get_config()))
+        if layer.get_weights():
+            with safe_open_w(prefix + '_weights.txt') as weights:
+                weights.write(str(layer.get_weights()[0]))
+        if len(layer.get_weights()) > 1:
+            with safe_open_w(prefix + '_biases.txt') as biases:
+                biases.write(str(layer.get_weights()[1]))
+
+
+if __name__ == '__main__':
+    main()
diff --git a/scripts/models/mnist/requirements.txt b/scripts/models/mnist/requirements.txt
@@ -0,0 +1,7 @@
+six==1.15.0
+# If not using CUDA, use below:
+# tensorflow==1.15.3
+tensorflow-gpu==1.15.3
+numpy==1.19.1
+np_utils==1.19.1
+scikit-learn==0.32.1