add main scipts

Victoria BOURGEAIS
Commit bee5c1ab51869aa323166f2892554238c39dceba bee5c1ab 0 parents
Showing 2 changed files with 420 additions and 0 deletions
base_model.py
train.py
--- a/base_model.py 0 → 100644
View file @bee5c1a
+++ b/base_model.py 0 → 100644
View file @bee5c1a
+import numpy as np
+import tensorflow as tf
+
+FLAGS = tf.app.flags.FLAGS
+
+class BaseModel():
+
+    def __init__(self,X,n_input,n_classes,n_hidden_1,n_hidden_2,n_hidden_3,n_hidden_4,n_hidden_5,n_hidden_6,is_training,keep_prob):
+        self.X = X
+        self.n_input = n_input
+        self.is_training = is_training
+
+        #Hyperparameters
+        self.keep_prob = keep_prob # Dropout
+
+        self.n_classes=n_classes
+        self.n_hidden_1=n_hidden_1
+        self.n_hidden_2=n_hidden_2
+        self.n_hidden_3=n_hidden_3
+        self.n_hidden_4=n_hidden_4
+        self.n_hidden_5=n_hidden_5
+        self.n_hidden_6=n_hidden_6
+
+    def store_layer_weights_and_bias(self):
+        self.weights = {
+            'h1_w': tf.get_variable('W1', shape=(self.n_input, self.n_hidden_1), initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'h2_w': tf.get_variable('W2', shape=(self.n_hidden_1, self.n_hidden_2), initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'h3_w': tf.get_variable('W3', shape=(self.n_hidden_2, self.n_hidden_3), initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'h4_w': tf.get_variable('W4', shape=(self.n_hidden_3, self.n_hidden_4), initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'h5_w': tf.get_variable('W5', shape=(self.n_hidden_4, self.n_hidden_5), initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'h6_w': tf.get_variable('W6', shape=(self.n_hidden_5, self.n_hidden_6), initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'out_w': tf.get_variable('W_out',shape=(self.n_hidden_6, self.n_classes), initializer=tf.contrib.layers.variance_scaling_initializer())
+        }
+        self.biases = {
+            'h1_b': tf.get_variable('B1',shape=(self.n_hidden_1),initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'h2_b': tf.get_variable('B2',shape=(self.n_hidden_2),initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'h3_b': tf.get_variable('B3',shape=(self.n_hidden_3),initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'h4_b': tf.get_variable('B4',shape=(self.n_hidden_4),initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'h5_b': tf.get_variable('B5',shape=(self.n_hidden_5),initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'h6_b': tf.get_variable('B6',shape=(self.n_hidden_6),initializer=tf.contrib.layers.variance_scaling_initializer()),
+            'out_b': tf.get_variable('B_out',shape=(self.n_classes),initializer=tf.contrib.layers.variance_scaling_initializer())
+        }
+
+    def fc(self,input,weights,biases,name,dim):
+        h = tf.add(tf.matmul(input, weights), biases)
+        if FLAGS.bn:
+            h = tf.layers.batch_normalization(h,training=self.is_training,name='bn_'+name)
+        h = tf.nn.relu(h, name=name)
+        h = tf.nn.dropout(h, self.keep_prob)
+        return h
+
+    def net(self):  
+        self.h1 = self.fc(self.X,self.weights['h1_w'],self.biases['h1_b'],name='layer1',dim=self.n_hidden_1)
+        self.h2 = self.fc(self.h1,self.weights['h2_w'],self.biases['h2_b'],name='layer2',dim=self.n_hidden_2)
+        self.h3 = self.fc(self.h2, self.weights['h3_w'], self.biases['h3_b'],name='layer3',dim=self.n_hidden_3)
+        self.h4 = self.fc(self.h3,self.weights['h4_w'],self.biases['h4_b'],name='layer4',dim=self.n_hidden_4)
+        self.h5 = self.fc(self.h4,self.weights['h5_w'],self.biases['h5_b'],name='layer5',dim=self.n_hidden_5)
+        self.h6 = self.fc(self.h5, self.weights['h6_w'], self.biases['h6_b'],name='layer6',dim=self.n_hidden_6)
+        output_layer = tf.add(tf.matmul(self.h6, self.weights['out_w']), self.biases['out_b'],name='output')     
+        return output_layer
+
+    def __call__(self):
+        self.store_layer_weights_and_bias()
+        return self.net()
+        
--- a/train.py 0 → 100644
View file @bee5c1a
+++ b/train.py 0 → 100644
View file @bee5c1a
+import warnings
+import os
+import time
+import signal
+import sys
+import copy
+import h5py
+
+import pickle
+import random
+import seaborn
+import numpy as np
+import matplotlib.pyplot as plt
+import pandas as pd
+from sklearn import preprocessing
+from sklearn.model_selection import train_test_split
+from sklearn.utils import class_weight
+import tensorflow as tf
+from tensorflow.keras.utils import to_categorical
+from tqdm import tqdm
+
+# Configuration
+FLAGS = tf.app.flags.FLAGS 
+
+tf.app.flags.DEFINE_string('GPU_device', '/gpu:0', "GPU device")
+
+tf.app.flags.DEFINE_bool('save', False, "Do you need to save the trained model?")
+tf.app.flags.DEFINE_bool('restore', False, "Do you want to restore a previous trained model?")
+
+tf.app.flags.DEFINE_string('dir', "/nhome/siniac/vbourgeais/Documents/PhD/1ère année/Thèse/Interprétation", "dir")
+tf.app.flags.DEFINE_string('log_dir', "/nhome/siniac/vbourgeais/Documents/PhD/1ère année/Thèse/Interprétation/log", "log_dir")
+tf.app.flags.DEFINE_string('file_extension', "", "file_extension {sigmoid,softmax,without_bn}")
+tf.app.flags.DEFINE_string('dir_data', "/home/vbourgeais/Stage/data/MicroArray", "dir_data")
+tf.app.flags.DEFINE_string('temp_dir', "/nhome/siniac/vbourgeais/Documents/PhD/1ère année/Thèse/Interprétation", "temp_dir")
+tf.app.flags.DEFINE_integer('seed', 42, "initial random seed")
+
+#EVALUATION PART
+tf.app.flags.DEFINE_float('ref_value', 0.1, "value to test")
+tf.app.flags.DEFINE_string('ref_layer', "h1", "layer to analyze")
+tf.app.flags.DEFINE_string('ref_GO', "", "GO to examine")
+
+tf.app.flags.DEFINE_integer('display_step', 5, "when to print the performances")
+
+tf.app.flags.DEFINE_integer('batch_size', 2**9, "the number of examples in a batch")
+tf.app.flags.DEFINE_integer('EPOCHS', 20, "the number of epochs for training")
+
+tf.app.flags.DEFINE_integer('epoch_decay_start', 100, "epoch of starting learning rate decay")
+tf.app.flags.DEFINE_bool('early_stopping', False, "early_stopping")
+
+tf.app.flags.DEFINE_integer('n_input', 54675, "number of features")
+tf.app.flags.DEFINE_integer('n_classes', 1, "number of classes")
+tf.app.flags.DEFINE_integer('n_layers', 6, "number of layers")
+tf.app.flags.DEFINE_integer('n_hidden_1', 1574, "number of nodes for the first hidden layer") #Level 7
+tf.app.flags.DEFINE_integer('n_hidden_2', 1386, "number of nodes for the second hidden layer") #Level 6
+tf.app.flags.DEFINE_integer('n_hidden_3', 951, "number of nodes for the third hidden layer") #Level 5
+tf.app.flags.DEFINE_integer('n_hidden_4', 515, "number of nodes for the fourth hidden layer") #Level 4
+tf.app.flags.DEFINE_integer('n_hidden_5', 255, "number of nodes for the fifth hidden layer") #Level 3
+tf.app.flags.DEFINE_integer('n_hidden_6', 90, "number of nodes for the sixth hidden layer") #Level 2
+
+tf.app.flags.DEFINE_float('learning_rate', 0.001, "initial learning rate")
+tf.app.flags.DEFINE_bool('bn', False, "BN use")
+tf.app.flags.DEFINE_bool('is_training', True, "Is it trainable?")
+tf.app.flags.DEFINE_float('keep_prob', 0.4, "probability for the dropout")
+tf.app.flags.DEFINE_string('type_training', 'LGO', "{"", LGO, L2, L1}")
+tf.app.flags.DEFINE_float('alpha', 1, "alpha")
+tf.app.flags.DEFINE_bool('weighted_loss', False, "balance the data in the total loss")
+tf.app.flags.DEFINE_string('lr_method', 'adam', "{adam, momentum, adagrad, rmsprop}")
+
+from base_model import BaseModel
+
+def l1_loss_func(x):
+    return tf.reduce_sum(tf.math.abs(x)) 
+
+def l2_loss_func(x):
+    return tf.reduce_sum(tf.square(x))
+
+
+def train(save_dir):
+
+    warnings.filterwarnings("ignore")
+    os.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"
+    os.environ["CUDA_VISIBLE_DEVICES"]=FLAGS.GPU_device[len(FLAGS.GPU_device)-1]
+    os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' 
+
+    # Load the files useful
+    print("Loading the connexion matrix...")
+    start = time.time()
+
+    adj_matrix = pd.read_csv(os.path.join(FLAGS.dir,"adj_matrix_cropped.csv"),index_col=0)
+    first_matrix_connection = pd.read_csv(os.path.join(FLAGS.dir,"first_matrix_connection_GO.csv"),index_col=0)
+    csv_go = pd.read_csv(os.path.join(FLAGS.dir,"go_level_v2.csv"),index_col=0)
+
+    connexion_matrix = []
+    connexion_matrix.append(np.array(first_matrix_connection.values,dtype=np.float32))
+    connexion_matrix.append(np.array(adj_matrix.loc[csv_go[str(7)].loc[lambda x: x==1].index,csv_go[str(6)].loc[lambda x: x==1].index].values,dtype=np.float32))
+    connexion_matrix.append(np.array(adj_matrix.loc[csv_go[str(6)].loc[lambda x: x==1].index,csv_go[str(5)].loc[lambda x: x==1].index].values,dtype=np.float32))
+    connexion_matrix.append(np.array(adj_matrix.loc[csv_go[str(5)].loc[lambda x: x==1].index,csv_go[str(4)].loc[lambda x: x==1].index].values,dtype=np.float32))
+    connexion_matrix.append(np.array(adj_matrix.loc[csv_go[str(4)].loc[lambda x: x==1].index,csv_go[str(3)].loc[lambda x: x==1].index].values,dtype=np.float32))
+    connexion_matrix.append(np.array(adj_matrix.loc[csv_go[str(3)].loc[lambda x: x==1].index,csv_go[str(2)].loc[lambda x: x==1].index].values,dtype=np.float32))
+    connexion_matrix.append(np.ones((FLAGS.n_hidden_6, FLAGS.n_classes),dtype=np.float32))
+
+    end = time.time()
+    elapsed=end - start
+    print("Total time: {}h {}min {}sec".format(time.gmtime(elapsed).tm_hour,
+    time.gmtime(elapsed).tm_min,
+    time.gmtime(elapsed).tm_sec))
+
+    # Load the data
+    print("Loading the data...")
+    start = time.time()
+    loaded = np.load(os.path.join(FLAGS.dir_data,"X_train.npz"))
+    X_train = loaded['x']
+
+    y_train = loaded['y']
+    if FLAGS.n_classes>=2:
+        y_train=to_categorical(y_train)
+
+    loaded = np.load(os.path.join(FLAGS.dir_data,"X_test.npz"))
+    X_test = loaded['x']
+    y_test = loaded['y']
+    if FLAGS.n_classes>=2:
+        y_test=to_categorical(y_test)
+
+        
+
+    end = time.time()
+    elapsed=end - start
+    print("Total time: {}h {}min {}sec".format(time.gmtime(elapsed).tm_hour,
+    time.gmtime(elapsed).tm_min,
+    time.gmtime(elapsed).tm_sec))
+
+
+    # Launch the model
+    print("Launch the learning with the "+FLAGS.type_training)
+    if FLAGS.type_training != "baseline":
+        print("for ALPHA={}".format(FLAGS.alpha))
+
+    tf.reset_default_graph() 
+
+   
+    #Inputs of the model
+    X = tf.placeholder(tf.float32, shape=[None, FLAGS.n_input])
+    Y = tf.placeholder(tf.float32, shape=[None, FLAGS.n_classes])
+
+    #Hyperparameters
+    is_training = tf.placeholder(tf.bool,name="is_training") #batch Norm
+    learning_rate = tf.placeholder(tf.float32, name="learning_rate")
+    keep_prob = tf.placeholder(tf.float32, name="keep_prob") # Dropout
+    total_batches=len(X_train)//FLAGS.batch_size
+
+    network=BaseModel(X=X,n_input=FLAGS.n_input,n_classes=FLAGS.n_classes,
+        n_hidden_1=FLAGS.n_hidden_1,n_hidden_2=FLAGS.n_hidden_2,n_hidden_3=FLAGS.n_hidden_3,n_hidden_4=FLAGS.n_hidden_4,
+        n_hidden_5=FLAGS.n_hidden_5,n_hidden_6=FLAGS.n_hidden_6,keep_prob=keep_prob,is_training=is_training)
+    #here we can compute the model both for l2 custom and no-custom
+
+    pred = network()
+
+    #Compute the average of the loss across all the dimensions
+    if FLAGS.weighted_loss:
+        ce_loss = tf.reduce_mean(tf.nn.weighted_cross_entropy_with_logits(logits=pred, targets=Y,pos_weight=class_weights[1]))
+    else:
+        ce_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=pred, labels=Y))
+    
+    additional_loss = 0
+    if FLAGS.type_training=="LGO":
+        for idx,weight in enumerate(network.weights.values()):
+            additional_loss+=l2_loss_func(weight*(1-connexion_matrix[idx]))
+    elif FLAGS.type_training=="L2" :
+        for weight in network.weights.values():
+            additional_loss += l2_loss_func(weight)
+    elif FLAGS.type_training=="L1" :
+        for idx,weight in enumerate(network.weights.values()):
+            additional_loss+=l1_loss_func(weight)
+    
+
+    norm_no_go_connexions=0
+    norm_go_connexions=0
+    for idx,weight in enumerate(list(network.weights.values())[:-1]):
+        norm_no_go_connexions+=tf.norm((weight*(1-connexion_matrix[idx])),ord=1)/np.count_nonzero(1-connexion_matrix[idx])
+        norm_go_connexions+=tf.norm((weight*connexion_matrix[idx]),ord=1)/np.count_nonzero(connexion_matrix[idx])
+    norm_no_go_connexions/=FLAGS.n_layers
+    norm_go_connexions/=FLAGS.n_layers
+    
+    if FLAGS.type_training!='' :
+        total_loss = ce_loss + FLAGS.alpha*additional_loss
+    else:
+        total_loss = ce_loss
+
+    #optimizer
+    with tf.control_dependencies(tf.get_collection(tf.GraphKeys.UPDATE_OPS)):
+        if FLAGS.lr_method=="adam":
+            trainer = tf.train.AdamOptimizer(learning_rate = learning_rate)
+        elif FLAGS.lr_method=="momentum":
+            trainer = tf.train.MomentumOptimizer(learning_rate = learning_rate, momentum=0.09, use_nesterov=True)
+        elif FLAGS.lr_method=="adagrad":
+            trainer = tf.train.AdagradOptimizer(learning_rate=learning_rate)
+        elif FLAGS.lr_method=="rmsprop":
+            trainer = tf.train.RMSPropOptimizer(learning_rate = learning_rate)
+        optimizer = trainer.minimize(total_loss)
+
+    if FLAGS.n_classes>=2:
+        correct_prediction = tf.equal(tf.argmax(pred,1), tf.argmax(Y, 1))
+    else:
+        sig_pred=tf.nn.sigmoid(pred)
+        sig_pred=tf.cast(sig_pred>0.5,dtype=tf.int64)
+        ground_truth=tf.cast(Y,dtype=tf.int64)
+        correct_prediction = tf.equal(sig_pred,ground_truth)
+
+    #Calculate the accuracy across all the given batch and average them out. 
+    accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))  
+
+    # Initializing the variables
+    init = tf.global_variables_initializer()
+
+    config = tf.ConfigProto(log_device_placement=False,allow_soft_placement=True)
+    #config.gpu_options.allow_growth = True, log_device_placement=True
+                #to use the tensorboard
+
+    if FLAGS.save or FLAGS.restore : saver = tf.train.Saver()
+
+    start = time.time()
+
+    with tf.device(FLAGS.GPU_device):
+        with tf.Session(config=config) as sess: 
+            sess.run(init)
+
+            train_c_accuracy=[]
+            train_c_total_loss=[]
+
+            test_c_accuracy=[]
+            test_c_total_loss=[]
+
+            c_l1_norm_go=[]
+            c_l1_norm_no_go=[]
+
+            if FLAGS.type_training!="":
+                test_c_ce_loss=[]
+                test_c_additional_loss=[]
+                train_c_ce_loss=[]
+                train_c_additional_loss=[]
+
+            for epoch in tqdm(np.arange(0,FLAGS.EPOCHS)):
+
+                index = np.arange(X_train.shape[0])
+                np.random.shuffle(index)
+                batch_X = np.array_split(X_train[index], total_batches)
+                batch_Y = np.array_split(y_train[index], total_batches)
+
+                # Optimization
+                for batch in range(total_batches):
+                    batch_x,batch_y=batch_X[batch],batch_Y[batch]
+                    sess.run(optimizer, feed_dict={X: batch_x,Y: batch_y,is_training:FLAGS.is_training,keep_prob:FLAGS.keep_prob,learning_rate:FLAGS.learning_rate})
+
+                if ((epoch+1) % FLAGS.display_step == 0) or (epoch==0) :
+                    if not((FLAGS.display_step==FLAGS.EPOCHS) and (epoch==0)):
+                        # Calculate batch loss and accuracy after an epoch on the train and validation set
+                        avg_cost,avg_acc,l1_norm_no_go,l1_norm_go = sess.run([total_loss, accuracy,norm_no_go_connexions,norm_go_connexions], feed_dict={X: X_train,Y: y_train,
+                                                               is_training:False,keep_prob:1.0})
+                        train_c_total_loss.append(avg_cost)
+                        train_c_accuracy.append(avg_acc)
+                        c_l1_norm_go.append(l1_norm_go)
+                        c_l1_norm_no_go.append(l1_norm_no_go)
+
+                        if FLAGS.type_training!="":
+                            avg_ce_loss,avg_additional_loss= sess.run([ce_loss, additional_loss], feed_dict={X: X_train,Y: y_train,is_training:False,keep_prob:1.0})
+                            train_c_additional_loss.append(avg_additional_loss)
+                            train_c_ce_loss.append(avg_ce_loss)
+
+                        avg_cost,avg_acc = sess.run([total_loss, accuracy], feed_dict={X: X_test,Y: y_test,is_training:False,keep_prob:1.0})
+                        test_c_total_loss.append(avg_cost)
+                        test_c_accuracy.append(avg_acc)
+
+                        if FLAGS.type_training!="": 
+                            avg_ce_loss,avg_additional_loss= sess.run([ce_loss, additional_loss], feed_dict={X: X_test,Y: y_test,is_training:False,keep_prob:1.0})
+                            test_c_additional_loss.append(avg_additional_loss)
+                            test_c_ce_loss.append(avg_ce_loss)                
+
+                        current_idx=len(train_c_total_loss)-1                   
+                        print('| Epoch: {}/{} | Train: Loss {:.6f} Accuracy : {:.6f} '\
+                        '| Test: Loss {:.6f} Accuracy : {:.6f}\n'.format(
+                        epoch+1, FLAGS.EPOCHS,train_c_total_loss[current_idx], train_c_accuracy[current_idx],test_c_total_loss[current_idx],test_c_accuracy[current_idx]))
+
+            if FLAGS.save: saver.save(sess=sess, save_path=os.path.join(save_dir,"model"))
+
+    end = time.time()
+    elapsed=end - start
+    print("Total time: {}h {}min {}sec ".format(time.gmtime(elapsed).tm_hour,
+    time.gmtime(elapsed).tm_min,
+    time.gmtime(elapsed).tm_sec))   
+
+    performances = {
+                    'type_training': FLAGS.type_training,
+                    'total_loss':train_c_total_loss,'test_total_loss':test_c_total_loss,
+                    'acc':train_c_accuracy,'test_acc':test_c_accuracy
+                }
+
+    performances['norm_go']=c_l1_norm_go
+    performances['norm_no_go']=c_l1_norm_no_go
+
+    if FLAGS.type_training!="baseline":      
+        performances['additional_loss']=train_c_additional_loss
+        performances['test_additional_loss']=test_c_additional_loss
+        performances['ce_loss']=train_c_ce_loss
+        performances['test_ce_loss']=test_c_ce_loss
+
+
+    return performances
+
+
+def main(_):
+
+    save_dir=os.path.join(FLAGS.log_dir,'MLP_DP={}_BN={}_EPOCHS={}_OPT={}'.format(FLAGS.keep_prob,FLAGS.bn,FLAGS.EPOCHS,FLAGS.lr_method))
+
+    if FLAGS.type_training=="LGO" :
+        save_dir=save_dir+'_LGO_ALPHA={}{}'.format(FLAGS.alpha,FLAGS.file_extension)
+    elif FLAGS.type_training=="L2" :
+        save_dir=save_dir+'_L2_ALPHA={}{}'.format(FLAGS.alpha,FLAGS.file_extension)
+    elif FLAGS.type_training=="" :
+        save_dir=save_dir+'_{}'.format(FLAGS.file_extension)
+    elif FLAGS.type_training=="L1" :
+        save_dir=save_dir+'_L1_ALPHA={}{}'.format(FLAGS.alpha,FLAGS.file_extension)
+
+    if FLAGS.is_training:
+
+        start_full = time.time()
+        
+        if not(os.path.isdir(save_dir)):
+            os.mkdir(save_dir)
+
+        performances=train(save_dir=save_dir)   
+
+        with open(os.path.join(save_dir,"histories.txt"), "wb") as fp:
+            #Pickling
+            pickle.dump(performances, fp)
+
+        end = time.time()
+        elapsed =end - start_full
+        print("Total time full process: {}h {}min {}sec".format(time.gmtime(elapsed).tm_hour,
+        time.gmtime(elapsed).tm_min,
+        time.gmtime(elapsed).tm_sec))
+    else:
+
+        # ---------------------------------TO MODIFY :------------------------------
+
+        start_full = time.time()
+        evaluate(save_dir=save_dir,ref_layer="h{}".format(1)) #TO DEFINE
+        end = time.time()
+        elapsed =end - start_full
+        print("Total time full process: {}h {}min {}sec".format(time.gmtime(elapsed).tm_hour,
+        time.gmtime(elapsed).tm_min,
+        time.gmtime(elapsed).tm_sec))
+
+
+if __name__ == "__main__":
+    tf.app.run()
\ No newline at end of file