add main scipts

Victoria BOURGEAIS
Commit bee5c1ab51869aa323166f2892554238c39dceba bee5c1ab 0 parents
Showing 2 changed files with 420 additions and 0 deletions
base_model.py
train.py
--- a/base_model.py 0 → 100644
View file @bee5c1a
+++ b/base_model.py 0 → 100644
View file @bee5c1a
+ import numpy as np
+ import tensorflow as tf
+ 
+ FLAGS = tf.app.flags.FLAGS
+ 
+ class BaseModel():
+ 
+     def __init__(self,X,n_input,n_classes,n_hidden_1,n_hidden_2,n_hidden_3,n_hidden_4,n_hidden_5,n_hidden_6,is_training,keep_prob):
+         self.X = X
+         self.n_input = n_input
+         self.is_training = is_training
+ 
+         #Hyperparameters
+         self.keep_prob = keep_prob # Dropout
+ 
+         self.n_classes=n_classes
+         self.n_hidden_1=n_hidden_1
+         self.n_hidden_2=n_hidden_2
+         self.n_hidden_3=n_hidden_3
+         self.n_hidden_4=n_hidden_4
+         self.n_hidden_5=n_hidden_5
+         self.n_hidden_6=n_hidden_6
+ 
+     def store_layer_weights_and_bias(self):
+         self.weights = {
+             'h1_w': tf.get_variable('W1', shape=(self.n_input, self.n_hidden_1), initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'h2_w': tf.get_variable('W2', shape=(self.n_hidden_1, self.n_hidden_2), initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'h3_w': tf.get_variable('W3', shape=(self.n_hidden_2, self.n_hidden_3), initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'h4_w': tf.get_variable('W4', shape=(self.n_hidden_3, self.n_hidden_4), initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'h5_w': tf.get_variable('W5', shape=(self.n_hidden_4, self.n_hidden_5), initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'h6_w': tf.get_variable('W6', shape=(self.n_hidden_5, self.n_hidden_6), initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'out_w': tf.get_variable('W_out',shape=(self.n_hidden_6, self.n_classes), initializer=tf.contrib.layers.variance_scaling_initializer())
+         }
+         self.biases = {
+             'h1_b': tf.get_variable('B1',shape=(self.n_hidden_1),initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'h2_b': tf.get_variable('B2',shape=(self.n_hidden_2),initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'h3_b': tf.get_variable('B3',shape=(self.n_hidden_3),initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'h4_b': tf.get_variable('B4',shape=(self.n_hidden_4),initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'h5_b': tf.get_variable('B5',shape=(self.n_hidden_5),initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'h6_b': tf.get_variable('B6',shape=(self.n_hidden_6),initializer=tf.contrib.layers.variance_scaling_initializer()),
+             'out_b': tf.get_variable('B_out',shape=(self.n_classes),initializer=tf.contrib.layers.variance_scaling_initializer())
+         }
+ 
+     def fc(self,input,weights,biases,name,dim):
+         h = tf.add(tf.matmul(input, weights), biases)
+         if FLAGS.bn:
+             h = tf.layers.batch_normalization(h,training=self.is_training,name='bn_'+name)
+         h = tf.nn.relu(h, name=name)
+         h = tf.nn.dropout(h, self.keep_prob)
+         return h
+ 
+     def net(self):  
+         self.h1 = self.fc(self.X,self.weights['h1_w'],self.biases['h1_b'],name='layer1',dim=self.n_hidden_1)
+         self.h2 = self.fc(self.h1,self.weights['h2_w'],self.biases['h2_b'],name='layer2',dim=self.n_hidden_2)
+         self.h3 = self.fc(self.h2, self.weights['h3_w'], self.biases['h3_b'],name='layer3',dim=self.n_hidden_3)
+         self.h4 = self.fc(self.h3,self.weights['h4_w'],self.biases['h4_b'],name='layer4',dim=self.n_hidden_4)
+         self.h5 = self.fc(self.h4,self.weights['h5_w'],self.biases['h5_b'],name='layer5',dim=self.n_hidden_5)
+         self.h6 = self.fc(self.h5, self.weights['h6_w'], self.biases['h6_b'],name='layer6',dim=self.n_hidden_6)
+         output_layer = tf.add(tf.matmul(self.h6, self.weights['out_w']), self.biases['out_b'],name='output')     
+         return output_layer
+ 
+     def __call__(self):
+         self.store_layer_weights_and_bias()
+         return self.net()
+         
--- a/train.py 0 → 100644
View file @bee5c1a
+++ b/train.py 0 → 100644
View file @bee5c1a
+ import warnings
+ import os
+ import time
+ import signal
+ import sys
+ import copy
+ import h5py
+ 
+ import pickle
+ import random
+ import seaborn
+ import numpy as np
+ import matplotlib.pyplot as plt
+ import pandas as pd
+ from sklearn import preprocessing
+ from sklearn.model_selection import train_test_split
+ from sklearn.utils import class_weight
+ import tensorflow as tf
+ from tensorflow.keras.utils import to_categorical
+ from tqdm import tqdm
+ 
+ # Configuration
+ FLAGS = tf.app.flags.FLAGS 
+ 
+ tf.app.flags.DEFINE_string('GPU_device', '/gpu:0', "GPU device")
+ 
+ tf.app.flags.DEFINE_bool('save', False, "Do you need to save the trained model?")
+ tf.app.flags.DEFINE_bool('restore', False, "Do you want to restore a previous trained model?")
+ 
+ tf.app.flags.DEFINE_string('dir', "/nhome/siniac/vbourgeais/Documents/PhD/1ère année/Thèse/Interprétation", "dir")
+ tf.app.flags.DEFINE_string('log_dir', "/nhome/siniac/vbourgeais/Documents/PhD/1ère année/Thèse/Interprétation/log", "log_dir")
+ tf.app.flags.DEFINE_string('file_extension', "", "file_extension {sigmoid,softmax,without_bn}")
+ tf.app.flags.DEFINE_string('dir_data', "/home/vbourgeais/Stage/data/MicroArray", "dir_data")
+ tf.app.flags.DEFINE_string('temp_dir', "/nhome/siniac/vbourgeais/Documents/PhD/1ère année/Thèse/Interprétation", "temp_dir")
+ tf.app.flags.DEFINE_integer('seed', 42, "initial random seed")
+ 
+ #EVALUATION PART
+ tf.app.flags.DEFINE_float('ref_value', 0.1, "value to test")
+ tf.app.flags.DEFINE_string('ref_layer', "h1", "layer to analyze")
+ tf.app.flags.DEFINE_string('ref_GO', "", "GO to examine")
+ 
+ tf.app.flags.DEFINE_integer('display_step', 5, "when to print the performances")
+ 
+ tf.app.flags.DEFINE_integer('batch_size', 2**9, "the number of examples in a batch")
+ tf.app.flags.DEFINE_integer('EPOCHS', 20, "the number of epochs for training")
+ 
+ tf.app.flags.DEFINE_integer('epoch_decay_start', 100, "epoch of starting learning rate decay")
+ tf.app.flags.DEFINE_bool('early_stopping', False, "early_stopping")
+ 
+ tf.app.flags.DEFINE_integer('n_input', 54675, "number of features")
+ tf.app.flags.DEFINE_integer('n_classes', 1, "number of classes")
+ tf.app.flags.DEFINE_integer('n_layers', 6, "number of layers")
+ tf.app.flags.DEFINE_integer('n_hidden_1', 1574, "number of nodes for the first hidden layer") #Level 7
+ tf.app.flags.DEFINE_integer('n_hidden_2', 1386, "number of nodes for the second hidden layer") #Level 6
+ tf.app.flags.DEFINE_integer('n_hidden_3', 951, "number of nodes for the third hidden layer") #Level 5
+ tf.app.flags.DEFINE_integer('n_hidden_4', 515, "number of nodes for the fourth hidden layer") #Level 4
+ tf.app.flags.DEFINE_integer('n_hidden_5', 255, "number of nodes for the fifth hidden layer") #Level 3
+ tf.app.flags.DEFINE_integer('n_hidden_6', 90, "number of nodes for the sixth hidden layer") #Level 2
+ 
+ tf.app.flags.DEFINE_float('learning_rate', 0.001, "initial learning rate")
+ tf.app.flags.DEFINE_bool('bn', False, "BN use")
+ tf.app.flags.DEFINE_bool('is_training', True, "Is it trainable?")
+ tf.app.flags.DEFINE_float('keep_prob', 0.4, "probability for the dropout")
+ tf.app.flags.DEFINE_string('type_training', 'LGO', "{"", LGO, L2, L1}")
+ tf.app.flags.DEFINE_float('alpha', 1, "alpha")
+ tf.app.flags.DEFINE_bool('weighted_loss', False, "balance the data in the total loss")
+ tf.app.flags.DEFINE_string('lr_method', 'adam', "{adam, momentum, adagrad, rmsprop}")
+ 
+ from base_model import BaseModel
+ 
+ def l1_loss_func(x):
+     return tf.reduce_sum(tf.math.abs(x)) 
+ 
+ def l2_loss_func(x):
+     return tf.reduce_sum(tf.square(x))
+ 
+ 
+ def train(save_dir):
+ 
+     warnings.filterwarnings("ignore")
+     os.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"
+     os.environ["CUDA_VISIBLE_DEVICES"]=FLAGS.GPU_device[len(FLAGS.GPU_device)-1]
+     os.environ['TF_CPP_MIN_LOG_LEVEL'] = '3' 
+ 
+     # Load the files useful
+     print("Loading the connexion matrix...")
+     start = time.time()
+ 
+     adj_matrix = pd.read_csv(os.path.join(FLAGS.dir,"adj_matrix_cropped.csv"),index_col=0)
+     first_matrix_connection = pd.read_csv(os.path.join(FLAGS.dir,"first_matrix_connection_GO.csv"),index_col=0)
+     csv_go = pd.read_csv(os.path.join(FLAGS.dir,"go_level_v2.csv"),index_col=0)
+ 
+     connexion_matrix = []
+     connexion_matrix.append(np.array(first_matrix_connection.values,dtype=np.float32))
+     connexion_matrix.append(np.array(adj_matrix.loc[csv_go[str(7)].loc[lambda x: x==1].index,csv_go[str(6)].loc[lambda x: x==1].index].values,dtype=np.float32))
+     connexion_matrix.append(np.array(adj_matrix.loc[csv_go[str(6)].loc[lambda x: x==1].index,csv_go[str(5)].loc[lambda x: x==1].index].values,dtype=np.float32))
+     connexion_matrix.append(np.array(adj_matrix.loc[csv_go[str(5)].loc[lambda x: x==1].index,csv_go[str(4)].loc[lambda x: x==1].index].values,dtype=np.float32))
+     connexion_matrix.append(np.array(adj_matrix.loc[csv_go[str(4)].loc[lambda x: x==1].index,csv_go[str(3)].loc[lambda x: x==1].index].values,dtype=np.float32))
+     connexion_matrix.append(np.array(adj_matrix.loc[csv_go[str(3)].loc[lambda x: x==1].index,csv_go[str(2)].loc[lambda x: x==1].index].values,dtype=np.float32))
+     connexion_matrix.append(np.ones((FLAGS.n_hidden_6, FLAGS.n_classes),dtype=np.float32))
+ 
+     end = time.time()
+     elapsed=end - start
+     print("Total time: {}h {}min {}sec".format(time.gmtime(elapsed).tm_hour,
+     time.gmtime(elapsed).tm_min,
+     time.gmtime(elapsed).tm_sec))
+ 
+     # Load the data
+     print("Loading the data...")
+     start = time.time()
+     loaded = np.load(os.path.join(FLAGS.dir_data,"X_train.npz"))
+     X_train = loaded['x']
+ 
+     y_train = loaded['y']
+     if FLAGS.n_classes>=2:
+         y_train=to_categorical(y_train)
+ 
+     loaded = np.load(os.path.join(FLAGS.dir_data,"X_test.npz"))
+     X_test = loaded['x']
+     y_test = loaded['y']
+     if FLAGS.n_classes>=2:
+         y_test=to_categorical(y_test)
+ 
+         
+ 
+     end = time.time()
+     elapsed=end - start
+     print("Total time: {}h {}min {}sec".format(time.gmtime(elapsed).tm_hour,
+     time.gmtime(elapsed).tm_min,
+     time.gmtime(elapsed).tm_sec))
+ 
+ 
+     # Launch the model
+     print("Launch the learning with the "+FLAGS.type_training)
+     if FLAGS.type_training != "baseline":
+         print("for ALPHA={}".format(FLAGS.alpha))
+ 
+     tf.reset_default_graph() 
+ 
+    
+     #Inputs of the model
+     X = tf.placeholder(tf.float32, shape=[None, FLAGS.n_input])
+     Y = tf.placeholder(tf.float32, shape=[None, FLAGS.n_classes])
+ 
+     #Hyperparameters
+     is_training = tf.placeholder(tf.bool,name="is_training") #batch Norm
+     learning_rate = tf.placeholder(tf.float32, name="learning_rate")
+     keep_prob = tf.placeholder(tf.float32, name="keep_prob") # Dropout
+     total_batches=len(X_train)//FLAGS.batch_size
+ 
+     network=BaseModel(X=X,n_input=FLAGS.n_input,n_classes=FLAGS.n_classes,
+         n_hidden_1=FLAGS.n_hidden_1,n_hidden_2=FLAGS.n_hidden_2,n_hidden_3=FLAGS.n_hidden_3,n_hidden_4=FLAGS.n_hidden_4,
+         n_hidden_5=FLAGS.n_hidden_5,n_hidden_6=FLAGS.n_hidden_6,keep_prob=keep_prob,is_training=is_training)
+     #here we can compute the model both for l2 custom and no-custom
+ 
+     pred = network()
+ 
+     #Compute the average of the loss across all the dimensions
+     if FLAGS.weighted_loss:
+         ce_loss = tf.reduce_mean(tf.nn.weighted_cross_entropy_with_logits(logits=pred, targets=Y,pos_weight=class_weights[1]))
+     else:
+         ce_loss = tf.reduce_mean(tf.nn.sigmoid_cross_entropy_with_logits(logits=pred, labels=Y))
+     
+     additional_loss = 0
+     if FLAGS.type_training=="LGO":
+         for idx,weight in enumerate(network.weights.values()):
+             additional_loss+=l2_loss_func(weight*(1-connexion_matrix[idx]))
+     elif FLAGS.type_training=="L2" :
+         for weight in network.weights.values():
+             additional_loss += l2_loss_func(weight)
+     elif FLAGS.type_training=="L1" :
+         for idx,weight in enumerate(network.weights.values()):
+             additional_loss+=l1_loss_func(weight)
+     
+ 
+     norm_no_go_connexions=0
+     norm_go_connexions=0
+     for idx,weight in enumerate(list(network.weights.values())[:-1]):
+         norm_no_go_connexions+=tf.norm((weight*(1-connexion_matrix[idx])),ord=1)/np.count_nonzero(1-connexion_matrix[idx])
+         norm_go_connexions+=tf.norm((weight*connexion_matrix[idx]),ord=1)/np.count_nonzero(connexion_matrix[idx])
+     norm_no_go_connexions/=FLAGS.n_layers
+     norm_go_connexions/=FLAGS.n_layers
+     
+     if FLAGS.type_training!='' :
+         total_loss = ce_loss + FLAGS.alpha*additional_loss
+     else:
+         total_loss = ce_loss
+ 
+     #optimizer
+     with tf.control_dependencies(tf.get_collection(tf.GraphKeys.UPDATE_OPS)):
+         if FLAGS.lr_method=="adam":
+             trainer = tf.train.AdamOptimizer(learning_rate = learning_rate)
+         elif FLAGS.lr_method=="momentum":
+             trainer = tf.train.MomentumOptimizer(learning_rate = learning_rate, momentum=0.09, use_nesterov=True)
+         elif FLAGS.lr_method=="adagrad":
+             trainer = tf.train.AdagradOptimizer(learning_rate=learning_rate)
+         elif FLAGS.lr_method=="rmsprop":
+             trainer = tf.train.RMSPropOptimizer(learning_rate = learning_rate)
+         optimizer = trainer.minimize(total_loss)
+ 
+     if FLAGS.n_classes>=2:
+         correct_prediction = tf.equal(tf.argmax(pred,1), tf.argmax(Y, 1))
+     else:
+         sig_pred=tf.nn.sigmoid(pred)
+         sig_pred=tf.cast(sig_pred>0.5,dtype=tf.int64)
+         ground_truth=tf.cast(Y,dtype=tf.int64)
+         correct_prediction = tf.equal(sig_pred,ground_truth)
+ 
+     #Calculate the accuracy across all the given batch and average them out. 
+     accuracy = tf.reduce_mean(tf.cast(correct_prediction, tf.float32))  
+ 
+     # Initializing the variables
+     init = tf.global_variables_initializer()
+ 
+     config = tf.ConfigProto(log_device_placement=False,allow_soft_placement=True)
+     #config.gpu_options.allow_growth = True, log_device_placement=True
+                 #to use the tensorboard
+ 
+     if FLAGS.save or FLAGS.restore : saver = tf.train.Saver()
+ 
+     start = time.time()
+ 
+     with tf.device(FLAGS.GPU_device):
+         with tf.Session(config=config) as sess: 
+             sess.run(init)
+ 
+             train_c_accuracy=[]
+             train_c_total_loss=[]
+ 
+             test_c_accuracy=[]
+             test_c_total_loss=[]
+ 
+             c_l1_norm_go=[]
+             c_l1_norm_no_go=[]
+ 
+             if FLAGS.type_training!="":
+                 test_c_ce_loss=[]
+                 test_c_additional_loss=[]
+                 train_c_ce_loss=[]
+                 train_c_additional_loss=[]
+ 
+             for epoch in tqdm(np.arange(0,FLAGS.EPOCHS)):
+ 
+                 index = np.arange(X_train.shape[0])
+                 np.random.shuffle(index)
+                 batch_X = np.array_split(X_train[index], total_batches)
+                 batch_Y = np.array_split(y_train[index], total_batches)
+ 
+                 # Optimization
+                 for batch in range(total_batches):
+                     batch_x,batch_y=batch_X[batch],batch_Y[batch]
+                     sess.run(optimizer, feed_dict={X: batch_x,Y: batch_y,is_training:FLAGS.is_training,keep_prob:FLAGS.keep_prob,learning_rate:FLAGS.learning_rate})
+ 
+                 if ((epoch+1) % FLAGS.display_step == 0) or (epoch==0) :
+                     if not((FLAGS.display_step==FLAGS.EPOCHS) and (epoch==0)):
+                         # Calculate batch loss and accuracy after an epoch on the train and validation set
+                         avg_cost,avg_acc,l1_norm_no_go,l1_norm_go = sess.run([total_loss, accuracy,norm_no_go_connexions,norm_go_connexions], feed_dict={X: X_train,Y: y_train,
+                                                                is_training:False,keep_prob:1.0})
+                         train_c_total_loss.append(avg_cost)
+                         train_c_accuracy.append(avg_acc)
+                         c_l1_norm_go.append(l1_norm_go)
+                         c_l1_norm_no_go.append(l1_norm_no_go)
+ 
+                         if FLAGS.type_training!="":
+                             avg_ce_loss,avg_additional_loss= sess.run([ce_loss, additional_loss], feed_dict={X: X_train,Y: y_train,is_training:False,keep_prob:1.0})
+                             train_c_additional_loss.append(avg_additional_loss)
+                             train_c_ce_loss.append(avg_ce_loss)
+ 
+                         avg_cost,avg_acc = sess.run([total_loss, accuracy], feed_dict={X: X_test,Y: y_test,is_training:False,keep_prob:1.0})
+                         test_c_total_loss.append(avg_cost)
+                         test_c_accuracy.append(avg_acc)
+ 
+                         if FLAGS.type_training!="": 
+                             avg_ce_loss,avg_additional_loss= sess.run([ce_loss, additional_loss], feed_dict={X: X_test,Y: y_test,is_training:False,keep_prob:1.0})
+                             test_c_additional_loss.append(avg_additional_loss)
+                             test_c_ce_loss.append(avg_ce_loss)                
+ 
+                         current_idx=len(train_c_total_loss)-1                   
+                         print('| Epoch: {}/{} | Train: Loss {:.6f} Accuracy : {:.6f} '\
+                         '| Test: Loss {:.6f} Accuracy : {:.6f}\n'.format(
+                         epoch+1, FLAGS.EPOCHS,train_c_total_loss[current_idx], train_c_accuracy[current_idx],test_c_total_loss[current_idx],test_c_accuracy[current_idx]))
+ 
+             if FLAGS.save: saver.save(sess=sess, save_path=os.path.join(save_dir,"model"))
+ 
+     end = time.time()
+     elapsed=end - start
+     print("Total time: {}h {}min {}sec ".format(time.gmtime(elapsed).tm_hour,
+     time.gmtime(elapsed).tm_min,
+     time.gmtime(elapsed).tm_sec))   
+ 
+     performances = {
+                     'type_training': FLAGS.type_training,
+                     'total_loss':train_c_total_loss,'test_total_loss':test_c_total_loss,
+                     'acc':train_c_accuracy,'test_acc':test_c_accuracy
+                 }
+ 
+     performances['norm_go']=c_l1_norm_go
+     performances['norm_no_go']=c_l1_norm_no_go
+ 
+     if FLAGS.type_training!="baseline":      
+         performances['additional_loss']=train_c_additional_loss
+         performances['test_additional_loss']=test_c_additional_loss
+         performances['ce_loss']=train_c_ce_loss
+         performances['test_ce_loss']=test_c_ce_loss
+ 
+ 
+     return performances
+ 
+ 
+ def main(_):
+ 
+     save_dir=os.path.join(FLAGS.log_dir,'MLP_DP={}_BN={}_EPOCHS={}_OPT={}'.format(FLAGS.keep_prob,FLAGS.bn,FLAGS.EPOCHS,FLAGS.lr_method))
+ 
+     if FLAGS.type_training=="LGO" :
+         save_dir=save_dir+'_LGO_ALPHA={}{}'.format(FLAGS.alpha,FLAGS.file_extension)
+     elif FLAGS.type_training=="L2" :
+         save_dir=save_dir+'_L2_ALPHA={}{}'.format(FLAGS.alpha,FLAGS.file_extension)
+     elif FLAGS.type_training=="" :
+         save_dir=save_dir+'_{}'.format(FLAGS.file_extension)
+     elif FLAGS.type_training=="L1" :
+         save_dir=save_dir+'_L1_ALPHA={}{}'.format(FLAGS.alpha,FLAGS.file_extension)
+ 
+     if FLAGS.is_training:
+ 
+         start_full = time.time()
+         
+         if not(os.path.isdir(save_dir)):
+             os.mkdir(save_dir)
+ 
+         performances=train(save_dir=save_dir)   
+ 
+         with open(os.path.join(save_dir,"histories.txt"), "wb") as fp:
+             #Pickling
+             pickle.dump(performances, fp)
+ 
+         end = time.time()
+         elapsed =end - start_full
+         print("Total time full process: {}h {}min {}sec".format(time.gmtime(elapsed).tm_hour,
+         time.gmtime(elapsed).tm_min,
+         time.gmtime(elapsed).tm_sec))
+     else:
+ 
+         # ---------------------------------TO MODIFY :------------------------------
+ 
+         start_full = time.time()
+         evaluate(save_dir=save_dir,ref_layer="h{}".format(1)) #TO DEFINE
+         end = time.time()
+         elapsed =end - start_full
+         print("Total time full process: {}h {}min {}sec".format(time.gmtime(elapsed).tm_hour,
+         time.gmtime(elapsed).tm_min,
+         time.gmtime(elapsed).tm_sec))
+ 
+ 
+ if __name__ == "__main__":
+     tf.app.run()
\ No newline at end of file