Commit initial

2018-11-18 17:04:03 +01:00 · 2018-11-18 17:04:03 +01:00 · 235d5f6305
commit 235d5f6305
5 changed files with 313 additions and 0 deletions
--- a/Controller/EntityDetermination.py
+++ b/Controller/EntityDetermination.py
@ -0,0 +1,40 @@
 #  -*-coding:utf8 -*
 from anytree.search import find
 class EntityDetermination:
    """Détermine si le critère de recherche d'un arbre est true ou false pour une entité"""
    def __init__(self, tree, entity):
        self.entity = entity
        self.reference = tree.reference
        # On démarre les recherches à partir du noeud initial
        self._find_next_node(tree.nodes[0])
    def _find_next_node(self, current_node):
        """Identifie la valeur de l'entité pour le critère courant et retourne le suivant, ou le résultat"""
        # On identifie la valeur de l'entité pour le critère courant
        criteria_value = self.entity[current_node.name]
        # Pour ce critère, on récupère le noeud enfant
        node = find(current_node, lambda node: node.name == criteria_value and node.parent == current_node)
        # Si cette valeur n'est pas référencée, on est bien incapable de déterminer quoi que ce soit
        if node == None:
            self._print_result("inconnue. Que voulez-vous, même la technologie a ses limites...")
        else:
            next_node = node.children[0]
            # Si le gamin de ce noeud est true ou false : on a un résultat
            if next_node.name in ("True", "False"):
                self._print_result(next_node.name)
            #  sinon on recommence
            else:
                self._find_next_node(next_node)
    def _print_result(self, result):
        """Affiche le résultat"""
        print("Notre ami.e", self.entity["Nom"], "est elle de type", self.reference, "?", "\nLa réponse est",
              result)
--- a/Model/Criteria.py
+++ b/Model/Criteria.py
@ -0,0 +1,57 @@
 # -*-coding:utf8 -*
 from math import log
 class Criteria :
    """Classe Critère - valeurs d'un critère pour l'éléments recherché"
        Attributs :
        @string name = nom du critère
        @dict{@dict{@int} values = totaux des correspondances des différentes valeurs pour ce critère
    """
    def __init__(self, criteriaList, referenceList):
        """Constructeur - liste les valeurs possibles du critère """
        # Definition du nom et suppression des header de la liste
        self.name = criteriaList[0]
        self.referenceList = referenceList.copy()
        self.criteriaList = criteriaList.copy()
        del self.criteriaList[0]
        del self.referenceList[0]
        # Définition des différentes valeurs
        self.values = {}
        for key, value in enumerate(self.criteriaList):
            # Ajout de la valeur si nouvelle
            if value not in self.values.keys():
                self.values[value] = {"True": 0, "False": 0}
            # Et incrément de la valeur du critère correspondant à l'élément de référence recherché
            if self.referenceList[key] == "O" or self.referenceList[key] is True or self.referenceList[key] == "Oui":
                self.values[value]["True"] += 1
            elif self.referenceList[key] == "N" or self.referenceList[key] is False or self.referenceList[key] == "Non":
                self.values[value]["False"] += 1
    def get_entropy(self):
        """Calcule et retourne l'entropie du critère"""
        # On récupère les totaux
        totals = {"all": 0}
        for key, value in self.values.items():
            totals[key] = value["True"] + value["False"]
            totals["all"] += totals[key]
        # Maintenant qu'on a tout ce qu'il nous faut, on peut lancer le calcul !
        entropy = 0
        for key, value in self.values.items():
            entropy += totals[key]/totals["all"] \
                       * ((self._entropy_frag(value["True"]/totals[key]))
                          + (self._entropy_frag(value["False"]/totals[key])))
        return entropy
    @staticmethod
    def _entropy_frag(prob):
        """Un morceau du calcul d'entropie, permet d'alléger la formule"""
        if prob == 0:
            return 0
        return -1 * prob * (log(prob)/log(2))
--- a/Model/DecisionTree.py
+++ b/Model/DecisionTree.py
@ -0,0 +1,98 @@
 #  -*-coding:utf8 -*
 from Model.Criteria import Criteria
 from Model.Table import Table
 from anytree import Node
 class DecisionTree:
    """Classe DecisionTree permettant de contruire un arbre de décision
    Atributs :
        @Table table # tableau de données
        @String reference  # le critère à déterminer, pour lequel on construit notre arbre
        @List(@Node) # Liste des noeuds
        """
    def __init__(self, data, reference):
        self.table = Table(data)
        self.nodes = list()
        self.reference = reference
        # On récupère l'identité du premier noeud et on le définit
        first_criteria = self._criteria_next_node(self.table)
        root_node = self._add_node(first_criteria.name, None)
        # Puis on lance la machine pour avancer dans l'arbre
        self._create_branch(self.table, first_criteria, root_node)
    def _criteria_next_node(self, table):
        """Détermine le critère en prochain noeud à partir d'un tableau"""
        # On établit la liste des critères
        criteria_list = table.get_criteria_list(self.reference)
        # initialisation des variables
        maxEntropy = 1.1
        nextNode = Criteria
        # On détemrine l'entropie de chaque critère
        for crit in criteria_list:
            criteria = Criteria(crit, table.get_column(table.table[0].index(self.reference)))
            # Si c'est la plus petite jusqu'alors, c'est ce critère qui sera le prochain noeud
            if criteria.get_entropy() < maxEntropy:
                nextNode = criteria
                maxEntropy = criteria.get_entropy()
        return nextNode
    def _create_branch(self, current_table, criteria, node):
        """détermine les branches partant d'un critère positionné en noeud"""
        for value, counts in criteria.values.items():
            # on replace le noeud parent correctement et on ajoute le critère en tant que noeud
            parent_node = node
            parent_node =  self._add_node(value, parent_node)
            # Si un total est à 0, ou qu'il n'y plus que 3 colonne dans le tableau on est en fin de branhce !
            #  Ou aussi qu'il n'y a qu'une seule option !
            if 0 in counts.values() or len(current_table.table[0]) == 3:
                result = None
                # On définit le résultat en fonction de la valeur la plus importante
                if counts["False"] > counts["True"]:
                    result = "False"
                else: # Par défaut (en cas d'égalité notamment), on prend true
                    result = "True"
                #On ajoute le noeud final
                self._add_node(result, parent_node)
            # sinon il faut créer un nouveau tableau à partir de l'ancien
            else:
                new_table = Table(current_table.remove_criteria(criteria.name, value))
                # Et continuer à avancer dans l'arbre
                next_criteria = self._criteria_next_node(new_table)
                # Si le critère suivant n'a plus qu'une entrée possible, on est également en fin de branche !
                if len(next_criteria.values) < 2:
                    # On l'ajoute donc en noeud final, selon sa valeur la plus importante
                    for values in next_criteria.values.values():
                        result = max(values, key=values.get)
                        self._add_node(result, parent_node)
                # Sinon, le critère est un nouveau noeud et on continue
                else:
                    new_parent = self._add_node(next_criteria.name, parent_node)
                    self._create_branch(new_table, next_criteria, new_parent)
    def _add_node(self, node, parent):
        """Crée un nouveau noeud dans l'arbre. Renvoie ce nouveau noeud"""
        self.nodes.append(Node(node, parent=parent))
        return self.nodes[-1]
--- a/Model/Table.py
+++ b/Model/Table.py
@ -0,0 +1,44 @@
 # -*-coding:utf8 -*
 class Table:
    """Classe Tableau. Instancie un tableau de données manipulable"""
    def __init__(self, table):
        self.table = table
    def get_column(self, key):
        """retourne toutes les valeurs d'une colonne sous la forme d'une liste"""
        column = list()
        for i, entry in enumerate(self.table):
                column.append(entry[key])
        return column
    def remove_criteria(self, criteria, value):
        """Génère un nouveau tableau à partir d'un autre
        en enelvant les données liées à un critère et en ne gardant que la valeur de ce critère"""
        newTable = []
        #  récupère l'indice du critère à virer
        index = self.table[0].index(criteria)
        # on vire allègrement cet indice de toutes les entrées du tableau qui matchent et on les ajoute au nouveau
        for entry in self.table:
            if entry[index] == value or entry[index] == criteria:
                newEntry = entry.copy()
                del newEntry[index]
                newTable.append(newEntry)
        return newTable
    def get_criteria_list(self, reference=""):
        """Retourne la liste des critères à analyser dans un tableau,
         en ignorant une colonne de référence si spécifiée"""
        # On parcourt la ligne d'entête pour récupérer les colonnes à scanner
        toScan = []
        for i, header in enumerate(self.table[0]):
            # on ne prend pas la colonne nom qui est inutile, ni la colonne de référence
            if i != 0 and header != reference:
                toScan.append(self.get_column(i))
        return toScan
--- a/main.py
+++ b/main.py
@ -0,0 +1,74 @@
 #  -*-coding:utf8 -*
 from anytree import RenderTree
 from Model.DecisionTree import DecisionTree
 from Controller.EntityDetermination import EntityDetermination
 # Données initiales
 data = [
        ["Nom",             "Cape", "Argent",   "Tech", "Pouvoir",  "Héro"],
        ["Spiderman",       "N",    "N",        "N",    "O",        "O"],
        ["Poutine",         "N",    "O",        "O",    "?",        "N"],
        ["Batman",          "O",    "O",        "O",    "N",        "O"],
        ["Jocker",          "N",    "O",        "O",    "N",        "N"],
        ["Rorschach",       "N",    "N",        "N",    "?",        "O"],
        ["Deadpool",        "N",    "N",        "O",    "O",        "O"],
        ["Merckel",         "N",    "O",        "O",    "N",        "N"],
        ["D'Artagnan",      "O",    "N",        "N",    "N",        "N"],
        ["César",           "O",    "O",        "O",    "N",        "N"],
        ["Tesla",           "N",    "N",        "O",    "?",        "O"],
        ["Edison",          "N",    "O",        "O",    "N",        "N"],
        ["Homer Simpson",   "N",    "N",        "N",    "N",        "N"],
        ["Sherlock Holmes", "N",    "O",        "N",    "?",        "O"],
        ["Moriarty",        "N",    "O",        "O",    "?",        "N"]
       ]
 """ Tableau de data secondaire. Utile pour faire des tests sur la première partie du cours
 dataGolf = [
 ["Jour", "Climat", "Température", "Humidité", "Vent", "Golf"],
 ["1   ", "Pluie ", "+", "+", "Non ", "N"],
 ["2   ", "Pluie ", "+", "+", "Oui ", "N"],
 ["3   ", "Nuage ", "+", "+", "Non ", "O"],
 ["4   ", "Soleil", "~", "+", "Non ", "O"],
 ["5   ", "Soleil", "-", "~", "Non ", "O"],
 ["6   ", "Soleil", "-", "~", "Oui ", "N"],
 ["7   ", "Nuage ", "-", "~", "Oui ", "O"],
 ["8   ", "Pluie ", "~", "+", "Non ", "N"],
 ["9   ", "Pluie ", "-", "~", "Non ", "O"],
 ["10  ", "Soleil", "~", "~", "Non ", "O"],
 ["11  ", "Pluie ", "~", "~", "Oui ", "O"],
 ["12  ", "Nuage ", "~", "+", "Oui ", "O"],
 ["13  ", "Nuage ", "+", "~", "Non ", "O"],
 ["14  ", "Soleil", "~", "+", "Oui ", "N"]
 ]
 """
 # On détermine notre critère de référence : celui qu'on va chercher à déterminer
 # On peut aussi directment passer une chaine de caractère si jamais
 # elle doit juste correspondre à un header du tableau (ex : Héro)
 # Le critère doit aussi contenir des valeurs "propres" : oui/non, o/n, True/False...
 reference = data[0][5]
 # Création de l'arbre et affichage (ça fait toujours plaisir après s'être saoûlé à le construire)
 tree = DecisionTree(data, reference)
 print("ooooh, le bel arbre de décision ! \n", RenderTree(tree.nodes[0]).by_attr("name"),
      "\n==============================================================================\n")
 # Nouvelle entité : est-ce un héro ?
 # Idéalement il faudrait rentrer les infos à la mano via
 # un prompt interactif qui demande selon l'arbre décisionnel,
 # pis ajouter les entités ainsi récoltées à la base
 # pour affiner les résultats,
 # mais bon j'ai un mémoire à faire alors c'est en dur dans le code
 entity = {
    "Nom": "Moustache",
    "Cape": "N",
    "Argent": "N",
    "Tech": "O",
    "Pouvoir": "?",
    "Héro": "?"
 }
 EntityDetermination(tree, entity)
 input("\n\nAppuyez sur Entrée pour fermer le programme...")