This commit is contained in:
Matt Marcha 2018-11-11 11:25:50 +01:00
commit 6fdb144950
13 changed files with 802 additions and 1 deletions

View file

@ -0,0 +1,129 @@
# Intro
we 'll review everyhting for business et macine learning
Part 1 on statistiques descriptives et probabilité
Stat descr : théorie, pas d'exercice
Propba :
Partie II (4h aujourd'hui)
tout ce dont on aur abesoin pour coprendre les stats
tes hypothèse : collect data to improve what is right or weong.
Partie III on verra put être plus tard
# I - Statistiques descriptives et probabilité
## 1.
### 1.
sur un même population, on peut collecter sur différents échantillons et obtenir différents données
Nombres discrets vs continus. à redéfinir
la première partie des stats c'st la descriptive > obtnir la data et des conclusions
seconde partie c'est la déduction > déduire des conclusions sur la population
### 2. Paramètres importants
Différences entre moyenne = valeur moyenne, médiane = valeur du milieu, mode = élément les plus fréquents. On a aussi 1er quartile et 3e quartile, qui sont des médianes correspondant à 25% et 75%.
Donnée aberrante = s'écarte de tout le reste. On peut considérer environ 2% de chaque côté pour les outlier.
Boîte à moustache : façon de représenter ces données (image de gauche), à ne pas confondre avec les chandelles (image de droite).
Variance : se calcule sur échantillon et population à partir de la moyenne t du nombre de personnes. Permet de voir si la moyenne st basée sur des valeurs très différetnes ou plutôt rapporchées.
Écart type / Cote Z ... à revoir
Covariance
Quand on vuet voir la corrélation entre deux données. Lz relations entre elles.
Corrélation
différetn de la covariance, calculé à partir. difficile d'exploiter la coviarianc,e la corrélation oui. Ça normalise la covariance ! relation de 1 ou -1 relaiton liéaire (mais pas de lien, genre c'st la même chose). 0 au contraire.
### 3. Interprétation et présentation des données
On voit une tétrachiée de façon de réprésenter les données. Il faut adatper la représentatio aux données.
Il y a des bons et mauvais échantillons : ils sont représentatifs de la population ou non.
## 2. Probabilités
### 1.
Voir les probabilités importantes, formules, règle,s tout est sur le slide
### Exercices
#### 1.
On al'univers suivant du nombre d epsycholgues choisis : {0, 1, 2}
On calcule d'bord la probabilité de n'avoir aucun psychologue
P(x=0). La proba que le premier soit un psychiatre est de 30/54
La proba que le deuxième en sot un aussi est de 29/54.
Donc P(x=0) = 30/54 x 29/53
On cherche l'inverse ! Puisque P(x=2) + P(x=1) = 1-P(x=0).
Donc proba = 332/477 ~ 0,70
#### 2.
si possibilités (1/3 x 1/2)
On calcule P(A|B)
## formule importantes
variable aléatoire
espérance
**Variance**
Bien différencier vairance de population et variance d'une variable aléatoire
Deux formules de variances, deuxième larche que sui X et Y indépendants
Note :
Si X et Y indépndants
Var(X-Y) = Var(X)+Var(Y)
Cara
Var(X-Y) = Var(1*X + (-1) *Y)
= 1^2*Var(X)+(-1)^2Var(Y)
## Lois de probabilité
discreet disctribution
Loi de bernouilli et binomiale
Fnction de masse: on a déjà un peu vu avec exo précédent
f est un fonction de masse si f(x) >= 0 t somme f(x) = 1
Loi de bernouilli : seulement deux résultats (genre pile ou face). Trop simple pour trouver souvent dnas la réalité. On va rencontrer plius osuvent la binomiale, qui utilise bernouilli.
binom(n,p) = X1, X2... Xn
Somme de n Bern(p)
Et E(Binom(n,p)) = somme(E(bern(p))) n fois = n*p
Et Var(binom(n,p)) =n.Var(Bern(p)) = n.p(p-1)
http://stattrek.com/online-calcul/binomial.aspx

View file

@ -0,0 +1,120 @@
# Intro
On va bosser sur la big data, Python, Hadoop, Spark
Objectif principal: améliorer les performances.
# Big Data
## Réviser Big data
Les données sont représentées comme un réseau : connexions entre points.
On peut avoir une liste de clients, il n'y a pas de relations entre eux. Mais on peut les foutre sur un graphique et, tirer de l'information par exemple à partir de l'espace entre le spoints.
On a donc un réseau à comprendre et dont on doit tirer de l'information. Exemple de google pagerank : chaque node est un website, et il y a des leins entre les sites > réseau. Un site avec eaucoup de liens vers lui sera plus important qu'un avec moins.
## 1.2 - Modélisation des réseaux
$$
C_T = ( V, E)
$$
Où V est un jeu de noeuds et E un jeu de relations
On modélise ls noeuds et les relations comme sur le PDF
Ça peut être dirigé ou non : dirigé on a un sens dans le réseau, c'est le cas du PageRank. On peut aussi avoir du poids sur les réseaux (graphe pondéré)
Réseau est un terme technique, grpah un terme pratique pour représenter la même chose
On réprésente V = {a, b, c, d, e} et E = {ab, bd, bc, cd}
d la distribution des degrès des noeuds. d : {1,2, 2,1,2} .
d(b) = somme du poids total des relations
$d^+(b) =$ nombre de relation sortantes de b (=2)
$d^-(b) =$ nombre de relations entrantes vers b (=1)
Composants connectés : Si on peut aller de a vers b, alors a et b appartiennent au même composant connecté.
Composants fortmeent connectés: depuis n'importe quel point on peut aller vers un autre. Toutes les directions existent.
Entre deux SCC, un noeud/SCC vers lequel un SCC de référence se dirige est un outcompoment. À l'inverse, si il se dirige vers le SCC de référence c'est un in-component
À partir des graphes on génères des matrices (voir pdf), on peut compter le nombre de connexions entre les points et tout et tout. Dans un truc non dirigé, M[a,b] = M[b,a]. Si on a une relation M(a,b) = 1, sinon 0. Dans un graph pondéré, M[a,b] = le poids de la relation.
cout : n²
List des relations : n*degré moyen (a peu égal à log(n))
Si on a pas le réseau (donc la totalité des données), on va générer un rseau artificel, similaire au réseau réel. Trois méthodes communes qu'on va aborder rapidement.
On connait l nombre de noeuds (1000), pas toutes les relations. On peut étalir le réseua à partir de la probbilité d'avoir une relation entre un noeud et un autre. p.e, haque neoud a environ 20 connexion.
$$
degre_a \approx p*n = \frac{20}{1000}*1000 = 20
$$
P : probabilité
$$
P(ab\ is \ an \ edge) \approx Bern(p) \\
P(degre\ of\ a) \approx Binom(p*n) \approx poisson\ law
$$
Le fait que la plupart ds noeuds aient un degrés proche de p*n n'est pas correct dnas la réalité. Ces réseaux ne sont donc pas corrects dans la réalité, mais utiles.
### Réseaux sans échelle
n : nombre de noeuds
$\lambda$ : power parameter ($2 \leqslant \lambda \leqslant 3$)
$$
\#edge = \sum_adegre(a) \\
= \sum i*\frac{n(\lambda-1)}{\lambda^{i+1}}
$$
### Réseaux petit monde
Les noeuds ne s'atteingnant pas directemet, mais sont à une très faible distanc les uns des autres (genre moins de 6 étapes pour aller de a vers b)
## Analyse des modèles : Google page Rank
pbique du spam de mot clef contournée grace au systèm de pagerank qui donne importanc eà la page, indépedamment du nombre du mots-clefs.
L'importance du site et donc la probabilité qu'on veuille aller sur celui là se calcule à partir d'une matrice. De cette matrice, on divise toutes les valeurs 1 de sorte à ce que chaque colonne fasse un total de 1.
| | a | b | c | d | e |
| ---- | ---- | ---- | ---- | ---- | ---- |
| a | 0 | 1 | 1 | 0 | 0 |
| b | 0 | 0 | 0 | 1 | 0 |
| c | 1 | 1 | 0 | 0 | 0 |
| d | 0 | 0 | 0 | 0 | 1 |
| e | 0 | 0 | 0 | 1 | 0 |
devient
| | a | b | c | d | e |
| ---- | ---- | ------------- | ---- | ------------- | ---- |
| a | 0 | $\frac{1}{2}$ | 1 | 0 | 0 |
| b | 0 | 0 | 0 | $\frac{1}{2}$ | 0 |
| c | 1 | $\frac{1}{2}$ | 0 | 0 | 0 |
| d | 0 | 0 | 0 | 0 | 1 |
| e | 0 | 0 | 0 | $\frac{1}{2}$ | 0 |
on obtient une matrice conditionnelle. Chaque ligne est 1/5, on fait la somme en fraction de la ligne et on a la matrice. La somme des éléments d ela matrice donne 1.
Une affaire de V ensuite. $V_0$ est la probabilité d'accéder à un point depuis n'import quel point de départ.
## TP: Python pour Data Science
Installer anaconda
Copier la database socceret la metttre dans le dossier "python"
finir TP O et 1

Binary file not shown.

View file

@ -0,0 +1,83 @@
# Intro
3 scéances ensemble
On va faire de l'hybride : Ionic. À partir des langages web (html/css/js), Ionic va générer du code pour différentes plateformes.
3 méthodes de faire des applis mobiles
- native
Ultra personnalisable, performances top niveau, accès aux API. Mais plus cher, nécessite plus de maintenance (car une app pour chaque OS), et plus de compétences.
- hybride
Moins cher, moins long à développer, compétences et maintenance plus accessibles.
- web
Avantages : coût, temps de dev, maintenance; mais pas d'accès aux API natives, UI/UX bof, performances laissent à désirer.
# IONIC
Basé sur Angular v2(et +) pour la partie logique, HTML5 et Sass (CSS/SCSS)
Angular est basé sur TypeScript (JS avec des types), le tout basé sur du Cordova (qui build l'app pour le tel).
Ionic est juste un framework front, il faudra le connecter avec un backend (API REST / JSON)
## Structure
- app
- pages : toutes les pages de l'app
- provider : connexion avec le backend
- theme : personnalisation du css
## Installation
- installer nodejs
- npm install -g ionic
- ionic start _nomprojet_ _template_
- ionic serve --lab
## Fonctionnalités
Déclarer une variable : `nomVariable:type`
Définir une variable : `nomVariable = valeur`
On peut aussi la déclarer et la définir en même temps.
Afficher une variable dans le html : `{{ nomVariable }}`
Les propriétés html peuvent être définies avec une variable TS : `[propriété]="nomVariable"`
On appelle ça du binding. Là c'étaut juste dans un sens, mais on peut faire du binding dans les deux sens. : `[(ngModel)]="nomVariable"` puis `name="nomVariable"`. On fait ça grâce à la propriété ngModel
Dans le html, les évènements JS sont indiqués avec des parenthèses.
`*ngIf = "nomVariable"` effectue une action à partir d'un booléen. Peut être sur n'importe quelle balise html, qui s'affichera alors seulement si variable à true.
boucle : `*ngFor="let variable of NomVariable"`
## Application
Ionic DevApp permet de tester l'appli sur son téléphone
---
*08/11/2018*
## Requêtes API
On peut réutiliser celle de notre projet ou se faire un petit prog qui renvoie un json tranquille
1. On crée un modèle pour chaque classe
2. `ionic generate provider [nom]`
3. Ajouter le provider dans app.module si c'est pas déjà fait
4. créer la fonction dans le provider
5. inclure dans la page le provider dans le constructeur
6. appleler la méthode avec this.[provider].[methode]
Exemple de fonctionnemnt du provider : https://github.com/danielpaul69/Tpionic
## Exercice carte en SVG
Cartes en svg : http://www.amcharts.com/svg-maps/

View file

@ -0,0 +1,344 @@
*07/11/18*
# Introduction
Qu'est-ce que le machine learning ?
-> Une machine qui apprend. Ça sert de deux façons:
- comprendre le passé -> amène à de la classification
- déterminer le futur -> aide à la décision
On va surtout s'intéresser au futur. En crypto, on a Bob et Alice, en machine learning on a "Vais-je aller faire du golf ?"
On va utiliser ci-dessous le gros tableau suivant. On va s'en resservir souvent.
| Jour | Climat | Température | Humidité | Vent | Golf |
| ---- | ------ | ----------- | -------- | ---- | ---- |
| 1 | Pluie | + | + | Non | Non |
| 2 | Pluie | + | + | Oui | Non |
| 3 | Nuage | + | + | Non | Oui |
| 4 | Soleil | ~ | + | Non | Oui |
| 5 | Soleil | - | ~ | Non | Oui |
| 6 | Soleil | - | ~ | Oui | Non |
| 7 | Nuage | - | ~ | Oui | Oui |
| 8 | Pluie | ~ | + | Non | Non |
| 9 | Pluie | - | ~ | Non | Oui |
| 10 | Soleil | ~ | ~ | Non | Oui |
| 11 | Pluie | ~ | ~ | Oui | Oui |
| 12 | Nuage | ~ | + | Oui | Oui |
| 13 | Nuage | + | ~ | Non | Oui |
| 14 | Soleil | ~ | + | Oui | Non |
À partir de là, on commence par phase d'entrainement :
Il existe différentes familles de machine learning qui vont avoir besoin de faits plus ou moins conséquents pour s'entraîner. On repère globalement le schéma suivant :
- collecte de faits
- trier les faits (nettoyage)
- entrainer notre système à partir de ces faits
Ensuite on fait tourner tout ça et on contrôle les résultats.
Tout ça est une version simplifiée. Dans la réalité c'est plus complexe. Par exemple on va garder un quart du set de données et le sortir des faits pour les utiliser pour le contrôle.
Attention à ne pas trop verrouiller le système qui ne marcherait plus si on sort du périmètre des données du jeu d'entrainement : on appelle ça l'**overfitting**.
# Les algorithmes
Est-ce que je vais faire golf ?
Pour le déterminer, plusieurs algos
## One R
Le plus simple : une seule règle. Cherche à définir quel est le paramètre le plus important dans un jeu de données, qui permettra de prendre une décision ? En gros : celui qui aura la plus faible marge d'erreur.
#### Phase 1 : décompte des cas
Parmi tous les critères, comment savoir quel est celui qui a le plus d'importance ?
On regarde pour chaque paramètre le résultat final : golf ou pas, et on énumère simplement : sur *n* paramètres, on en a *g* où on pas au golf et *pg* où on y va pas.
#### Phase 2 : trouver la règle générale
Pour chaque décompte, on prend le plus grand entre *g* et *ng* et on se dit "si paramètre, alors {golf | pas golf}"
#### Phase 3 : décompte des aberrations
le problème des règles générales, c'est qu'elle peuvent être aberrantes. on compte donc la sommes des valeurs *g* ou *ng* ne correspondant pas à la règle générale.
#### Phase 4 : détermination du critère
Reprendre les phases 1 à 3 sur les différents critères restants, et comparer le nombre d'aberrations par système. Le critère avec le plus faibl niveau d'aberrations sera le critère déterminant
#### Exemple
| Climat | Golf | Pas golf |
| ------ | ----- | -------- |
| Pluie | *2* | **3** |
| Nuag | **4** | *0* |
| Soleil | **3** | *2* |
En gras, les règles générales, en italique, les aberrations
On fait la suite :
| Critère | Golf | Pas golf |
| ------------------- | ----- | -------- |
| **Température** | | |
| Température chaude | *2* | **2** |
| Température moyenne | **4** | *2* |
| Température basse | **3** | *1* |
| **Humidité** | | |
| Humidité importante | *3* | **4** |
| Humidité moyenne | **6** | *1* |
| **Vent** | | |
| Vent | **3** | *3* |
| Pas de vent | **6** | *2* |
aberration climat : 4
aberration température : 5
aberration humidité : 4
aberration vent : 5
En égalité, on prend celui qu'on veut. À choisir, autant prendre celui qui a le plus de cas : granularité plus fine.
Notre critère déterminant sera donc le **climat**. donc :
```
Si climat == soleil
golf
sinon si climat == nuage
golf
sinon si climat == pluie
golf
```
## Arbre décisionnel
Objectif final : construire un arbre décisionnel.
Le but de l'arbre est d'établir la suite de critères à interroger pour prendre la meilleure décision
Le but pour créer l'arbre est de déterminer la quantité d'informations dans une entité.
#### Entropie et Shannon
Quelle est la quantité d'information dans une entité ?
C'est une question que c'est posé Shannon, qui pose la base de la théorie de l'information.
En philo, l'entropie est une mesure du chaos. Shannon s'st planté dans son interprétation : il a fait une mesure de l'ordre.
Shannon va adapter l'entropie au domaine IT pour déterminer quelle quantité d'information est présente dans un postulat.
Pour cela, on a une formule :
$$
E = \sum{i}-p_i log_2(p_i)
$$
Rappel :
$$
log_b(x) = \frac{ln_x}{ln_b}
$$
#### Exemples
**"C'est l'anniversaire de machin" ou "ce n'est pas l'aniversaire de machin"**
$$
Proba_{anniversaire} = \frac{1}{365}
$$
$$
Proba_{non anniv}= \frac {364}{365}
$$
$$
E_{anniv} = - \frac{1}{365} log_2(\frac{1}{365} ) - \frac{364}{365}log_2(\frac{364}{365}) \\
= \frac{1}{365} . \frac{ln(\frac{1}{365})}{ln(2)} - \frac{364}{365} . \frac{ln(\frac{364}{365})}{ln(2)} \\
= 0,027
$$
La quantité d'information portée par la phrase "C'est l'anniversaire de x" ou "Ce n'est pas l'anniversaire de x" est de 0,027.
On était là dans un cas où il y a peu de chance que ce soit son anniversaire. Voyons celui d'une équiprobabilité.
**Je suis à l'équateur et je dis "il fait jour" ou "il fait nuit"**
$$
E_{jour/nuit} = - \frac{1}{2} . log_2(\frac{1}{2}) - \frac{1}{2} . log_2(\frac{1}{2}) \\
= 0,5 + 0,5 \\
= 1
$$
On écarte ici beaucoup plus de possibilités. On apporte donc plus d'information à l'interlocuteur lorsqu'on permet d'écarter des possibilités qui ont les même probabilités d'occurence.
On maximise donc l'entropie quand on trouve une information plus importante à transmettre.
##### Comment appliquer ça au golf ?
Il faut calculer l'entropie de chaque critère, puis déterminer le critère avec le plus d'entropie. Cela permet de déterminer un noeud dans l'arbre décisionnel. Ensuite pour chaque possibilité liée au noeud, création d'un sous tableau et répétition des calculs dans ce sous-tableau jusqu'à obtenir l'arbre complet
À savoir pour cela :
$$
E_S = \sum_i - P_i log_2(p_i) \\
E_{T,x} = \sum_{C \in x } P_C. E_C \\
E_{T,x} étant "E de T sachant x"
$$
On calcule donc l'entropie de golf (total oui, total non, total des occurences ) : 0,94
puis pour le climat on va calculer l'entropie de golf sachant climat (connaissant le climat, quelle est la quantité d'information dans "je vais au golf"/"je ne vais pas au golf")
| Climat | Golf | Golf | Total |
| ------ | ---- | ---- | ----- |
| Pluie | 2 | 3 | 5 |
| Nuage | 4 | 0 | 4 |
| Soleil | 3 | 2 | 5 |
$$
E_{golf, climat} = P_{pluie} . E_{2,3 (pluie)} + P_{nuage} . E_{4,0 (nuage)} + P_{soleil} . E_{3,2 (soleil)} \\
= \frac{5}{14} . (-\frac{2}{5} . log_2(\frac{2}{5}) - \frac{3}{5} . log_2(\frac{3}{5})) + ...
$$
On finit par obtenir 0,693
En connaissant le climat, le fait de savoir si je vais au golf m'apporte 0,693 unité d'information.
On va ensuite calculer le **gain d'information**. c'est lui qui nous intéresse au final.
$$
G_{(golf, climat)} = E_{golf} - E_{(golf, climat)} \\
= 0,940 - 0,693
= 0,247
$$
On gagne donc 0,247 unité d'information en sachant le climat. Le critère climat vaut 0,247.
On calcule ça pour tous les critères : c'est le plus important qui sera à la racin de mon arbre. On recommencera ensuite en subdivisant le tableau d'orgine en n sous-tableau à partir des différentes proba du critère racine. (voir sur feuille).
L'arbre permet d'avoir exactement les bonnes questions à poser pour faire la classification.
## Bayes
Filtres bayésiens naïfs :
$$
P_{C|_x} = \frac{P_{x|_C}.P_C}{P_x}
$$
On regarde ce qui existe, et à partir de là on détermine la probabilité pour qu'il se passe un truc.
| Climat | Golf | Pas golf |
| ------ | ---- | -------- |
| pluie | 2 | 3 |
| nuage | 4 | 0 |
| soleil | 3 | 2 |
$$
P_{golf} = 9/14 = 0,64\\
P_{pas golf} = 5/14 = 0,36
$$
On peut réécrire le tableau avec des probas
| Climat | Golf | Pas golf | Probabilité |
| ------ | ---------------------------------- | ------------- | --------------------------- |
| Pluie | $\frac{2}{9}$ | $\frac{3}{5}$ | $\frac{5}{14} = P_{pluie}$ |
| Nuage | $\frac{4}{9}$ | $\frac{0}{5}$ | $\frac{4}{14} =P_{nuage}$ |
| Soleil | $\frac{3}{9} = P_{soleil|_{golf}}$ | $\frac{2}{5}$ | $\frac{5}{14} = P_{soleil}$ |
Maintenant on peut calculer la probabilité de golf sachant soleil :
$$
P_{golf|_{soleil}} = \frac{P_{soleil|_{golf}} . P_{golf}}{P_{soleil}} \\
= \frac{\frac{3/9}{9/14}}{\frac{5}{14}} \\
= 0,6
$$
Sachant qu'il y a du soleil aujourd'hui, il y a 0,6 (60%) de chances que j'aille au golf.
Les filtres antispam utilisent des filtres bayésiens.
## Chaînes de Markov
En 1905, Markov déclare qu'en ayant une connaissance parfaite d'un système à un état *n*, il peut déterminer l'état *n+1*
Donc :
$P_x = \prod_{i=1}^np_{x|_{n-1}}$
S je peux établir un automate à état et renseigner les règles de passage entre les états (et les probabilités d'occurence), je peux anticiper l'état futur.
Exemple d'automate à état : feu tricolore, vert puis orange puis rouge, puis vert.... ou bien vert, puis orange, puis rouge, puis orange, puis vert,puis orange... dans d'autres pays.
Dans ces deux cas on aura dans les proba de changement d'état :
Vert > 1 orange
Orange > 1 rouge
Rouge > 1 Vert
et
Vert > 1 Orange
Orange > O,5 Vert, 0,5 Rouge
Rouge > 1 Orange
Donc $P_{O->V} = 0,5$ en Pologne et $1$ en France.
### Exemple
Par rapport au tableau, on considère que chaque ligne est un jour. On compte donc les changement d'état d'un jour à un autre :
Pluie vers pluie : 2 (40%)
Pluie vers nuage : 2 (40%)
Pluie vers soleil : 1 (20%)
Nuage vers pluie : 1 (25%)
N vers N : 1 (25%)
N vers S : 2 (50%)
S vers P : 1 (25%)
S vers N : 1 (25%)
S vers S : 2 (50%)
On peut donc faire un diagramme (voir feuille)
À partir de ce diagramme, on peut voir le changement à un état n+1 directement.
Si on veut déterminer un état à n+2, ça suppose de connaitre tous les chemins intermédiaires possibles et d'estimer leur probabilités. On calcule chaque proba en le multipliant :
$$
P_{n_{nuage} -> n+2_{soleil}} = P_{N>N>S} + P_{N>P>S} + P_{N>S>S} \\
= (0,25*0,5) + (0,25*0,2) + (0,5*0,5) \\
= 0,125 + 0,05 + 0,25 \\
= 0,425
$$
On a ici une chaine de Markov d'ordre 2, car il y a deux passages.
La chaine de Markov ne marche que si tous les facteurs sont prévus, mais **c'est très rarement le cas**. C'est le gros point faible : aucun intervention extérieure ne doit pouvoir intervenir sur le système. Ça fonctionne bien dans certains cas cependant, c'est notamment utilisé dans l'autocomplétion. C'est plutôt pratique comme système car les maths se font toutes seules.
C'est donc très utile pour devnir un état futur proche, mais attention au fort impact des phénomèes non anticipés.
Plus l'ordre de la CM est élevé, moins la chaîne est fiable.
## Exercice
| Nom | Cape | Argent | Tech | Pouvoir | Héro |
| --------------- | ---- | ------ | ---- | ------- | ---- |
| Spiderman | N | N | N | O | O |
| Poutine | N | O | O | ? | N |
| Batman | O | O | O | N | O |
| Jocker | N | O | O | N | N |
| Rorschach | N | N | N | ? | O |
| Deadpool | N | N | O | O | O |
| Merckel | N | O | O | N | N |
| D'Artagnan | O | N | N | N | N |
| César | O | O | O | N | N |
| Tesla | N | N | O | ? | O |
| Edison | N | O | O | N | N |
| Homer Simpson | N | N | N | N | N |
| Sherlock Holmes | N | O | N | ? | O |
| Moriarty | N | O | O | ? | N |
| ??? | N | N | O | ? | |
Créer un système dans un langage qui nous plait qui permet de savoir si la prochaine personne à être ajoutée est un héros ou non.
Vu les outils qu'on a Markov pas utile, Bayes faisable mais trop complexe. Reste One R mais peu pertinent. Donc arbre décisionnel.
Travail à rendre !

View file

@ -424,7 +424,7 @@ Optimiser le process : plus de réactivité par rapport aux besoins métier.
### 5 ### 5
Rôlesmarqué dans la diapo (p20pdf) : Rôles marqués dans la diapo (p20pdf) :
- Conseil - Conseil
- Contrôle - Contrôle
@ -435,3 +435,128 @@ Rôlesmarqué dans la diapo (p20pdf) :
Dit en fin de cours mais mon esprit était déjà au bar. Et mon ordi rangé. Dit en fin de cours mais mon esprit était déjà au bar. Et mon ordi rangé.
---
*09/11/18*
Dans deux semaine, truc à faire à rendre pour première note.
Deuxième note la smeaine suivante, un bpmn à suivre et à montrer.
## AXA : urbanisme et gouvernance
### Contexte
#### 1
intégrer l'urbanisme des SI dans la gouvernance sur le long terme.
- réglementaire (AXA est une multinationale, elle va dépendre de son emplacement, et donc des règles locales en fonction, de là où elle est implantée) => contexte de conformité règlementaire (rappel : norme BAL2 la dernière fois, ici on dépend de l'emplacement)
- transverse (peu importe ce qu'elle fait : elle gère tout ce qui est risque, peu importe le cøeur de métier.)
-
-
- couts
- unité
- transnationale
- infrastructures
- applications
- contractualisés
- service (SLA = contrat de service)
- processus
- changement
- conception
- oeuvre
- ouvrage
- vers le holding
- cycle de vie
DONC l'objectif stratégique d'AXA actuellement est de réduire les coûts. Ils font des développment spécifiques par continent, c'est cher, ils font donc AXA tech pour mettre à plat lsprocess, normaliser tout le porcess, standardiser, et ajouter la couche règlementaire nécessiare par continent.
Pour urba des SI : fusion, rachat, mise à niveau.
### Grandes phases d'urbanisme
#### 2
4 axes :
1. fusion de systèmes d'info
2. entrepôt de données pour données clietns et valorisation gestion relation client
3. création d'un département dédié à l'urba SI pour réduction couts
4. aligner urba sur stratégie métiers (création de valeur)
---
Je sias pas pouruqoi elle dit ça mais :
1. Cartographie existant
2. Carto de la cible (process)
3. Lister les opportunités et les solutions qui existent 'prioriser les projets'
4. proposer les projets et un plan de migration
### Conduite d'urbanisme
#### 3
Intérêt pour le département archi, c'est qu'il représente le pilier du process. Il aura donc un gestion de projet strégique : un pilier stratégiue pour maîtriuser tous les process, les mettre à plat et les étudier (on fait une arhci existant et cible). Ce départmeent en plus d'être l'actuer pilier ce qui va donner une influence stratégique, une maitrise des process et permet de prendre les décisions. C'est c départment quiv a prendre les décisions t déterminer solutions adéquates. Il devient le centre du process. Il deviet donc cteur stratéiguqe pour la réalisation du projet.
#### 4
Ils sont à leur 5e projet. Ils maitrisent toutes les phases de process d'urba, ils auront plus de crédibilité financièr, pour la diretion notamment, il y aura plus de budget.
#### 5
Car agile et cohérent. on va trouver process cohérent, et du point de vue techniqu ça va être agile, donc s'adapter aux besoins de l'entreprise. C'est donc ces deux termes à mettre en avant auprs de ladorection pour la convaincrE.
## AXA : Application Portfolio Management
Outiller la gouvernance du parc applicatif
### 1
- Enjeux métier :
- Coût : maîtrise des risques, exploration et infra,
-
- Adéquation : adéquation fonctionnelle, projet
### 2, 3
La carte permet de prioriser les SA. On laisse par exemple de côté le SA3. Il faut améliorer le SA5
### 4, 5
Par rapport à la couche infra et les enjeux métiers, on voit si l'app tourne avec un bon support techinque derrière.
le SA5 a un problème : il est pas hyper pérenne. c'est comme ça qu'on peut l'améliorer.
arpès directment on comence architexture process métier.
## Conclusion
### 6
- nord : marché et client
- est : organisation efficace
- sud : résultat et profit
- ouest : personne mobilisées
### 7
- nord : améliorer l'accès aux informations et produit et donc alémliorer l'interface homme/macxhine. Avantage concurrentiel et valoriser le client.
tableaux de bord pour évaluer le marché. orienter la stratégie de l'entreprise.
- est : valoriser les outils de communication . chaque actuer peut donner son avis.
documentation
- sud : les 4 couches répondent à la strtégie de l'entreprise. Le SI doit être évolutif et répondr eà la strat qui change tjrs.
On rend le SI homofène et on harmonise
- ouest : plans de communication, réunion
responsabiliser chaque acteur
actuer doit pas seuleemnt être princiapl et rendre cohérente toute la communication et le mouvement doit être global, en réseau.