PLANS D'EXPERIENCES avec NEURO PEX



NEURO PEX est le premier logiciel au monde de plans d'expériences pour modèles non-linéaires de connaissance et pour réseaux de neurones (version 1 en 2004, version 2 en 2005). Nous présentons ci-dessous comment Neuro Pex, couplé avec le Neuro Shop, traite l'exemple fameux de Box et Lucas (1959). Cet exemple est une cinétique chimique A => B => C décrite par le modèle de connaissance. Pédagogiquement, l'intérêt de ce modèle tient en ce qu'il est constitué d' 1 facteur (1 entrée) et 2 paramètres (2 coefficients), ce qui permet de visualiser par des graphiques 2D simples les régions de confiance sur la sortie et sur les coefficients.
Si vous ne parvenez à lire correctement les images ci-dessous, téléchargez le fichier zip des images en taille réelle et visualisez-les avec un lecteur de diapostives.


0. NETRAL Model Dispatcher, Neuro Shop et Neuro Pex

Tous les logiciels édités par NETRAL peuvent être lancés par l'intermédiaire du Model Dispatcher. Ici, lancez Neuro Shop.

1. Logiciel Neuro Shop

Sous Neuro Shop, cliquez sur l'icône Compilateur (apparition de la fenêtre inférieure gauche) puis ouvrez/chargez le modèle Box-Lucas.mgl.

2. Visualisation du modèle mgl

Toute équation algébrique peut être représentée par un modèle mgl qui contient les informations suivantes :
- Le nom du modèle
- La liste des entrées et leurs domaines de variation [min..max]
- La sortie
- La liste des paramètres (coefficients), leurs valeurs a priori (D-optimalité) et/ou leur domaines de variation [min..max] (X-optimalité)
- l'équation algébrique du modèle.

3. Visualisation du modèle nml

Cliquez sur le bouton Compilateur. Le modèle au format nml s'affiche dans la fenêtre centrale. Le format nml, commun à tous les logiciels NETRAL, considère tout modèle analytique comme une succession d'opérations individuelles (addition, soustraction, multiplication, division, logarithme, exponentielle, sinus, arctg, etc...) formant un graphe unidirectionnel. Le format nml, exploité par les logiciels Netral, permet le calcul de la fonction de transfert, les dérivées premières et secondes par rapport aux paramètres, les dérivées premières et secondes par rapport aux entrées, les dérivées secondes mixtes par rapport aux entrées et aux paramètres.

4. Visualisation de l'expression analytique

"Bouton droit de souris + Propriétés visibles + Formule de calcul" affiche la forme analytique du modèle recalculée à partir du graphe. Celle-ci doit être équivalente à l'expression du modèle mgl. Le modèle nml est enregistré automatiquement dans le répertoire du modèle mgl. Quittez Neuro Shop.

5. Visualisation des formats mgl et nml

NETRAL propose des codes ouverts. Les fichiers mgl et nml peuvent être lus (et modifiés !) dans un simple éditeur de texte. Le format nml est un code xml. On retrouve en bleu sombre les valeurs a priori, min et max du paramètre b1 du modèle de Box-Lucas

6. Visualisation des formats mgl et nml (suite)

En bleu sombre, la réponse y du modèle de Box-Lucas.

7. Lancement du logiciel Neuro Pex

Dans NETRAL Model Dispatcher, chargez le modèle Box-Lucas.nml puis lancez le logiciel Neuro Pex.

8. Chargement du modèle

Neuro Pex lit les modèles conçus avec les formats suivants :
1. nml : format standard des logiciels Neuro One et Neuro Shop
2. mgl : fichier texte/Ascii de l'équation analytique
3. dlm : dll dédiée pour s'interfacer avec des codes numériques externes dans une logique logiciel maître (Neuro Pex) - logiciel esclave (votre code numérique)
"Bouton droit de souris + Propriétés visibles + Formule de calcul" affiche la forme analytique du modèle recalculée à partir du graphe.

9. Domaine expérimental et paramétrique

Valeurs min et max du facteur (entrée) x = temps.
Pour cet exemple, il n'y a pas de contraintes sur le domaine expérimental.
Valeurs postulées pour les paramètres (coefficients) w(0) et w(1). Ce sont ces valeurs que l'on cherche à réestimer
Des valeurs min et max pour les paramètres w(0) et w(1) ne sont pas nécessaires pour le critère de D-optimalité mais sont indispensables pour le critère de X-optimalité. Neuro Pex affiche alors - l'infini et + l'infini.

10. Bruit sur la réponse

La connaissance du bruit expérimental (ou variabilité de la mesure) est primordiale en planification expérimentale.
1. Le bruit expérimental est connu et identique sur tout le domaine expérimental.
2. Le bruit expérimental est estimé à partir d'un échantillon de réponses. Ici, 23% de la moyenne des réponses.
3. Le bruit expérimental varie dans le domaine expérimental proportionnellement à la réponse. Ceci est souvent le cas pour des phénomènes exponentiels où la réponse varie sur plusieurs ordres de grandeur. Des seuils minima sont proposés pour éviter un bruit nul en présence d'une réponse nulle (division par 0 lors des calculs).
4. On dispose d'un modèle du bruit expérimental.

11. Chargement des données / mesures déjà disponibles

Si des données expérimentales sont déjà disponibles, elles peuvent être proposées mais pas imposées (non protogées) ou bien proposées et imposées (protégées) dans les futurs plans calculés.

12. Génération des points candidats

Par défaut, les points candidats générés par Neuro Pex sont un maillage régulier du domaine expérimental. Des valeurs classiques sont 2, 3, 4, 5, 9, 11, 21, 51, 101, 1001.
Si ce nombre devient trop important, ce qui est souvent le cas avec les hypercubes de grande dimension, on peut proposer un nombre plus faible de points qui seront tirés aléatoirement (sans remise) à partir des noeuds de l'hypercube.
Si le domaine expérimental n'est pas un hypercube, il est préférable de charger une table externe configurée sur mesure.

13. Table des points candidats

Neuro Pex affiche la table des points candidats.
1. Ici, une seule entrée pour le modèle de Box-Lucas avec un prélèvement toutes les 0,1 heures = 6 minutes.
2. Avant réalisation du plan, les mesures n'ont pas été effectuées et les réponses y ne sont donc pas renseignées. NAN = Not a Number.
3. Le code de sélection 3 indique que le point de mesure est proposé mais pas protégé.

14. Option de calcul et d'affichage des graphiques

Les calculs de D-efficacité (quelques minutes) et de la région de confiance de Hamilton (quelques demi-heures) sont chronophages et pas toujours nécessaires.
Neuro Pex donne à l'utilisateur la possibilité de choisir les graphiques qui seront affichés automatiquement.

15. Choix du type de plan à calculer

Neuro Pex est le premier logiciel au monde à calculer de manière conviviale des plans D- et X-optimaux.
La D-optimalité maximise le déterminant de la matrice d'information, minimise le déterminant de la matrice de dispersion, minimise l'ellipsoïde de confiance sur les paramètres (coefficients) du modèle. Cet ellipsoïde de confiance n'est qu'une estimation au premier ordre de la région de confiance exacte autour des paramètres.
La X-optimalité minimise, à distance finie (i.e. pour le nombre d'expériences retenues), l'espérance du volume de la région exacte autour des paramètres.

16. Options associées au calcul des plans D-optimaux

2 informations au moins doivent être renseignées :
1. Le nombre maximum d'expériences que l'utilisateur est prêt à réaliser.
2a. La possibilité de répétition des points support (l'option retenue ici) ;
2b. l'obligation de répétition en p points support si p est le nombre de paramètres du modèle ;
2c. l'interdiction des répétitions, qui est recommandée pour les plans numériques.

17. Calcul des plans D-optimaux et synthèse des résultats

Neuro Pex requiert de quelques secondes à quelques minutes pour calculer tous les plans D-optimaux depuis le nombre minimum (généralement p points) jusqu'au nombre maximum de points / essais demandés (lors de l'écran précédent).
A l'issue des calculs, Neuro Pex dispose tous les résultats individuels dans des onglets répartis en deux séries : Synthèse des plans et Diagnostics.
Le premier onglet est une synthèse des résultats qui contient les informations suivantes :
- Numéro du calcul
- Date et heure
- Nombre d'expériences dans le plan calculé
- Courbure paramétrique maximale
- Courbure paramétrique moyenne
- Courbure intrinsèque maximale

18. Synthèse des résultats (suite)

Suite de la synthèse des résultats :
- Courbure intrinsèque moyenne
- Courbure de référence pour la taille du plan
- Indice de D-efficacité
- Valeur du déterminant normé
- Trace de la matrice d'information
- Plus grande valeur propre de la matrice d'information
- Conditionnement des valeurs propres de la matrice d'information
- Corrélation maximale calculée à partir de la matrice de corrélation de l'estimateur des moindres carrés des paramètres
- Corrélation moyenne calculée à partir de la matrice de corrélation de l'estimateur des moindres carrés des paramètres
- Ecart-type moyen des erreurs de prédiction
- Ecart-type maximal des erreurs de prédiction

19. Guirlande de D-efficacité

La guirlande de D-efficacité peut être régulière en p points ou irrégulière. Elle est ici régulière tous les p=2 points.

20. Ecart-type des erreurs de prédiction

Ce graphique est très important.
Il indique le nombre d'essais / expériences à réaliser pour atteindre un certain niveau de précision (moyen ou maximum) sur les prédictions. Les erreurs estimées affichées ici sont calculées à partir de la table des points candidats.

21. Déterminant de la matrice d'information

Graphique du déterminant de la matrice d'information de l'estimateur des moindres carrés des paramètres en fonction de la taille des plans

22. Trace de la matrice d'information

Graphique de la trace de la matrice d'information de l'estimateur des moindres carrés des paramètres en fonction de la taille des plans

23. Rapport de diagnostic

Dans le feuillet Diagnostics, le premier onglet est le rapport de diagnostic qui regroupe l'ensemble des informations associées au plan considéré, ici le plan à p = 2 points / essais. Ce sont :
0. Titre et plan calculé à p points
1. Résumé des estimations paramétriques
2. Matrice de variance-covariance de l'estimateur des moindres carrés des paramètres
3. Matrice de corrélation de l'estimateur des moindres carrés des paramètres

24. Rapport de diagnostic (suite)

Suite des informations enregistrées dans le rapport de diagnostic :
3. Matrice de corrélation de l'estimateur des moindres carrés des paramètres
4. Mesures de la D-efficacité du plan
5. Mesures de non-linéarité. Les mesures de non-linéarité font appel au calcul des dérivées secondes du modèle.
6. Performances prédictives du modèle
7. Volume de la région de confiance de Hamilton (ici non calculée)

25. Plan D-optimal à 2 points

Le deuxième onglet affiche le plan D-optimal ayant le minimum de points, ici seulement 2 points.
Pour les valeurs initiales des paramètres assumées égales à w(0) = 0,2 et w(1) = 0,7 (copies d'écran 3. et 9. ci-dessus), les deux nouveaux essais doivent être réalisés l'un à x = temps = 1,2 heures (1 heure 12 minutes) et l'autre à x = temps = 6,9 heures (6 heures et 54 minutes).

26. Plan continu

Le plan continu est calculé selon l'algorithme de Torsney. Celui-ci affecte à chacun des points candidats (copie d'écran 13.) une probabilité d'apparition ou 'masse'. La somme des masses est égale à 1. Le plan continu sert au calcul de la D-efficacité et de la guirlande.

27. Estimation de performance / Prédiction

Pour un plan d'une taille donnée, ici 2 points / essais, Neuro Pex calcule en chaque point candidat la valeur moyenne de la réponse, le biais anticipé, l'erreur de prédiction et un intervalle de confiance (valeurs min/max) pour la réponse.
Le plan en 2 points étant ici égal au nombre de coefficients du modèle, il n'y a pas de degrés de liberté disponibles pour calculer les intervalles de confiance.

28. Plan à 14 expériences

Un double-clic sur la ligne 14 expériences de la table de synthèse des résultats charge automatiquement le plan à 14 points / essais / expériences et les diagnostics rattachés.

29. Rapport de diagnostic

Le plan en 14 points est le plan en 2 points répété 7 fois (guirlande régulière).
Les degrés de liberté sont maintenant en nombre suffisant pour calculer des intervalles de confiance (IC_Min, IC_Max) sur les paramètres et sur la réponse (copie d'écran 32).

30. Rapport de diagnostic (suite)

Suite du rapport de diagnostic pour le plan à 14 points.

31. Plan D-optimal à 14 points

Le plan en 14 points est le plan en 2 points répété 7 fois

32. Estimation de performance / Prédiction

Les degrés de liberté sont en nombre suffisant pour calculer des intervalles de confiance (IC_Min, IC_Max) sur les paramètres (copie d'écran 29) et sur la réponse, ici les points candidats.
Le modèle de Box-Lucas étant à 1 entrée, 1 sortie, "Bouton droit de souris + Vue Champ/Champ + y + y/temps" affiche la réponse du modèle en chacun des points candidats en fonction de l'entrée "temps".

33. Prédiction de la valeur moyenne de la réponse y

Neuro Pex affiche la valeur moyenne de la réponse y en fonction des points candidats de l'entrée "temps".
Les points optimaux, répétés ou non (traits noirs), sont à x = temps = 1,2 heures (1 heure 12 minutes) et à x = temps = 6,9 heures (6 heures 54 minutes).
"Bouton droit de souris + Choix des courbes" permet d'afficher plusieurs courbes, dont les intervalles de confiance sur la réponse.

34. Intervalles de confiance

Copiez les champs intervalles de confiance IC_Min et IC_Max du menu Liste des champs vers le menu Tracés principaux.

35. Intervalles de confiance (suite)

Les intervalles de confiance IC_Min et IC_Max sont une estimation au premier ordre de la région de confiance autour de la réponse y. Ils sont disposés symétriquement autour de la réponse y.
Pour des modèles non-linéaires, l'information au premier ordre peut s'avérer dramatiquement fausse et n'est pas suffisante.

36. Simulation de Monte-Carlo

Neuro Pex propose des simulations de Monte-Carlo pour une estimation précise des valeurs possibles des paramètres et de la réponse, ainsi que leurs régions de confiance respectives.
- Nombre de simulations : de 100 à 30.000. Efron recommande au moins 5.000 simulations.
- Nombre d'initialisations : ayant des valeurs différentes des paramètres (valeurs centrales +/- écarts-type calculés au premier ordre pour le plan considéré, ici 14 points, cf. copie d'écran 29) lors de l'initialisation de l'algorithme d'apprentissage. Neuro Pex conservera les résultats du meilleur apprentissage.
- Nombre d'itérations : le nombre maximal d'itérations effectuées par l'algorithme d'apprentissage pour la réestimation des coefficients.

37. Rapport de diagnostic des simulations de Monte-Carlo

Neuro Pex complète le rapport de diagnostic du plan à 14 points (copies d'écran 29 et 30) avec les résultats des simulations de Monte-Carlo. Avec un grand nombre de simulations, ces estimations sont plus précises que celles au premier ordre.

38. Estimation de performance Monte-Carlo

Cliquez sur le menu "Edition + Estimation de performance (Monte-Carlo).

39. Estimation de performance Monte-Carlo (suite)

A partir des simulations de Monte-Carlo et des valeurs calculées après réapprentissage des modèles, ici 1.000 modèles, Neuro Pex affiche en chaque point candidat la valeur moyenne de la réponse, le biais anticipé, l'erreur de prédiction et un intervalle de confiance (valeurs min/max) pour la réponse.

40. Intervalles de confiance Monte-Carlo

"Bouton droit de souris + Choix des courbes + IC_Min + IC_Max" permet d'afficher les intervalles de confiance IC_Min et IC_Max estimés par simulation de Monte-Carlo. Selon le nombre de simulations, ils sont plus précis que les intervalles de confiance calculés au premier ordre (copie d'écran 35). Ils ne sont pas nécessairement symétriques autour de la réponse y.

41. Prédictions Monte-Carlo

"Menu Edition + Prédictions (Monte-Carlo) affiche la table des [1.000 simulations x 101 points candidats] estimée à partir des apprentissages des [1.000 plans x 14 points]. Les points des plans sont simulés numériquement selon la loi du modèle et le bruit sur la réponse postulé à la copie d'écran 10.

42. Prédictions Monte-Carlo (suite)

"Bouton droit de souris + Histogramme + Data(69)" affiche l'histogramme des 1.000 réponses prédites en le point D-optimal temps = 6,9 heures à partir des 1.000 plans optimaux de 14 points.

43. Histogramme des prédictions Monte-Carlo

Neuro Pex affiche l'histogramme des 1.000 réponses prédites en le point D-optimal temps = 6,9 heures à partir des 1.000 plans optimaux de 14 points. Il y a une lègère asymétrie dans les grandes valeurs.

44. Estimation paramétrique Monte-Carlo

"Menu Edition + Estimations (Monte-Carlo) affiche la table des [1.000 x 2] paramètres estimée à partir des apprentissages des [1.000 plans x 14 points]. Les points des plans sont simulés numériquement selon la loi du modèle et le bruit sur la réponse postulé à la copie d'écran 10.

45. Estimation paramétrique Monte-Carlo (suite)

"Bouton droit de souris + Vue Champ/Champ + b2 + b2/b1" affiche les 1.000 couples [b1, b2].

46. Estimation paramétrique Monte-Carlo 14 points

Le modèle de Box-Lucas étant à 2 paramètres, il est intéressant d'afficher le graphique b2/b1, ici les 1.000 couples [b1, b2] estimés pour [1.000 plans x 14 points].

47. Estimation paramétrique Monte-Carlo 6 points

La même vue construite à partir de [1.000 plans x 6 points]

48. Estimation paramétrique Monte-Carlo 2 points

La même vue construite à partir de [1.000 plans x 2 points].

49. Intervalles de confiance Monte-Carlo 6 points

La vue des intervalles de confiance IC_Min et IC_Max estimés par simulation de Monte-Carlo pour le plan à 6 points. A comparer avec la copie d'écran 40.

50. Enregistrement du plan D-optimal

Cliquez sur "Menu Fichier + Enregistrer plan" pour enregistrer le plan d'expériences à 14 points.
Neuro Pex est le premier logiciel au monde à proposer d'une manière aussi conviviale le calcul de plans d'expériences pour modèles non-linéaires de connaissance et réseaux de neurones puis l'affichage des résultats.




Veuillez nous contacter pour en connaître davantage sur Neuro Pex.









© Netral - décembre 2005