S2D2

Sector status and dynamic density

Une présentation rapide

L'essentiel de la démarche et des résultats du projet est décrit ici (en anglais) : [Présentation DASC (2006)]

Description

Le projet S2D2 s'intéresse à la complexité du trafic aérien. Il a débuté en collaboration entre le LEEA et le LOG, et s'est poursuivi au pôle POM.

L'idée du projet est motivée au départ par les résultats d'un projet antérieur (CASSOS, phase I) dans lequel nous avions développé des algorithmes efficaces pour construire des configurations optimales de secteurs aériens, en fonction des flux de trafic et des contraintes de capacité des secteurs. Cependant, les flux entrants ne semblaient pas être très représentatifs de la charge de travail effective du contrôleur. Il restait donc à définir des indicateurs et des seuils plus pertinents que les flux entrants et les capacités.

Depuis déjà plusieurs années, diverses équipes mènent des recherches dans le but de mieux comprendre la complexité du trafic, et la charge de travail du contrôleur. De nombreuses études existantes proposent une variété d'indicateurs de complexité, parfois agrégés en une densité dynamique (par un régression linéaire), et il existe également un bon nombre de méthodes de validation de ces indicateurs. Le terme de complexité du trafic aérien, de plus en plus utilisé ces dernières années, recouvre en fait des conceptions et des réalités très diverses. Pour la Performance Review Unit (PRU, projet COCA) d'Eurocontrol, la complexité est abordée au moyen d'indicateurs agrégés sur une journée complète, avec pour objectif de comparer des centres de contrôle, et d'établir une typologie des secteurs. L'étude ne s'intéresse pas au domaine d'utilisation des secteurs de contrôle. Dans bon nombre d'autres études, la complexité est envisagée en relation avec la charge de travail du contrôleur à l'instant t . Elle est alors souvent subjective, dans le sens où elle est estimée par des contrôleurs aériens, lors de simulations ou sur du trafic réel, généralement rejoué. Certaines expérimentations prennent en compte des indicateurs physiologiques du stress du contrôleur face à un trafic donné, ou s'appuient sur la nature et la fréquence des interactions avec les outils de contrôle. Ces expérimentations pointues sont relativement lourdes à mettre en place, et devraient porter sur un vaste ensemble de secteurs et une population significative de contrôleurs pour avoir une portée générale.

L'idée du projet S2D2 est d'évaluer la pertinence des indicateurs en s'appuyant sur l'état de regroupement des secteurs d'espace aérien. Nous faisons ici l'hypothèse que les décisions de regrouper plusieurs secteurs sur une même position de contrôle, ou au contraire de "dégrouper" un secteur, sont statistiquement significatives de la charge de travail du contrôleur, tout en gardant à l'esprit les biais possibles (ouvertures de secteurs à des fins de formation, relève des équipes, incidents techniques, etc...). La complexité du trafic est donc ici envisagée à une échelle intermédiaire entre les indicateurs généraux de la PRU et la charge de travail instantanée. Nous cherchons une relation entre les indicateurs de complexité et le domaine d'utilisation des secteurs de contrôle, avec une granularité temporelle de l'ordre de la minute.

Notre objectif est donc de dégager d'éventuelles corrélations entre l'état de regroupement des secteurs aériens sur les positions de contrôle et un certain nombre d'indicateurs, basiques (nombre d'avions, flux entrants) ou plus évolués, qui se veulent représentatifs de la complexité du trafic dans un secteur choisi. Plusieurs types de méthodes nous semblent possibles pour s'attaquer à ce problème :

img_neural_net

L'originalité et l'avantage de la méthode de sélection d'indicateurs que nous proposons tient au fait que nous nous appuyons sur des données déjà archivées (traces radar, configurations de secteurs), relativement faciles à collecter, et issues d'une réalité opérationnelle objective. Ces données présentent toutefois l'inconvénient d'être bruitées, car tous les changements de configuration de secteurs ne sont pas dûs à des impératifs de charge de travail. On peut cependant espérer qu'en choisissant des journées de trafic dans une période chargée de l'année, nous disposerons de données assez peu bruitées.

Etat d'avancement

Le projet a nécessité une longue phase préparatoire, assez ingrate, comprenant les étapes suivantes:

L'analyse descriptive comprenait une analyse en composante principales, qui a permis de dégager 6 composantes principales, de valeur propre supérieure à 1, à partir des 27 indicateurs que nous avons codés.

Suite à cette phase préparatoire, nous avons utilisé des réseaux de neurones pour établir une relation entre ces composantes principales, auxquelles nous avons ajouté le volume du secteur, et les états de regroupement des secteurs. Il s'agit en fait d'un problème de classification, où l'on cherche à affecter chaque vecteur de valeurs des variables explicatives (composantes, ou volume) à une classe correspondant à un état de regroupement (secteur regroupé, armé, ou "dégroupé"). Nous avons donc utilisé des réseaux de neurones de type MLP ( multi-layer perceptron ), avec une fonction de transfert softmax appliquée à la couche de sortie, et qui minimise l'entropie croisée (plutôt que l'erreur quadratique).

Diverses combinaisons de composantes ont été testées, en les ajoutant successivement selon l'ordre suggéré par l'ACP. Le volume du secteur a également été ajouté comme entrée du réseau de neurones. Pour chaque combinaison testée, l'apprentissage du réseau de neurones se fait sur un sous-ensemble des données disponibles. Le reste des données est utilisé pour valider les prédictions du réseau sur des données fraîches. L'objectif étant de sélectionner un modèle statistique expliquant au mieux les états de regroupements (la variable cible), à partir d'une combinaison de composantes et du volume du secteur (les variables explicatives), nous avons retenu les critères de sélection suivant : le critère d'information d'Akaike (AIC), et le critère Bayesien de Schwartz (BIC, ou SIC).

===

Les résultats de cette démarche montrent que le modèle le plus explicatif est celui comprenant le volume du secteur et les 4 premières composantes principales : C1, liée au nombre d'avions dans le secteur, C2, représentative de la variance des vitesses, et des évolutions verticales, C3, qui regroupe les flux entrants (horizons temporels de 5, 15, 30, ou 60 minutes), et enfin C4, liée à la convergence des flux et à l'anticipation des conflits.

Avec le meilleur modèle que nous ayons trouvé, nous obtenons des taux de classification correcte de l'ordre de 84%, sur les données d'apprentissage comme sur les données de validation. Si l'on considère les résultats par classe, nous obtenons des taux d'environ 89% pour la classe secteur regroupé , 67% pour la classe secteur armé , et 91% pour la classe des secteurs dégroupés .

L'étape suivante de notre travail a consisté à évaluer les indicateurs de chaque composante pertinente, en utilisant à nouveau les réseaux de neurones. Les indicateurs les plus pertinents que nous ayons trouvé sont les suivants:

Rappelons cependant que l'on ne détecte que l'effet combiné des différents indicateurs. Le fait d'ajouter ou d'enlever certains indicateurs de l'ensemble de départ peut changer les résultats.

Au final, nous obtenons une relation simple et directe entre les valeurs des indicateurs pertinents et l'état de regroupement du secteur.

Les perspectives de travaux futurs comprennent notamment:

Logiciel

Le pré-traitement des données dans S2D2 est écrit en Objective Caml (logiciel libre). Le code de ce pré-traitement n'est pas dans le domaine public. L'analyse descriptive s'est appuyé sur le logiciel R. Pour les réseaux de neurones, nous avons dans un premier temps utilisé SNNS, puis le module nnet de l'environnement R. Finalement, une librairie de réseaux de neurones en Ocaml à été développée (voir page des logiciels du pôle POM).

Liens utiles

Principales publications

Toutes les publications du pôle POM sont disponibles ici.


Last Update: