L'Analyseur Syntaxique

Le système d'analyse syntaxique que nous présentons ici est un système de recherche. Les concepts de base de cet analyseur ont été introduits par Jacques Vergne et évoluent dorénavant dans le cadre de notre coopération. Ce n'est ni la couverture, ni la performance qui sont directement visées. La couverture n'est recherchée que sur des configurations bien définies, et a pour objectif la validation par le corpus des concepts formalisés. La performance n'est qu'une conséquence de l'adéquation de ces concepts à l'analyse de l'objet.

L'analyseur syntaxique combine les techniques de l'étiquetage grammatical pour construire des segments non-récursifs et un algorithme de calcul des dépendances pour calculer la structure fonctionnelle. L'analyseur qui a produit ces résultats a été écrit par Jacques Vergne. Ce système est déterministe et a une complexité linéaire.


Quelques Thèmes

Un des points forts de ce système est la possibilité qu'il offre, lors de l'écriture des règles d'analyse, de gérer de manière naturelle et maîtrisée les positions relatives des éléments liés par une relation de dépendance. Nous pensons que ce mécanisme permet l'analyse de tout type de dépendances et nous l'utilisons comme tel. Pour illustrer ce point, nous avons sélectionné des problèmes apparemment différents résolus avec cette même méthode. Ceci tend à prouver que les pistes suivies méritent une attention.

-La relation Sujet-Verbe
-La coordination
-La catégorie syntaxique de que
-de partitif

Dans le visualiseur, l'analyse syntaxique de ces thèmes, phrase à phrase, est accessible par un double-clic dans la liste de sélection des textes (sujetverbe donne accès aux relations Sujet-Verbe, coord aux relations de Coordination, que au statut de 'que', partitif au statut de 'de').


Nos corpus de mise au point

Une sélection de corpus est à votre disposition, pour consultation, afin que vous puissiez évaluer la compléxité des structures syntaxiques que nous cherchons à analyser. Chaque catégorie de textes possède son propre style et son propre niveau de langue.

-Un article scientifique de Biologie (2626 mots) :
Rôles et transformations des pigments caroténoïdes dans les réseaux trophiques marins
M. Vincent, revue "Umi" (La Mer) de la société franco-japonaise d'océanologie de Tokyo)
- Un extrait d'un livre d'Informatique (3315 mots) :
La reconnaissance des formes
Méthodes structurelles pour la reconnaissance des formes. L. Miclet, éditions Eyrolles.
- Un recueil d'articles journalistiques (9986 mots ) :
Articles du journal Le Monde
- Un extrait de roman (9541 mots) :
De la Terre à la Lune (Jules Verne)
- Un extrait de texte philosophique (14380 mots) :
Discours sur l'origine et les fondements de l'inégalité parmi les hommes
Texte libre de droits mis à disposition par le CRI Philosophie
(MAFPEN de l'Académie de Nancy-Metz, France)

Dans le visualisueur, l'analyse syntaxique de ces textes, phrase à phrase, est accessible par un double-clic dans la liste de sélection des textes (LeMonde donne accès aux articles du Monde, pigments au texte sur les pigments caroténoïdes, formes à la reconnaissance des formes, philosophie au texte philosophique, TerreLune à De la Terre à la Lune).


Évaluation de l'analyseur

Une évaluation de l'analyseur a été menée sur des extraits d'articles du journal "Le Monde". Vous pouvez consulter
les résultats.

Accès au Visualiseur d'Analyses Syntaxiques

Le visualiseur d'analyses syntaxiques est écrit en Java à l'aide du JDK 1.1. Cette applet est en cours de développement et le changement de langues de l'interface est pour le moment indisponible. La vitesse de chargement de l'applet et des données est certainement très lente. A terme, l'interface permettra l'annotation semi-automatique de corpus et la comparaison de deux corpus.

- dans une fenêtre javascript

Un manuel de l'utilisateur est disponible. Consultez-le !

Description des codages utilisés

-Le format PRS version 1
-Catégories de mots et de SNR

Emmanuel.Giguet@info.unicaen.fr - mardi 8 avril 1997
- visiteurs -