Le format PRS version 1
(au 15 septembre 1998)

Emmanuel Giguet

Fonction

Le format PRS est un format de sortie d'analyseur syntaxique conçu à l'origine par Emmanuel Giguet pour être produit par l'analyseur de Jacques Vergne et lu par le visualiseur d'Emmanuel Giguet.

Options linguistiques principales

Un fichier PRS est constitué par une suite de phrases analysées.

Une phrase est composée de syntagmes non récursifs (SNR) (i.e., syntagmes minimaux).

un SNR est composé de mots (tokenisation conventionnelle classique)

les relations entre mots dans le SNR sont implicites

les relations entre SNR dans la phrase sont explicites et typées : dépendances, coordinations, antécédances (ces relations sont pensées non pas en terme d'arbre mais en terme de graphe sur la phrase conçue comme un espace à une dimension)

Structure d'un fichier PRS

Un fichier PRS est une suite de phrases analysées, constituées d'un segment de constituants et d'un segment de relations entre constituants

(¶ = saut de ligne)

Segment de constituants

Constituant

  • constituant :
    SNR et ses mots
    |
    GS et ses mots
  • SNR et ses mots :
    SNR
    liste de mots internes au SNR
  • SNR :
    %S¶
    catégorie¶
    liste d'attributs¶

  • liste de mots internes au SNR :
    liste de mots internes au SNR
    mot interne au SNR
    |
    mot interne au SNR
  • mot interne au SNR :
    mot central |
    mot périphérique |
    connecteur interne
  • mot central :
    %C¶
    description du mot

  • mot périphérique :
    %C¶
    description du mot

  • connecteur interne :
    %I¶
    description du mot

  • GS et ses mots :
    GS
    liste de mots internes au GS
  • GS :
    %G¶
    catégorie¶
    liste d'attributs¶

  • liste de mots internes au GS :
    liste de mots internes au GS
    mot interne au GS
    |
    mot interne au GS
  • mot interne au GS :
    connecteur externe
  • connecteur externe :
    %E¶
    description du mot

Segment de relations

Relations

  • relation de dépendance :
    %RD¶
    n° du constituant dépendant¶
    n° du constituant régissant¶
    étiquette de la relation¶

  • relation de coordination :
    %RC¶
    n° du constituant¶
    n° du constituant coordonné¶
    étiquette de la relation¶

  • relation d'antécédence :
    %RA¶
    n° du constituant antécédant¶
    n° du constituant régissant pronom relatif¶
    étiquette de la relation¶

*

page créée le 12/05/99 par Emmanuel Giguet