Corpus

La dernière version stable du corpus Deep-Sequoia est la version 7.0 publiée en novembre 2015.

Accès au corpus

Version Lien Téléchargement Date Description Diff
7.0 Consulter sequoia-7.0.tgz
README-distrib
13 novembre 2015 Corrections par recherche systématique d’incohérences d’annotation. avec 1.1 (Conll) avec 1.1 (Graph)
1.1 Consulter deep-sequoia-1.1.conll 5 juin 2014 Corrections de lemmes, corrections de 3 phrases qui avaient plusieurs racines avec 1.0 (Conll) avec 1.0 (Graphes)
1.0 Consulter deep-sequoia-1.0.conll 29 mai 2014 Première version

Recherche de motifs

La recherche de motifs sur la dernière version (7.0) est disponible sur les 3 représentations en dépendances : surf, deep ou deep_and_surf.

Quelques statistiques

Les statistiques ci-dessous sont calculées sur la version 7.0 (deep_and_surf) :

  • 3 099 phrases
  • 67 038 unités lexicales (tokens) (dont 9 348 sémantiquement vides)
  • 81 607 relations:
    • 50 714 dépendances noires (i.e. surface & profonde)
    • 16 324 dépendances rouges (de surface seulement)
    • 14 282 dépendances bleus (qui existent en représentation profonde seulement)
    • 287 dépendances grises (ce sont de relations qui n’apparaissent que dans des représentations intermédiaires entre la surface et la représentation profonde)

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

Time limit is exhausted. Please reload CAPTCHA.