aa

Langues et civilisations
à tradition orale
(UMR7107)

          Le CNRS           Accueil SHS          Autres sites CNRS          
euroslav
cnrs paris3 inalco paris3 paris3
Rechercher
Intranet Lacito English




  Accueil > Programmes en partenariat > EuroSlav 2010

 

Projet EuroSlav 2010 / Projekt EuroSlav 2010         Citer le corpus

 

Base de données électronique de variétés slaves menacées dans des pays européens non slavophones (2010-2012)

Coord. Evangelia Adamou & Walter Breu (U. Konstanz)


Financement :

anrdfgAgence Nationale de la Recherche (ANR) /French National Research Agency & Deutsche Forschungsgemeinschaft (DFG)

Résumé / Zusammenfassung

Le projet EuroSlav 2010 vise la création d’une base de données électronique pour des parlers slaves en voie de disparition, situés dans des pays européens non slavophones. Il s’agit notamment de cinq parlers slaves, parlés en Italie (slave de Molise : Acquaviva Collecroce, Montemitro et San Felice del Molise), en Autriche (croate du Burgenland), en Allemagne (sorabe supérieur courant) et en Grèce (Liti et Hrisa).
Accès aux corpus EuroSlav ici.

carte

Les chercheurs des équipes française et allemande associés à ce projet sont des spécialistes de ces parlers. Leurs études ont déjà alimenté les recherches dans les domaines du contact de langues et de typologie.

Dans la continuation de leurs travaux, l'objectif du projet EuroSlav 2010 est la constitution d'une base de données orales, recueillies sur le terrain, accessible en ligne au format xml par la communauté des chercheurs. Les matériaux à archiver ont pour une part été enregistrés lors d’enquêtes déjà réalisées et seront complétés par de nouveaux enregistrements et annotations. Le corpus sera constitué de gloses morphosyntaxiques unifiées, en combinant les normes de typologie linguistique et la tradition en slavistique. La base de données associera son et texte, consultables en continu ou phrase par phrase (1 heure par parler). Le corpus sera intégré à la collection Pangloss, programme “Archives orales" du Lacito-CNRS, qui regroupe déjà 430 documents en 70 langues, et à la plate-forme COCOON (COllections de COrpus Oraux Numériques), avec 100 langues et 3400 documents en accès public. De cette façon, le projet bénéficiera des acquis de ces deux plate-formes et la pérennité de la base de données sera assurée.

L’originalité du projet EuroSlav 2010 est :

  • de constituer un corpus annoté de parlers slaves, en voie de disparition et non documentés, accessible en ligne par la communauté scientifique internationale ;
  • de proposer un corpus riche en phénomènes de contact de langues pouvant alimenter les recherches menées dans ce domaine ;
  • de faciliter l’accès des typologues et généralistes aux langues slaves non standardisées ;
  • de conserver pour l’avenir un patrimoine linguistique bientôt disparu.

Zusammenfassung

Im Projekt EuroSlav 2010 soll eine elektronische Datenbank für vom Aussterben bedrohte slavische Sprachvarietäten in nichtslavophonen europäischen Ländern geschaffen werden. Im einzelnen geht es um fünf slavische Varietäten in Italien (Moliseslavisch : Acquaviva Collecroce, Montemitro und San Felice del Molise), Österreich (Burgenlandkroatisch), Deutschland (Obersorbische Umgangssprache) und in Griechenland (Liti und Hrisa).

acquaviva
Acquaviva Collecroce (Molise)
Photo : ©W. Breu, 2000

Die am Projekt beteiligten französischen und deutschen Forscher sind Spezialisten dieser Varietäten. Die Ergebnisse ihrer Studien fanden bereits in sprachkontaktbezogenen und typologischen Forschungen Berücksichtigung.

Im Sinne einer Weiterführung ihrer Arbeit ist das Ziel des Projekts EuroSlav 2010 die Schaffung einer Datenbank aus in Feldforschung gesammelten mündlichen Daten, die der Forschergemeinde im Netz im XML-Format zugänglich sein soll. Die – teilweise schon anläßlich früherer Untersuchungen aufgenommenen – zu archivierenden Daten werden durch neue Aufnahmen und Kommentare vervollständigt. Das Datenkorpus soll vereinheitlichte morphosyntaktische Glossierungen enthalten, und zwar in einer Kombination der Verfahren der linguistischen Typologie und der slavistischen Tradition. Die Datenbank wird einen Verbund von Laut und Text darstellen, der fortlaufend oder Satz für Satz abgehört werden kann (1 Stunde pro Varietät). Das Korpus soll in das Programm "Archives orales" des Lacito-CNRS integriert werden, das bereits 200 Dokumente in 44 Sprachen umfaßt, sowie in die Plattform des CRDO (Centre de ressources pour la description de l’oral) mit 90 Sprachen und 1640 öffentlich zugänglichen Dokumenten. Auf diese Weise wird das Projekt von den Erfahrungen und Möglichkeiten dieser beiden Plattformen profitieren und der dauerhafte Fortbestand der Datenbank sichergestellt.

Die Originalität des Projekts EuroSlav 2010 besteht in

  • der Schaffung eines annotierten und der internationalen wissenschaftlichen Community online zugänglichen Korpus nicht dokumentierter und vom Aussterben bedrohter slavischer Sprachvarietäten;
  • der Bereitstellung eines an Sprachkontaktphänomenen reichen Datenkorpus, das zu Forschungen auf diesem Gebiet herangezogen werden kann;
  • der Erleichterung des Zugangs von Typologen und allgemeinen Sprachwissenschaftlern zu nichtnormierten slavischen Sprachen;
  • der Weiterbewahrung eines vom Verschwinden bedrohten sprachlichen Erbes für die Zukunft

 

san-felice

Femmes de San Felice / Frauen in San Felice
Photo : ©W. Breu, 2005

 

(page créée le 17 décembre 2009 – màj 09/01/2013)

Imprimer Contacter le webmestre Plan du site Crédits Accueil