Le CNRS
Accueil SHS
Autres sites CNRS
 
  Accueil > Enseignement > Pour une grammaire de l'information : questions, réponses, affects
 

Typologie et dialogue : la structuration informationnelle des questions et des réponses

 

Séminaire de doctorat de M.M. Jocelyne Fernandez-Vest

Année 2011-2012

les jeudis de 11h à 13h, tous les quinze jours

Centre Bièvre – 5 rue Censier – 75005 Paris – 3° étage salle E

 

• Séance du 5 avril 2012 :

Vers une anatomie fonctionnelle de la conversation spontanée
Jean-Louis Dessalles

Le comportement langagier se réalise essentiellement dans la conversation spontanée, qui occupe un tiers de notre temps d'éveil. La conversation est un jeu contraint, où la moindre faute de pertinence est socialement sanctionnée. Je montrerai, à partir d'exemple tirés de narrations spontanées et de discussions spontanées, comment les éléments de notre production langagière sont « calculés » pour rendre l'intérêt de la contribution maximal.

Bibliographie
Dessalles, J-L. (2008). La pertinence et ses origines cognitives - Nouvelles théories. Paris: Hermes-Science Publications.
Dessalles, J-L. (2009). Why we talk - The evolutionary origins of language (2nd edition). Oxford: Oxford University Press.

------------------------------------------------------------

2010-2011
Pour une grammaire de l'information : questions, réponses, affects

     Dans la continuité du séminaire présenté les deux années précédentes sur « La structuration informationnelle, entre typologie et universaux linguistiques », on ciblera en 2010-2011 la PAIRE DIALOGIQUE QUESTION-RÉPONSE. Par-delà les travaux, déjà nombreux, consacrés aux différents types de QUESTION (Q totale / Q partielle / Q alternative), on s'attachera aux implications universalistes de la RÉPONSE : la R, énoncé assertif naturel de la conversation ordinaire, permet – plus clairement que les énoncés « neutres » de la tradition structuraliste – de traiter des problèmes de contexte / cotexte / enchaînement textuel. On s'appuiera sur une méthodologie fonctionnaliste élaborée initialement pour une langue prototypique de l'oralité, qui permet de distinguer 3 types de R : 1/ R simple, une prédication unique, dont le noyau constitue l'Enoncé Communicatif Minimal, 2/ R complexe, 3/ R multiple, une séquence d'énoncés liés par un tempo rapide.
    On scrutera aussi dans la paire dialogique de diverses langues l'expression de l'AFFECT : comment décrire, à l'aide d'instruments linguistiques (ordre des mots, marqueurs discursifs, mises en valeur prosodiques) les opérations cognitives effectuées par l'énonciateur sur ses propres représentations, et les stratégies de recyclage de l'ÉMOTION spontanée en une structuration intentionnelle de l'information ?
    La méthode sera appliquée à des genres discursifs variés : débats et interviews politiques, dialogues de théâtre, conversation quotidienne – et à des langues typologiquement différentes – langues indo-européennes (français, anglais, espagnol), langues finno-ougriennes, langues d'Asie du Sud-Est. Le séminaire bénéficiera de la participation des chercheurs du projet SITY (Structure Informationnelle et Typologie), programme de la Fédération Typologie et Universaux Linguistiques du CNRS.

 

------------------------------------------------------------

2009-2010
La structuration informationnelle, entre typologie et universaux linguistiques

 

     Les avancées récentes de la Linguistique remettant en cause les acquis d’un domaine classique en syntaxe, l’ordre des mots, la Structuration Informationnelle (SI, relations Thème - Rhème - Post-Rhème / Mnémème / Antitopic) est devenue l’une des problématiques vives de la variation translinguistique. Faut-il continuer de présenter la SI comme une tendance universelle de l’expression linguistique ou langagière que sous-tendent des processus cognitifs ? Faut-il au contraire ramener la SI dans le giron de l’analyse typologique, en posant par exemple le préalable d’une distinction de niveaux, niveau énonciatif vs. niveau morphosyntaxique, pour réviser nos conceptions de l’ordre des mots / l’ordre des constituants ? Ces deux angles d’approche seront confrontés à des données diverses : linguistiques (langues indo-européennes et langues finno-ougriennes/ouraliennes notamment) et énonciatives (de la parole impromptue au dialogue fictif du genre littéraire).
     Seront abordées en particulier trois types d’opérations exploités par la SI :
            1. rhématisation et focalisation ;
            2. grammaticalisation des constructions à détachement ;
            3. hiérarchisation des enchaînements thématiques.

Séance de clôture le vendredi 18 juin de 14h à 17h au Lacito (bât. D, salle 311). Voir ci-dessous.

 

Bibliographie indicative :

COMRIE Bernard, 1981, Language universals and linguistic typology, Oxford, Basic Blackwell.
— 2005, « La typologie des langues ouraliennes, comparées avec les autres grandes familles d’Eurasie septentrionale, in Les langues ouraliennes aujourd’hui – The Uralic Languages today, 75-86.

ERTESCHIK-SIR Nomi, 2007, Information Structure. The syntax-discourse interface, Oxford, Oxford University Press, Oxford surveys in syntax and morphology, 246 p.

FERNANDEZ-VEST M.M.Jocelyne, 2004, Chap. 4. « The information structure of bilingual meaning : a constructivist approach to Californian Finnish conversation », in Tuija Virtanen (ed), Approaches to cognition through text and discourse, Mouton de Gruyter, 49-76.
— 2006, Vers une typologie linguistique du détachement à fondement ouralien d’Europe, Bulletin de la Société de Linguistique de Paris, 2006-1, 173-224.
— 2007, « Word Order in context : Information Structure, a revolutionary approach to Uralic typology ? », in Csepregi Márta & Virpi Masonen (sz.), Grammatika és kontextus új szempontok az uráli nyelvek kutatásábán. Grammar and context – new approaches to the Uralic languages, Eötvös Loránd Tudományegyetem, Finnugor Tanszék, Budapest, 2004, április 4-7, Budapest, Urálisztikai tanulmányok, 17, 88-100.
— 2009, « Vers une typologie informationnelle des constructions à détachement », in D. Apotéloz, B. Combettes & F. Neveu (éds.), Les linguistiques du détachement. Actes du Colloque International de Nancy (7-9 juin 2006), Bern - Berlin…, Peter Lang, 251-262.

FERNANDEZ-VEST M.M.Jocelyne & COMRIE Bernard (eds.), 2007, Is Information Structure a typological category or a Universal?, prépublication du 7ème Colloque de l'Association Internationale de Linguistique Typologique (ALT 7, Paris, septembre 2007) et volume collectif en préparation.

GOMEZ-GONZALEZ María Ángela, 2000, The Theme-Topic interface. Evidence from English, Amsterdam, John Benjamins, Pragmatics and Beyond 71.

KRIFKA Manfred, 2006, Basic notions of information structure, in C. Fery, G. Fanselow & M. Krifka (eds.), Interdisciplinary studies of information structure, University of Potsdam.

LAMBRECHT Knud, 1994, Information structure and sentence form. Topic, focus and the mental representations of discourse referents, Cambridge, Cambridge University Press.
— 2004, « Un système pour l’analyse (…) des constructions clivées en français », in Structure Informationnelle et Particules Enonciatives…, 21-61.

PRINCE Ellen, 1981, Towards a taxonomy of given/new information, in P. Cole (ed.), Radical pragmatics, New York, Academic Press, 223-244.

Les langues ouraliennes aujourd’hui – The Uralic Languages today. Approches linguistiques et cognitives – A linguistic and cognitive approach, M.M.J. Fernandez-Vest (dir.), Paris, Ed. Honoré Champion, Bibliothèque de l’Ecole des Hautes Etudes, 2005, vol. 340, chap. IX. Sémantique et cognition : La Structure Informationnelle des langues ouraliennes comparée à celle d’autres langues du monde, 515-609.

Les opérations de thématisation en français ; Cahiers de praxématique, 30, 1998.

Structure Informationnelle et Particules Enonciatives – essai de typologie, 2004, M.M.J. Fernandez-Vest & Sh. Carter-Thomas (éds.), Paris, Ed. L’Harmattan, Grammaire & Cognition 1-2, 362 p.

 

Séance de clôture

Deux exposés destinés à présenter des travaux de doctorat en préparation

1. La syntaxe de Lupita: thème et rhème dans le discours hispanophone du peuple naso (Panama)

Kafda Vergara Esturaín
Université Paris 3-Sorbonne Nouvelle, UMR 7107 LACITO

Objectif: Analyser les particularités du processus de thématisation dans le discours hispanophone du peuple naso par opposition à l’espagnol ciblé ou "scolaire" panaméen et régional.
Mots clés: analyse informationnelle, contexte, deixis, discours, énonciation, thématisation, diglossie.

   Ce travail est parti d’une série de contacts avec le peuple naso du Panama et des premières observations de son discours hispanophone. On se fixe le but de chercher les caractéristiques de cette variante linguistique par opposition à l’hispanophonie qui a cours dans le monde dit “standard” ou “des médias”, modélisés par la dimension écrite.
    Parler d’oralité ou de discours dans la tradition scolaire-universitaire de Panamá et de l’Amérique Centrale signifie parler fréquemment soit des distinctions morphologiques et lexicales, soit des corrections presque automatiques des “erreurs” grammaticales. Une fois distinguées, ces erreurs sont exposées à travers un travail d’ordre didactique pour les éviter. Toute distinction discursive qui s’éloigne de la norme souhaitée est destinée à être supprimée.
    Il est aussi fréquent que la cause de cette “mauvaise langue” soit liée aux emprunts d’une langue maternelle moins prestigieuse que l’espagnol (souvent une langue amérindienne). On attribue aussi la responsabilité de ces “erreurs” à une génération précédente de parlants non lettrés. Dans le cas des peuples comme les naso, où la diglossie entre l’espagnol et la langue naso est un phénomène assez récent, ce sont les personnes âgées, non scolarisées et éloignées du contact avec d’autres peuples qu’on considère responsables de tous ces phénomènes de variation hispanophone “bizarre”.
    Ces hypothèses ne restent que dans l’imaginaire de la collectivité hispanophone car elles ne sont pas confirmées scientifiquement. La recherche sur ce type de phénoménologie linguistique est quasiment absente des travaux universitaires locaux. Il n’y a que quelques universités de la région (notamment de Costa Rica) qui font appel à la recherche sur la typologie et le caractère oral des langues amérindiennes.
    Malgré ces efforts, les propositions d’études de l’espagnol oral et des variantes existantes entre les divers groupes ethniques centroaméricains sont très rares. La description de l’oral au Panama, par exemple, a été historiquement liée aux études littéraires ou à la tradition folklorique, et la valeur de la syntaxe par rapport au lexique est reléguée au second plan dans les references bibliographiques.
    La syntaxe de Lupita se propose d’éclairer les phénomènes du discours hispanophone naso par une approche énonciative qui situe les phénomènes syntaxiques dans une perspective distincte de la comparaison automatique de la grammaire traditionnelle. L’étude de ce discours à travers son organisation informationnelle permettra de dégager des contenus contextuels difficiles à mettre en lumière par une autre approche d’analyse linguistique.
    Cette étude se base sur un corpus d’énoncés authentiques analysés d’un point de vue synchronique. Les observations faites dans les données disponibles détectent trois aspects qui nous semblent essentiels l’ensemble du corpus à recueillir et à analyser de façon quantitative (fréquence des apparitions du phénomène) et qualitative (valeur contextuelle et formelle du phénomène dans la chaîne informationnelle). Ces trois aspects sont:

  1. L’ordre des mots et la distribution tripartite de l’information :
    Pero cuando ah / sacaron a nosotros de allí
    (Mais quand ah / [ils] ont expulsé à nous de là-bas)
  2. Le procés de thématisation :
    Nosotro somo naso ter di // bueno / la vida de nosotro era trabajar
    (Nous sommes naso ter di // bon / la vie à nous était travailler)
  3. Le rôle des éléments déictiques:
    Pero cuando ah / sacaron a nosotros de allí / eh tumbaron la casa de nosotros ahí
    (Mais quand ah / [ils] ont expulsé à nous de là-bas / eh [ils] ont fait tomber la maison à nous là)

Quelques questions essentielles :
    Quelles sont les caractéristiques informationnelles qui distingueraient ce discours des autres discours hispanophones étudiés ou reconnus? Est-il possible de dégager les marques historiques et culturelles de ces phénomènes? Qu’est-ce que l’analyse de ce discours apporte aux études sur l’hispanophonie centroaméricaine et à l’analyse de la structuration informationnelle?

Références bibliographiques:
Cappeau Paul, 1999, Apostille sur certains sujets à l’oral, Faits de Langues, 13, 230-234.
Constenla-Umaña Adolfo, 2003, La linguistique de la Basse Amérique Centrale sur la période 1985-2000, Faits de Langues, 20, 27-43.
Fernandez-Vest M.M. Jocelyne, 2008, Subordination et degrés de phrasticité dans quelques langues ouraliennes: exemples samiques et fenniques, La Linguistique, 44-2, 99-116.
Fernandez-Vest M.M. Jocelyne, 2004, “Mnémème, Antitopic: le post-Rhème de l’énoncé au texte” in M.M.J. Fernandez-Vest & Sh. Carter-Thomas (éds.), Structure Informationnelle et Particules Énonciatives – essai de typologie, Paris, L’Harmattan, 63-99.
Mondada Lorenza, 2004, “Marqueurs linguistiques et dynamiques discursives: le rôle des verbes de perception visuelle et de la spatialité dans la gestion du topic”, in M.M.J. Fernandez-Vest & Sh. Carter-Thomas (éds.), Structure Informationnelle et Particules Enonciatives – essai de typologie, Paris, L’Harmattan, 101-135.
Piaget Sandrine, 2002, Interrelations entre oralité, écriture et culture, Travaux neuchâteleois de linguistique, 36, 25-45.

 

2. Les défis de la modélisation et de la représentation des données pour la fouille documentaire dans le domaine de l’Intelligence Economique

Erin MacMurray
Université Paris 3-Sorbonne nouvelle, EA SYLED
TEMIS R&D – 164 rue de Rivoli – 75001 Paris

   L’émergence des Nouvelles Technologies de l’Information et de la Communication (NTIC) permet aujourd’hui de transmettre, stocker, et recevoir, des quantités croissantes de données numériques. Cette explosion a favorisé la naissance de solutions et technologies destinées à répondre aux besoins de traitement et de gestion de l’information en langage naturel. Pour un spécialiste en Traitement Automatique du Langage (TAL), il est donc tout à fait légitime et nécessaire de participer à l’élaboration de telles solutions et technologies, particulièrement quand elles permettent de confronter recherche fondamentale et application opérationnelle de travaux issus des sciences du langage.
    Le domaine émergeant de la fouille documentaire, autrement dit Text Mining, tente, en particulier, d’apporter des solutions dans cet objectif, ayant pour ambition de transformer les bases documentaires de texte libre (c’est à dire non structuré) en données utilisables par les méthodes standards d’analyse de données.
    Ce travail s’inscrit donc dans le cycle de vie de produits logiciels au service de l’activité de l’intelligence économique. Il s’agit donc de l’élaboration d’outils destinés à extraire de l’information pertinente pour la construction de stratégies d’entreprises dans un environnement économique compétitif. Dans ce cadre, les données, le plus souvent productions journalistiques ou comptes rendus économiques, occupent une place centrale. Le but de la fouille documentaire étant de fournir une valeur ajoutée aux données, notamment par la détection d’informations non explicites, patrons et tendances, une modélisation en amont du domaine est nécessaire pour produire la représentation de l’information en aval. Notre objectif sera dans un premier temps de décrire les difficultés des tâches modélisation et représentation en montrant le fonctionnement et les résultats du logiciel de veille. Ensuite, nous discuterons des différentes solutions qui peuvent être apportées par les domaines d’étude divers en sciences du langage, de l’annotation des données aux analyses statistiques du langage. Enfin, nous tenterons d’ouvrir la discussion sur l’apport éventuel des analyses en Structure Informationnelle dans la construction d’outils de fouille documentaire.

Références
Coupet P., Bushbeck B., Six A., Cardoso F., Huot C. (2002). Le Text Multilingue : application au monde de l’intelligence economique. http://isdm.univ-tln.fr/PDF/isdm22/isdm22_coupet.pdf
Grishman, R. (1997) Information Extraction : Techniques and challenges. International Summer School. http://web.njit.edu/~ql23/teaching/cis634FTF/notes/Information_extraction_paper.pdf
Grishman, R. (2003). Information Extraction. In Mitkov, R. The Oxford Handbook of Computational Linguistics. Oxford University press.
Grishman, R., Sekine S., Hasegawa T. (2004). Discovering Relations among Named Entities from Large Corpora. Proceedings of the 42nd Annual Meeting of the Association. http://acl.ldc.upenn.edu/ acl2004/main/pdf/195_pdf_2-col.pdf
Lebart, L., Salem, A., 1994, Statistique textuelle, Paris, Dunod Salem, A., 1991, « Les séries textuelles chronologiques », Histoire & mesure, vol. VI – no1/2, p. 149-175.

 

 

cnrs
aa
paris3
aa
paris4
aa
tul

Intranet aa

Rechercher

Sur le WEB du laboratoire


aa

English

aa Langues et civilisations
à tradition orale
(UMR7107)

Imprimer Contacter le webmestre Plan du site Crédits Accueil