Atlas Multimédia Prosodique de l'Espace Roman
accueil guide partenaires DVD bibliographie liens

Cette page présente un résumé du protocole d'enquête et analyse AMPER. Il sert de référence aux enquêteurs des différentes équipes.

1. La préparation de l'enquête

1.1. Le code locuteur

Un code de 4 chiffres est attribué à chaque locuteur. Pour obtenir le code d'un locuteur:

1.2. Le corpus

Pour le corpus de l'enquête il faudra choisir

  1. un SN (art + nom trisyllabique proparoxyton)
  2. un SN (art + nom trisyllabique paroxyton)
  3. un SN (art + nom trisyllabique oxyton)
  4. un verbe bisyllabique qui puisse régir tous les 3 noms en fonction de sujet ET d'objet.
  5. un adj trisyllabique proparoxyton
  6. un adj trisyllabique paroxyton
  7. un adj trisyllabique oxyton
  8. un SP (prep + nom trisyllabique proparoxyton)
  9. un SP (prep + nom trisyllabique paroxyton)
  10. un SP (prep + nom trisyllabique oxyton)

Le corpus de l'enquête consiste de phrases exploitant les combinaisons de ces éléments. Ci-dessous vous trouvez le corpus complet avec les codes des structures.

Chaque structure sera enregistrée au moins 3 fois à la forme affirmative et 3 fois à la forme interrogative. Eventuellement, il est possible d'enregistrer les formes négative et interrogative-négative, mais cela n'est pas obligatoire.
Le code final de chaque phrase enregitrée se compose de 9 chiffres:

Par exemple, le code 06b1bwka2 se compose de: 06b (localité) + 1 (homme) + bwk (structure syntaxique) + a (modalité affirmative) + 2 (deuxième répétition).

2. L'enquête

L'enquête doit être menée sur place. L'enquêteur doit solliciter les phrases sans les faire lire, la lecture pouvant donner un profil intonatif biaisé: on conseille de solliciter les phrases à travers des dessins en ordre aléatoire.

Chaque phrase doit être obligatoirement répétée au moins 3 fois à la forme déclarative affirmative et 3 fois à la forme interrogative. De toute façon, on conseille de prévoir au moins 4 ou 5 répétitions de chaque phrase, pour pouvoir éventuellement éliminer les répétitions contenant des erreurs, des bruits de fond ou autre.

Important: tout enregistrement doit être fait à 16 MHz.

3. Après l'enquête

3.1. Segmentation et étiquettage

Après l'enquête, l'enregisterment doit être segmenté pour obtenir un fichier WAV (toujours à 16 MHz) pour chaque phrase. Le nom du fichier doit correspondre au code de la phrase contenue (par exemple 0601bwki1.wav : 0601 indique le locuteur, bwk la structure syntaxique, i la forme interrogative, 1 la première répétition).

Tous les fichiers doivent être étiquettés avec Praat: toutes les voyelles orales, nasales ou nasalisées doivent être étiquettées comme |v|, des éventuelles voyelles désonorisées (ex. en portuguais ou en roumain) doivent être étiquettées comme |f|. Les consonnes et les silences ne doivent pas être étiquettés. L'étiquettage doit être sauvegardé au format Textgrid et avec le même nom que le fichier wav correspondant : on obtiendra ainsi un fichier Textgrid pour chaque fichier wav.

3.2. Analyse acoustique

Quand les fichiers sont prêts, vous devez lancer le script de Praat pour chaque phrase. Le script fait des analyses acoustiques et produit des fichiers txt, dans lesquels sont sauvegardées des valeurs importantes.
(Les fichiers txt pourront être utilisés pour l'affichage de diagrammes et de stimuli synthétique avec l'interface développée par Albert Rilliard, mais cela n'est pas obligatoire - v. ce lien pour plus d'info).

3.3. Transcriptions

Il est nécessaire de faire une transcription orthographique et phonétique large (en API) pour chaque phrases du corpus (1 pour les 3 répétitions). Vous pouvez vous servir de l'outil ci-dessous pour les faire: cliquez sur les phones pour les insérer. Quand vous avez terminé, sélectionnez tout le texte (ctrl+a), copiez-le (ctrl+c) et collez-le (ctrl+v) dans un éditeur de texte (par ex. Notepad). Vérifier que le codage du fichier soit bien UTF-8 et sauvegardez-le en format txt.

4. L'envoie des données

Chaque enquête complète et analysée doit être envoyée par mail ou par courrier à Albert Rilliard pour inclusion dans la BD et au secrétariat de Grenoble pour inclusion dans l'atlas dialectologique.
Les fichiers à envoyer sont les suivants:

Ci-dessous vous pouvez trouver une explication de la méthodologie AMPER publiée par Antonio Romano, Jean Pierre Lai & Stefania Roullet dans Géolinguistique, hors-série 3, 2005)

Résumé

Dans cette brève contribution, nous essayons de faire le point sur plusieurs problèmes que l’on s'est posés au Centre de Dialectologie de Grenoble dès le début des recherches sur la prosodie des variétés dialectales dans le cadre du projet de l'Atlas Multimédia Prosodique de l'Espace Roman (AMPER).
Le principe de base est que pour aboutir à une comparaison entre les données recueillies dans les différents domaines linguistiques il faut une démarche scientifique identique, pour chaque variété. En vue d'une analyse comparative posant sur des bases fiables, il est important d'avoir un contrôle adéquat de toutes les variables en jeu et de baser l'évaluation des propriétés prosodiques sur une méthode multiparamétrique.
A la suite de l'idée de M. Contini de lancer un projet dans cette direction, le groupe grenoblois a définit et a publié en plusieurs occasions des propositions de travail préliminaires issues des premières recherches menées dans des domaines caractérisés par la présence de dynamiques prosodiques différentes.
Pour ce numéro hors série de Géolinguistique nous reprenons certains de ces arguments, sur la base des travaux précédents.

1. Introduction

Le travail que nous avons entrepris au sein de l'AMPER bénéficie de l'expérience de plusieurs générations de chercheurs qui se sont penchés sur le thème de l'analyse suprasegmentale. Il se base sur un paradigme expérimental pour l'étude de la prosodie de langues et dialectes défini surtout au cours des trois dernières décennies à Grenoble - d'abord à l'Institut de Phonétique puis aussi au Centre de Dialectologie - dans le cadre de recherches dirigées par Michel Contini.
La plupart des réflexions méthodologiques qui sont à la base des stratégies d'analyse développées dans la cadre de l'AMPER ont déjà fait l'objet de nombreuses publications et, grâce aussi à la disponibilité d'outils informatiques relativement plus accessibles pour l'extraction et le traitement des mesures acoustiques et à l'intérêt de chercheurs de différents laboratoires, ont reçu récemment une diffusion internationale.
En effet, suite à l'affirmation de l'enjeu descriptif de la prosodie des langues du monde (cf. Hirst & Di Cristo, 1998), on s'est rendus compte que ces travaux nécessitaient quelques précautions de plus : des enquêtes sur le terrain d'un type nouveau, avec des questionnaires ad-hoc et, surtout, des enquêteurs capables de sensibiliser les informateurs à une maîtrise totale de leur parler et également au niveau de l’exécution (cf. Lai, Romano & Roullet, 1997). Dépassée l'exigence technique de disposer d'outils d'analyse fiables, la question restait celle de maîtriser en quelque sorte les multiples variables présentes dans ce genre de phénomènes et de définir des objectifs descriptifs de complexité progressive sans tomber dans le piège de l'arbitraire quant au choix des phénomènes à observer et à leur classification (Martin, 2003).
Le projet a donc démarré, se proposant de fournir des récoltes de données (vérifiées localement et soumises à une analyse multiparamétrique préalable) qui puissent aider à comprendre les règles de structuration prosodique des langues et à formuler des hypothèses spécifiques au sujet de leur variation.

2. Principes de base

L'une des hypothèses de départ sur lesquelles se base notre démarche est que les variétés linguistiques que nous nous proposons d'étudier présentent (1) des phénomènes d'accentuation, de mise en relief d'unités complexes dans la chaîne segmentale, et (2) des phénomènes de structuration intonative de nature syntaxique, sémantique, pragmatique et expressive.
Ayant observé que ces faits se manifestent grâce à l'évolution d'un choix restreint de paramètres acoustiques de durée, hauteur, intensité et, dans une moindre mesure, timbre, on s'est consacrés pendant longtemps à définir des techniques d'extraction des valeurs assumées surtout par les trois premières de ces variables.
De plus, ayant élu les noyaux vocaliques comme sièges privilégiés de la manifestation des phénomènes de hiérarchisation prosodique (avec la perte d'un ensemble d'informations que l'on peut assumer comme une limitation momentanée), les techniques d'analyse mises au point dans ce cadre ont permis de restreindre les traitements à la manipulation d'une sélection de valeurs concernant uniquement les segments vocaliques.
Les procédures d'analyse sont celles développées dans différents laboratoires européens dans les années 70-80 (ICP de Grenoble, IPO d'Eindhoven, LPL d'Aix-en-Provence) mais, au Centre de Dialectologie de Grenoble, suite aux propositions de M. Contini (1992) et de Contini et al. (1998), on y a greffé par-dessus des méthodes originales de stylisation et modélisation qui, tout en tenant compte de la variation (avec une évaluation statistique de la significativité de certains traits), permettent aussi des déterminer des prototypes intonatifs.
Néanmoins c'est surtout la bonne qualité et le contrôle attentif de l'origine des données, de leur homogénéité et de leur représentativité, qui conditionnent la réussite de cette démarche. Pour cette raison l'approche dialectologique nous semble fondamentale.

3. Présentation des données

Une autre perspective envisagée dans le cadre du projet AMPER est celle d'une présentation multimédia des résultats obtenus, ce qui se traduit dans les possibilités de vulgarisation offertes par la nouvelle génération des atlas parlants. Comme nous l'avons montré à plusieurs occasions (v. par ex. Lai & Romano, 2002), la cartographie - envisagée pour les tracés et les courbes issus de l'analyse acoustique - permettrait d'observer la manière dont se distribuent dans l'espace les variétés qui présentent les mêmes tendances. Tout en définissant des isoglosses prosodiques, des grosses aires pourraient se dégager, avec l'émergence d'indices se prêtant aussi à une interprétation typologique. Toutefois, dans le domaine de la prosodie la séparation entre indices de variation phonétique et descripteurs phonologiques n'étant pas encore bien définie (cf. Marotta, 2000 ; Martin, 2003), on hésite à classer les phénomènes observés sur une échelle de ce type. Actuellement, notre objectif est de recueillir des données homogènes, relatives à des contextes dans lesquels la variation - de variables différentes à tour de rôle - est soumise à des contraintes structurales (corpora de phrases avec éléments échangeables et techniques d'expansion progressive) et expressives (modalités pragmalinguistiques fixes, patrons intonatifs contextuels, focalisation localisée). Même dans ces conditions, des fluctuations apparaissent, témoignant de possibilités stylistiques différentes, mais surtout d'une variabilité individuelle et accidentelle. Une méthode s'est alors imposée, pour évaluer l'énorme quantité de manifestations possibles, celle de la moyenne statistique (v. aussi Rossi et al.1981).

4. Stylisation et Modélisation

Pour la caractérisation des prototypes intonatifs, nous poursuivons la représentation des séquences de valeurs de nos paramètres sur la base d'allures moyennes extraites d'un échantillon de répétitions d'un même schéma. Il est évident que les séries de valeurs moyennes issues de cette stylisation auraient peu de pouvoir représentatif si elles n'étaient pas validées par des tests de perception, la plupart du temps laissés à l'autonomie de l'opérateur, expert des parlers étudiés (comme le souhaitent entre autres Hirst & Di Cristo, 1998). C'est, ensuite, sur la base de ces courbes qu'une modélisation est possible, en soumettant les prototypes intonatifs observés à des comparaisons serrées et à des études contrastives.
Les données ainsi traitées sont disponibles pour la compréhension des règles de structuration prosodique des diverses variétés (dans notre cas, de l'espace roman). En l'état actuel, sur la base des résultats de nos thèses respectives et d'autres publications successives (v. Références), nous avons pu montrer des applications possibles de cette méthodologie de travail à l'étude de la variabilité géographique, individuelle, stylistique et à l'analyse descriptive des marques régionales et de quelques clichés intonatifs sociaux.
D'après notre expérience, avec les réflexions préalables stimulées par la disponibilité d'une grande base de données cohérentes, il est possible d'arriver à une meilleure évaluation des points-charnière sur lesquels pivote l'articulation prosodique des énoncés. Bien entendu si d'autres utilisateurs le considèrent utile, ils peuvent d'ores et déjà compter sur ces données pour les soumettre à d'autres types de traitements, l'un des objectifs de ce projet étant celui de rassembler des informations qui puissent contribuer à la validation de divers modèles d'analyse et de représentation prosodique.
Notre choix, pour le moment, est de rester bien en amont des préoccupations qui poussent à rechercher un système de notation : on est encore au stade de devoir comprendre exactement quels sont les faits qu'il faut transcrire (cf. Romano, 2003).

Références

  • Contini M., 1992, « Vers une géoprosodie », Actes du "Nazioarteko Dialektologia Biltzarra Agiriak" (Bilbao, 1991), Publ. Real Academia de la Lengua Vasca, Bilbao, 83-109.
  • Contini M., Lai J-P, Romano A. & Roullet S., 2002, « Vers un Atlas prosodique parlant des variétés romanes », in Mélanges offerts à Xavier Ravier, Sempre los camps auràn segadas resurgantas, Bouvier J-C, Gourc J. et Pic F. (eds), Toulouse, Université de Toulouse-Le Mirail FRAMESPA, Collection Méridiennes, 73-85.
  • Hirst D. & Di Cristo A., 1998, Intonation Systems: a Survey of Twenty Languages, Cambridge, Cambridge Univ. Press.
  • Lai J-P, 2002, L'intonation dans le parler de Nuoro, Thèse de Doctorat en Sciences du Langage, Université Stendhal de Grenoble.
  • Lai J-P & Romano A., 2002, « Etat d'avancement du projet AMPER (Atlas Multimédia Prosodique de l'Espace Roman) », Bollettino dell'Atlante Linguistico Italiano, 26, Torino, 199-203.
  • Lai J-P, Romano A. & Roullet S., 1997, « Analisi dei sistemi prosodici di alcune varietà parlate in Italia: problemi metodologici e teorici », Bollettino dell'Atlante Linguistico Italiano, 21, Torino, 23-70.
  • Marotta G., 2000, « Allineamento e trascrizione dei toni accentuali complessi: una proposta », in Locchi D. (éd.), Il parlante e la sua lingua. Atti delle X Giornate di Studio del GFS (Napoli, 13-15 dicembre 1999), Napoli, IUO, 139-149.
  • Martin Ph., 2003, « ToBI : l'illusion scientifique? », in Aubergé V., Lacheret-Dujour A. & Lœvenbruck H. (eds), Actes des Journées Prosodie 2001 (Grenoble, France, 10-11 octobre 2001), 109-113.
  • Romano A., 1999, Analyse des structures prosodiques des dialectes et de l'italien régional parlés dans le Salento (Italie): approche linguistique et instrumentale, Thèse de Doctorat en Sciences du Langage, Université Stendhal-Grenoble3.
  • Romano A., 2003, « Applicabilité des systèmes de transcription et d'analyse de l'intonation aux cas de variabilité dialectale présentés par la situation géoprosodique italienne », in Aubergé V., Lacheret-Dujour A. & Lœvenbruck H. (eds), Actes des Journées Prosodie 2001 (Grenoble, France, 10-11 octobre 2001), 115-118.
  • Rossi M., Di Cristo A., Hirst D., Martin P. & Nishinuma Y., 1981, L'intonation. De l'acoustique à la sémantique, Paris, Klincksieck.
  • Roullet S., 1999, Accent et intonation dans deux parlers francoprovençaux de la Vallée d'Aoste (Sarre et Cogne), Thèse de Doctorat en Sciences du Langage, Université Stendhal-Grenoble3, 2 vol.