Oral Data Production
Le patrimoine sonore au laboratoire GIPSA-lab : plus d’un demi-siècle d’enquêtes dialectales
Sound Heritage at GIPSA-lab: More Than Half a Century of Dialect Surveys
Univ. Grenoble Alpes, CNRS, Grenoble INP*, GIPSA-lab, 38000 Grenoble, France
* Institute of Engineering Univ. Grenoble Alpes
E-mail: Jean-Pierre.Lai@univ-grenoble-alpes.fr; giovanni.depau@univ-grenoble-alpes.fr; elisabetta.carpitelli@univ-grenoble-alpes.fr
*Corresponding author
Abstract. The GIPSA-lab hosts an extensive archive of sound recordings documenting the Franco-Provençal and Sardinian linguistic regions. The first collection, consisting of approximately 450 tapes, was recorded by Gaston Tuaillon between 1955 and 1982. The second collection includes around 250 tapes from surveys conducted by Michel Contini in 214 Sardinian villages between 1964 and 1980. Both collections have been fully digitized. This paper details the origins, scope, and cultural significance of these invaluable archives, and addresses current efforts and challenges in increasing public access and awareness of these linguistic resources.
Keywords: oral data production, dialectology, tapes, digitization, oral heritage.
Index
1. Le contexte institutionnel et historique
4. Sauvegarde et conservation du patrimoine sonore
5. Utilisation et réutilisation des données inventoriées
6. Quelques remarques conclusives
1. Le contexte institutionnel et historique
L’ancien Centre de Dialectologie de Grenoble, créé il y a plus de quarante ans, a été depuis sa création un lieu d’accueil pour les chercheurs du monde entier, y compris les plus jeunes, intéressés par la réalisation de travaux sur le francoprovençal.
Il était au départ celle que dans l’organisation académique française est appelée une Équipe d’Accueil, c’est-à-dire une unité de recherche universitaire indépendante au sein de la structure UFR (Unité de Formation et de Recherche) de Sciences du Langage (actuellement devenue Département). En 2008, pour des raisons liées au réaménagement des centres de recherche, le personnel du Centre de Dialectologie de Grenoble a intégré le laboratoire GIPSA-lab, une unité dont les tutelles sont l’Université Grenoble Alpes, l’Institut national polytechnique de Grenoble et le CNRS, focalisée sur plusieurs domaines d’étude : l’automatique, les signaux cérébraux, le traitement des images, l’étude de la parole et des systèmes linguistiques (dont, bien évidemment, les systèmes dialectaux), la cognition, la robotique et l’apprentissage. Cette réunification de dialectologues et phonéticiens du site est, d’une certaine façon, l’aboutissement d’un parcours qui avait commencé au début du XXe siècle, lorsque les recherches dans les deux secteurs étaient fortement corrélées. Ensuite une séparation institutionnelle avait été connue à partir des années 1970, mais la situation est revenue, à l’aube du XXIe siècle, à celle de départ.
En réalité, l’importance attribuée aux recherches de dialectologie à Grenoble se situe à une époque qui précède de plusieurs décennies la création du Centre : cette dernière remonte aux années 1970, à l’initiative de Gaston Tuaillon, personnalité dont nous préciserons plus tard le rôle incontournable.
La dialectologie s’installe dans l’Université grenobloise juste après la création dans la ville alpine de l’Institut de Phonétique en 19041 par initiative de Théodore Rosset, phonéticien, grâce à qui la méthode expérimentale dans ce secteur disciplinaire, ainsi que dans le cadre de la phonétique appliquée à la didactique des langues, deviendra le trait distinctif des travaux notamment sur le français, mais plus tard dans beaucoup de langues européennes et non européennes, dans cette université (Abry, Boë, et Rakotofiringa 1997 ; Boë et Bonnot 2010). Comme nous le verrons, l’histoire de la dialectologie et donc de la tradition des enregistrements de terrains à Grenoble se lie étroitement à la trajectoire initiée exactement par Rosset (Contini 2010).
Toutefois, la figure qui a contribué à faire converger l’approche dialectologique et la tradition des études en phonétique à Grenoble a été son successeur, le spécialiste des dialectes francoprovençaux Antonin Duraffour, qui dirigera pendant plus de vingt ans l’Institut de Phonétique, sans être lui-même phonéticien et en considérant la phonétique comme une introduction à la dialectologie. La date exacte de la prise en charge de cette responsabilité n’est pas attestée, mais il est notoire qu’en 1922 le dialectologue utilisait déjà sa signature sur le papier en tête de l’Institut (Contini 2010, 150).
D’après les inventaires inédits de l’Université de Grenoble2, dans un registre consacré au mobilier et à la bibliothèque, à la p. 11 d’une liste de livres et brochures, il est noté l’achat en 1924 de la part de Duraffour de l’Atlas Linguistique de la France de Jules Gilliéron et Edmond Edmont qui porte encore aujourd’hui, par ailleurs, le tampon de l’ancien Institut de Phonétique. C’est le début de la collection atlantographique qui est aujourd’hui l’un des patrimoines de la bibliothèque de dialectologie de GIPSA-lab. Le spécialiste de francoprovençal consacrera par la suite beaucoup d’études aux dialectes gallo-romans, voire aux variétés celtiques et au roumain3.
Les recherches de dialectologie à Grenoble mettent naturellement l’oralité au cœur du travail de l’équipe : il s’agit de travaux de terrain ainsi que de traitement des données des atlas linguistiques4.
Dans le temps, vu le rôle reconnu notamment dans la région Rhône-Alpes5 pour l’activité dans le cadre de la sauvegarde du patrimoine régional (Depau, Lai, et Chauvin-Payan 2022), les chercheur·e·s de l’équipe ont non seulement accumulé des enregistrements liés aux enquêtes réalisées suite à des projets personnels ou des projets collectifs, nationaux ou internationaux, auxquels les membres de l’équipe ont participé; d’autre fonds documentaires sonores et sur papier, rares et souvent très anciens, ont été transmis par des personnes (chercheur·e·s professionnel·le·s ou passionné·e·s) qui ont confié à l’équipe leurs recueils.
Le fonds grenoblois de dialectologie possède aujourd’hui la plus riche collection en France d’atlas linguistiques du monde roman (près de 500 volumes) et plusieurs bandes magnétiques et cassettes audio issues d’enquêtes de terrains. Le détail de la collection sera précisé dans les paragraphes qui suivent. À ce patrimoine, il faut rajouter quelques centaines de rouleaux de cires d’une époque comprise entre la fin du XIXe siècle et le début XXe, qu’il sera nécessaire de numériser afin de les sauvegarder. Naturellement, ces rouleaux de cire sont désormais très fragiles. Par ailleurs, chaque lecture engendre une perte de qualité sonore. Ainsi, afin de contourner le risque de les abîmer définitivement, notre équipe a envisagé l’attribution d’un programme de numérisation des rouleaux à des professionnels. Le coût très élevé de la numérisation (environ 100 € par cylindre, soit près de 10 000 € pour la totalité des cylindres à conserver), ainsi qu’un certain nombre de contraintes de sécurité relatives au déplacement de rouleaux ont, pour le moment, freiné la réalisation de ce projet de numérisation de grande importance aussi bien sur le plan symbolique que par rapport au contenu des enregistrements. Afin de ne pas abîmer ces rouleaux nous avons décidé de ne pas réaliser la numérisation nous-même car chaque lecture engendre une perte de qualité et l’idée de départ était de les confier à un professionnel mais notre laboratoire ne disposait pas à l’époque de la somme nécessaire. Nous espérons malgré tout pouvoir atteindre notre but.
Tous ces supports sonores doivent être conservés, préservés, valorisés et être mis à disposition de la communauté scientifique et du grand public, mais ces opérations comportent de nombreux questionnements, notamment juridiques, qui méritent une réflexion approfondie.
Le Centre de Dialectologie de Grenoble a été créé et dirigé par Gaston Tuaillon6 dans les années 1970 jusqu’en 1989, date à laquelle Michel Contini en a pris la succession. Tuaillon, spécialiste incontesté du francoprovençal, a mené des enquêtes sur toute la zone francoprovençale du territoire rhônalpin, ainsi que dans l’Ain et le Jura, avec une incursion en Italie dans le village de Giaglione, mais également quelques rares pénétrations en domaine occitan français, dans les villages de Venosc, Mens, La Grave entre autres. Ces enquêtes ont abouti à la publication avec Jean-Baptiste Martin de l’Atlas linguistique et ethnographique du Jura et des Alpes du Nord (ALJA), en 1971, date de parution du premier volume (le 3e et dernier volume n’est sorti qu’en 1982).
En 1983, les enquêtes enregistrées avaient été déposées auprès du Musée dauphinois de Grenoble qui à l’époque disposait d’un lieu de stockage et d’un personnel technique qui aurait pu à ce moment-là numériser ce fonds. Cependant cela n’a pu se faire et, par la suite, faute de temps à réserver à ces témoignages et ayant perdu son personnel technique, le musée ne pouvait plus accorder l’attention nécessaire à ces enregistrements. Ainsi, en 2015 les chercheur·e·s de l’équipe SYLDO ont pu récupérer l’ensemble de ces enquêtes, dans le cadre d’un accord plus large avec le Musée visant la création et la mise en valeur d’une collection d’instruments de l’ancien Institut de Phonétique (désormais conservés au sein du GIPSA-lab). L’équipe de dialectologie conserve actuellement près de 450 bandes magnétiques, comprenant celles récupérées au Musée (424). À ces bandes s’ajoutent des cassettes audio (22 versées par le Musée et une bonne centaine déjà en notre possession). Assez récemment, en outre, notre équipe a pu bénéficier d’un don de 9 bandes héritées d’une ancienne étudiante de Tuaillon, Hélène Franconie, qui nous ont été léguées. Cette ingénieure d’études du CNRS, décédée en août 2017, a réalisé plusieurs enquêtes de terrain entre 1977 et 1979 dans trois localités de la région Rhône-Alpes : Meylan, dans l’agglomération grenobloise, où elle a été accompagnée de Gaston Tuaillon qui d’ailleurs avait jugé cette variété dialectale comme étant représentative du dialecte de Grenoble ; Engins, dans le massif du Vercors dans le département de l’Isère, et Landry, dans la vallée de la Tarentaise en Savoie. Un carnet d’enquête accompagne ces enregistrements et contient des récits de vie en français ainsi que quelques transcriptions phonétiques.
Toutes les bandes restituées par le Musée ont été consignées par le documentaliste de cet organisme dans un catalogue papier qui les accompagnait. Dans ce dernier, pour chaque fiche, est indiqué le nom de la localité où l’enquête était menée : par exemple, « Patois d’Eydoche (2) », où, entre parenthèses, le personnel du musée a indiqué le nombre de bobines contenant l’enregistrement de l’enquête en question, puis il a précisé le nom du locuteur·trice ou des locuteurs·trices, l’identité de l’enquêteur ainsi que la vitesse de la bande en cm/s et sa durée. Dans certains cas est mentionné le numéro de tours sur UHER 5000, c’est-à-dire la position exacte du démarrage d’un thème. Figurent également le code du dépôt du Centre de Dialectologie (ex. code CD=B 17), l’année de l’enregistrement et pour finir les thèmes contenus dans la bande. Ces derniers sont récurrents : il s’agit bien souvent de fêtes locales, religieuses, de coutumes, des animaux de la ferme, de la moisson, des métiers. Est également signalé le type de langue utilisée par le locuteur (patois – terme employé tel quel sur les bandes – ou français). Enfin un numéro d’inventaire (du type SON 99.37) parachève la fiche.
Il se trouve que beaucoup d’enquêtes sont en partie ou même entièrement en français, ce qui tente à prouver, si cela était encore nécessaire, que déjà à cette époque, la pratique du francoprovençal subissait un déclin. Gaston Tuaillon a réalisé ses enquêtes tout seul, utilisant uniquement le français comme langue véhiculaire, ou avec des étudiant·e·s formé·e·s auprès du Centre de Dialectologie de Grenoble. La plupart du temps, des questionnaires ad hoc ont été utilisés, ce qui donne une homogénéité à l’ensemble des données recueillies. En outre, Tuaillon a très souvent utilisé le questionnaire mis au point pour la création de l’ALJA, en collaboration avec Jean-Baptiste Martin, pour des localités qui ne figurent pas dans l’atlas en question. Cela présente deux opportunités importantes sur le plan méthodologique et scientifique : d’une part, la possibilité de comparer directement avec la source les données transcrites sur l’ALJA et éventuellement vérifier la présence d’informations non rapportées sur l’atlas pour ces mêmes points d’enquête ; d’autre part, la possibilité de comparer les données cartographiées dans l’ALJA avec les corpus enregistrés mais non cartographiés, relatifs à des terrains d’enquête qui n’ont pas fait l’objet de publication dans cet atlas régional.
En outre, les enregistrements contiennent aussi des ethnotextes7 – parfois très longs – pour chaque point d’enquête, qui eux n’ont jamais fait l’objet de publications. En inventoriant l’ensemble des bandes, nous nous sommes vite rendu compte que certaines localités possédaient un grand nombre d’heures d’enquêtes. Ce cas est celui d’Allevard, dans le département de l’Isère, localité pour laquelle on ne dénombre pas moins de 35 fichiers (nous avons choisi de comptabiliser un fichier pour chaque côté de bande, car il est fréquent de trouver une enquête par côté mais surtout il correspond à un temps exact de numérisation).
Nous avons établi un autre tableau reprenant ces données de manière plus synthétique comme nous le présentons ci-dessous (Tableau 1).
| Localités | Thèmes (synthèse de différentes bandes du même village) | Nombre de fichiers |
|---|---|---|
| Allevard SON99.67 | Le soleil, la lune, les poules, les chats, les brebis, animaux de la ferme, le chien, le patois, la chasse, la montagne, le potager, les légumes, les fruits, les fleurs, le bois, les parties du corps, les dépendances de la ferme, le linge et la lessive, les sentiments et les pronoms, verbes et conjugaisons. | 35 fichiers |
| Chavannes SON76.30 | Cochon, poules, canards, pigeon, lapin, parenté, animaux sauvages, grands oiseaux, couleuvre, lézard, crapaud, fourmi, escargot, coccinelle, corps humain. | 4 fichiers |
| Chavornay SON76.29 | Parenté, cochon, poules, canards, canes, pigeons, lapins, abeilles, bourdons, essaim, chats, moutons, souris, légumes, fruits, jardinage, céréales, pain. | 5 fichiers |
| Cheylard SON76.26 | Une vache, tout l’univers de la vache, le lait, le soleil, la pluie, la lune, la veillée, la grillée des châtaignes, histoires de revenants, sorcellerie, anciennes croyances, rapports entre catholiques et protestants à Lamastre, souvenirs du maquis, dépeuplement des campagnes, rapports entre villages voisins. | 8 fichiers |
| Essertines-en-Châtelneuf SON77.50 | Coutumes de mariage en Forez, lieux de rencontre des jeunes, âge du mariage, les fréquentations, choix du partenaire, mariages arrangés, demande en mariage, accordailles, fiançailles, cérémonie, tournée des bistrots, le repas, les barrages, la « chandelle », la soupe de la mariée, la jarretière, le menu, le charivari, le saut du balai, la façon de découper le pain, le valet de ferme, voyage de noce, rapprochements avec d’autres patois, le patois avec les animaux. | 12 fichiers |
| Eydoche SON72.12 | Fabrication d’un fagot, différents arbres, la fauche, la faux, la fourche, les bœufs, le joug, la vache, le beurre, la chèvre, le fromage, la truie, on tue le cochon, le saloir, les céréales, les semailles, la moisson à la faucille, le gerbier, les mesures, moudre, les parties du moulin, le tamis, le crible, le four. | 6 fichiers |
| Les Contamines SON78.65 | En voiture, le cardigan, mon village et mes amours, nostalgie, retour à la terre, histoires du village, la fabrication du beurre, les maladies des vaches en alpage, les fêtes de l’année (Noël, Pâques, Chandeleur, l’Ascension, Fête-Dieu), la mort, l’enterrement, le cortège de mariage, la lessive à la cendre, le chanvre, le rouet, les moissons, le grenier le jardin, les orages, les avalanches, les neiges précoces, la vie quotidienne, les labours, le battage, le moulin, le paiement en farine, la moisson, les chaumes, la charrue et l’attelage, le purin, le transport du fumier, le vêlage, les soins après vêlage, la stérilité, l’avortement, la fabrication du beurre, la confection de la « crache », la fabrication du sérac, la tomme, les fromages de chèvre, leurs maladies, le « Servan » est un esprit malin, la tuée du cochon avant la Noël, les saucisses, la conservation de la viande. |
22 fichiers |
Nous pouvons également ajouter à ce fonds l’ALMURA8, atlas parlant créé par Jeanine Élisa Médélice en 2015, elle-même ancienne membre et directrice du Centre de Dialectologie de Grenoble, dans l’aire provençale et francoprovençale de l’espace rhônalpin. Un atlas linguistique de ce type donne la possibilité d’interroger de façon instantanée une base sonore et d’entendre prononcer un mot choisi pour chacun des points d’enquête. Cet atlas ne constitue pas une complète nouveauté, mais fait suite à un précédent atlas sonore réalisé en 1995, le tout premier ouvrage de ce genre en France, dans le cadre d’une thèse dirigée par Michel Contini9 : le domaine d’enquête de ces deux atlas multimédiaux s’étend de l’ancienne région Rhône-Alpes (devenue récemment Auvergne-Rhône-Alpes) aux régions limitrophes, soit huit départements, du domaine francoprovençal (comprenant la Suisse Romande et le Val d’Aoste) à l’occitan avec un point unique dans le domaine d’oïl. Le questionnaire se compose de 850 mots voire des petites phrases, employées dans la vie quotidienne.
Le second domaine linguistique couvert par une collection d’enregistrements est la Sardaigne. Les enquêtes ont été réalisées par Michel Contini dans l’île de 1964 jusqu’au début des années 1980. Elles ont étés réalisées dans toute la moitié nord de l’île, soit 214 villages, à l’exception de trois localités de l’aire méridionale : Quartu Sant’Elena, San Vito et Sanluri10. Le nombre de locuteurs étant variable pour chaque point d’enquête, l’ensemble du fonds sarde représente finalement 250 bandes magnétiques. Toutes ces enquêtes sont à la base du doctorat d’État de Michel Contini de 1987 qui portait sur la phonétique de la langue sarde. Pour réaliser cette étude, l’auteur a utilisé un corpus très orienté, ad hoc, et spécifique afin de pouvoir recueillir l’ensemble des consonnes attestées dans les systèmes phonologiques de la zone enquêtée ainsi que leurs variantes présentes dans tous les parlers étudiés dans le but de créer un atlas phonétique des variétés dialectales sardes. Dans un second temps, profitant de la confiance instaurée entre l’enquêteur et les locuteurs·trices, et dans l’optique de futures études, lors de chaque enquête, Contini a demandé des témoignages de vie et donc des ethnotextes relatant la vie quotidienne, les cérémonies, les fêtes religieuses, le travail aux champs etc.
Depuis longtemps, de nombreux travaux sur la langue sarde mettent en évidence la transcription de textes en dialecte, sous la forme par exemple de proverbes, de contes et légendes, de chansons. Ainsi nous pouvons évoquer les études pionnières de deux grands experts des variétés sardes: Max Leopold Wagner (1914) et Gino Bottiglioni (1922) et plus récemment nous mentionnerons celle de Eduardo Blasco Ferrer (1988) sur l’Ogliastra (sous-région de la Sardaigne orientale) et celle de Maria Giuseppa Cossu (2013) dont la thèse doctorale a permis de compléter la description phonétique des parlers sardes entamée par Contini (1987) en prenant en compte la partie centre-méridionale de la Sardaigne (soit 132 villages).
Sur le plan purement linguistique, nous nous sommes également rendus compte que les locuteurs pouvaient alterner de code durant leur production, passant du sarde à l’italien – et vice-versa – ou quelquefois mélangeant quelques mots italiens dans la conversation. Autre fait remarquable, lorsqu’il connaît la variété locale de sarde l’enquêteur lui-même choisit d’utiliser celle-ci avec la volonté de ne pas influencer le locuteur ou de converger vers son parler, quitte à se faire reprendre par ce dernier11. L’objectif pour cet enquêteur est de considérer une seule et unique réalité, celle de la langue sarde, qui se manifeste à travers les multiples variétés dialectales, plus ou moins différenciées les unes des autres et surtout moyen de communication de la plupart des habitants de l’île.
Voici, ci-dessous, une partie du questionnaire de base utilisé pour les enquêtes phonétiques. Les mots utilisés font partie de la variété de Nuoro12 (Tableau 2).
| imˈbiliku | Nombril |
| iɕˈkurtu | Déchaussé |
| iɕˈkɔla | École |
| iɕˈkala | Échelle |
| izɛrˈβarɛ | Désherber |
| iɕˈkra | Terrain humide |
| iˈferru | Enfer |
| iɕˈparɣɛrɛ | Éparpiller |
| iɕˈpriku | Miroir |
| ifuˈrrarɛ | Mettre au four |
| iˈβerru | Hiver |
| iɕkarju | Gosier de la poule |
| iɕˈkirɛ | Savoir |
| ˈdɛɔ (ˈdɛɣɔ) | Je |
| ˈɛɕpɛ | Guêpe |
| ˈɛrβa | Herbe |
| aˈnnikru | Animal d’un an |
| anˈdʑɔnɛ | Agneau |
| ˈarɣa | Ordures |
| ˈartu | Haut |
| arˈβɛɕkɛrɛ | Lever du jour |
| ˈarula | Enclos du cochon |
| amˈbiɖɖa | Anguille |
| aˈrjɔla | Aire (de la ferme) |
| aˈprilɛ | Avril |
| ˈapɛ | Abeille |
| ˈarβu | Blanc d’œuf |
| ˈabba | Eau |
| ˈata | Fil (d’une lame) |
| aˈɣuɕtu | Août |
| ˈoβu | Œuf |
| oˈrikra | Oreille |
| ˈorju | Orge |
| ˈodʑu | Huile |
Malheureusement, nous nous sommes vite aperçus que sur les 214 localités, seules 150 enquêtes sont potentiellement audibles alors que d’autres ne sont pas en notre possession (elles seraient sans doute perdues d’après Contini). Dans le cadre des enquêtes disponibles, la dimension discursive et ethnographique émerge de manière évidente en complément de la dimension phonétique, centrale dans l’étude de Contini sur les variétés du sarde. En particulier, de nombreux ethnotextes ont été repérés et extraits de ces enregistrements par la numérisation des enquêtes menée au sein de l’équipe SYLDO du GIPSA-lab. De façon assez prévisible, sur les 150 villages pour lesquels nous avons pu récupérer des bandes sonores au moins partiellement en bon état, tous n’ont pas fourni un ethnotexte et d’autres sont complètement inaudibles : on peut estimer que seuls 120 points d’enquêtes sont exploitables dans cette perspective
Contrairement aux enquête de Gaston Tuaillon qui ont, en partie, servi à la création de l’ALJA, et ont été bien exploitées, un grand nombre de données des enquêtes menées par Contini sont restées indisponibles auprès de la communauté scientifique et du grand public et méritéraient d’être largement diffusées. Il est indéniable que ces données recouvrent un aspect de documentation de la langue sarde, non seulement d’un point de vue aréale et linguistique, mais aussi historique avec une photo instantanée de toutes ces variétés encore parfaitement parlées il y a plus d’un demi-siècle dans une société sarde à forte dominance agropastorale (à ce propos, cf. Foata 2015 concernant le domaine corse). On pourrait d’ailleurs se demander si aujourd’hui des mots et/ou des expressions (et surement aussi des lieux d’articulation) ont depuis disparus dans le répertoire de certains parlers.
Dans le cas précis des enquêtes sardes, nous avons été confrontés lors de la numérisation des bobines magnétiques à un problème récurrent de vitesse d’enregistrement. C’est-à-dire que bien souvent, l’enquêteur, pour économiser de la bande, très chère à l’époque et complètement inexistante dans les villages reculés de Sardaigne, a ralenti la vitesse d’enregistrement. Nous avons donc trouvé jusqu’à trois vitesses différentes voire une quatrième dans de rares cas (2,4 ; 4,75 ; 9,5 ; 19 cm/s). Le matériel d’enregistrement utilisé par Contini pour ses enquêtes de terrain était, notamment, un enregistreur UHER 4000 Report-L, appareil allemand de grande renommée. La difficulté majeure qui a dû être surmontée lors de la phase de numérisation a été, pour l’ensemble de la collection sonore, de trouver un appareil de lecture de bandes, forcément ancien, qui puisse lire ces dernières et doté d’au moins trois vitesses de lecture. La bande analogique n’est numérisée qu’une fois quitte à le faire à une vitesse inadéquate et retrouver celle réelle par la suite afin de ne pas manipuler trop souvent la bande.
Pour les deux fonds confondus, toutes les enquêtes réalisées n’ont malheureusement pas la même qualité d’enregistrement. Certaines sont plus pénibles à écouter à cause des parasites sonores, des bruits ambiants ou de l’éloignement du microphone par rapport aux locuteurs ou bien encore par la présence et l’intervention simultanée de plusieurs personnes participant à l’enquête. Au sujet du sarde par exemple, certaines enquêtes se sont déroulées en pleine nature avec des bergers : difficile dans ce cas de conserver le protocole assurant un maximum de confort acoustique. Enfin et surtout, la conservation du matériel sonore n’a pas été optimale. À ce propos nous avons noté que certaines bandes, sous l’effet de la chaleur ou de l’humidité étaient en partie collées. Il a donc fallu, dans un premier temps, les décoller à la main avant de pouvoir les écouter et les numériser. Certaines sont, malheureusement, définitivement perdues.
Il a été quelquefois nécessaire de recourir à un logiciel de traitement du son (Audacity) lorsque les parasites empêchaient la bonne compréhension de la langue, afin d’atténuer ces bruits. Bien entendu la numérisation originale est conservée, et le son pourrait être amélioré avec un traitement ultérieur. Il est évident que si l’objectif n’était pas de réaliser une étude phonétique approfondie à partir de ces enregistrements, il aurait été possible d’intervenir même lourdement sur les parties les plus difficilement audibles ; mais cela aurait eu de sérieux effets sur les paramètres physiques des sons enregistrés et aurait rendu nulle toute étude phonétique poussée.
4. Sauvegarde et conservation du patrimoine sonore
À présent l’ensemble de la collection sonore fait partie d’une plateforme ou plateau intitulé Géolinguistique et Ethnolinguistique, structure établie au sein du laboratoire GIPSA-lab, qui accueille surtout tous les atlas papier en notre disposition : d’Europe, d’Amérique Latine mais aussi, par exemple, d’autres atlas portant sur des domaines géographiques et linguistique très diversifiés, tel que l’ANAE pour l’Amérique du Nord, l’atlas des variétés berbères du Rif, du basque, de la Crète, du Cameroun.
Dans l’optique de sauvegarder ce matériel historique et rare nous avons décidé de numériser l’ensemble des bandes magnétiques13 (les cassettes audios seront traitées plus tard) conservées actuellement auprès de notre laboratoire, soit près de 700 bandes. Pour ce qui concerne le francoprovençal, l’ensemble du matériel sonore nous a été confié, comme nous l’avons déjà évoqué, par le Musée dauphinois et cela avec l’approbation de l’épouse de Gaston Tuaillon, Gunhild Hoyer-Tuaillon. Pour le sarde, Michel Contini a gentiment accepté de nous léguer tout le matériel d’enquête en sa possession. La numérisation de ces fonds, un travail réalisé par Jean-Pierre Lai, a débuté en 2010 pour le sarde et en 2015 pour le francoprovençal à l’aide d’appareils de type Tandberg Series 15 et Revox B77 Stereo Tape Recorder, matériels récupérés du rebut car trop anciens et non appropriés aux ordinateurs modernes. Il a donc fallu inventer un système de connectiques pour faire le lien entre analogique et numérique, ce qui existe dans les phonothèques mais que nous n’avions pas. Finalement, un logiciel comme Audacity a permis de numériser toutes ces données (au format Waveform Audio File – WAVE).
La visée de cette démarche est de perpétuer et de transmettre aux futures générations des langues, comme dans le cas du francoprovençal, qui est quasiment éteint sur le territoire français mais toujours vivace en Italie, notamment au Val d’Aoste. De plus ce matériel encore inédit pour la plupart pourra servir d’appui à des recherches qui complèteront les différents atlas déjà existants comme l’ALF, l’ALJA pour les atlas régionaux français, ou bien l’atlas linguistique du Valais romand et l’atlas valdôtain (ALAVAL, APV) ainsi que celui du Piémont occidental (ALEPO).
Évidemment, toutes ces bandes magnétiques représentent un témoignage de l’état de la langue à un moment donné et les enquêtes de terrain plus récentes permettent de constater et d’analyser l’évolution du dialecte, si certains mots sont oubliés et remplacés par ceux d’un village voisin dont le parler est considéré plus prestigieux ou, plus probablement, par la langue nationale et officielle du territoire concerné (l’italien, langue nationale et désormais seule langue commune à tous les habitants de Sardaigne ; le français et l’italien pour le francoprovençal en France, Italie et Suisse). Toutefois, dans le cas des enregistrements des enquêtes sur le francoprovençal, il ne faudrait pas négliger l’aspect ethnographique de ces témoignages oraux, rares car datés dans le temps, qui sont au cœur de pratiques culturelles et sociales voire économiques du territoire alpin.
Au-delà du premier but qui nous anime à travers la sauvegarde de ces fonds sonores précieux, avec l’objectif dans un premier temps d’extraire des données et de les analyser, nous sommes entrés au fur et à mesure dans une optique de vulgarisation et de valorisation de ce corpus.
C’est ainsi que nous espérons, dans un futur proche, pouvoir offrir la consultation de ces données à la communauté scientifique mais aussi à un plus large public pas forcément de spécialistes, resté attaché à ses racines ou simplement à des univers linguistiques qu’il ne connait pas bien qu’il en ressente l’importance.
La question cruciale qui se pose à tous les détenteurs d’une telle richesse patrimoniale orale, est celle de la conservation de toutes ces données linguistique et ethnographique. Comment conserver ce matériel sonore dans de bonnes conditions et le mettre ensuite à disposition de la communauté scientifique et du grand public ?
Pour l’instant nous envisageons de stocker les données sonores numérisées auprès de la Très Grande Infrastructure de Recherche (TGIR) Huma-Num, qui est un organisme public de France14 ; de ce fait aucune contribution n’est demandée pour le dépôt et aucun frais annuel. Toutefois, un inconvénient existe dans la mesure où les données déposées ne sont pas mises à jour par rapport à un éventuel changement de logiciel et si un jour elles devenaient illisibles par les outils dont nous disposons, aucun service d’intervention technique étant prévu, les données seraient perdues. D’autres sites, cette fois payants existent, mais avec un service de mise à jour technique. Les laboratoires préfèrent souvent la première solution. Par ailleurs, la question juridique15 reste un autre point difficile encore de nos jours : a-t-on toutes les autorisations pour exploiter et diffuser du matériel enregistré par une personne il y a un demi-siècle, sans les autorisations signées par les locuteurs pour prêter leur voix car à l’époque cela n’était pas d’actualité ?
Pour l’instant, nous ne mettons pas à disposition complète nos archives sonores : nous préférons que les chercheurs nous contactent et après discussions de leurs projets, nous nous accordons pour leur faire disposer du matériel ciblé selon l’intérêt de leurs projets.
5. Utilisation et réutilisation des données inventoriées
Une première récupération de données oubliées, pour ce qui concerne le sarde, a fait l’objet, tout récemment d’une publication (Depau et Lai 2023), dans le but de faire connaitre à un public plus large les enquêtes de Michel Contini qui n’avaient pas encore été diffusées. Les données exploitées ont notamment concerné les ethnotextes, plus abordables et intéressants pour un public de non spécialistes de ce domaine. Parmi toutes les enquêtes sardes, des récits de vie non encore publiés ont été récupérés et retranscrits en API – Alphabet Phonétique International –, en orthographe sarde puis traduits en italien et en français. En plus de la quarantaine de récits récupérés issus de 214 villages de Sardaigne enquêtés par Michel Contini, des enquêtes personnelles menées par les deux auteurs ont été ajoutées afin de compléter le réseau de points (Bonorva, Dorgali et Nuoro).
Il reste beaucoup de matériel sonore à exploiter aussi bien en poursuivant l’exploitation des ethnotextes encore inédits que en travaillant sur des thèmes récurrents dans les questionnaires utilisés par Contini. Il est évident qu’avec des fonds sonores élaborés sur plusieurs années et dépassant le demi-siècle, des recherches de type sociolinguistique pourraient être menées, dans la mesure où l’âge des locuteurs s’échelonne entre 13 et 90 ans.
Pour ce qui concerne le « fonds Tuaillon », nombreuses sont les données qui n’ont toujours pas été exploitées et attendent d’être publiées.
6. Quelques remarques conclusives
L’objectif de notre contribution était de présenter, de manière certes non exhaustive, une action de valorisation de la recherche menée au sein de l’ancien Centre de Dialectologie de Grenoble désormais intégré au laboratoire GIPSA-lab. Cette valorisation se matérialise principalement dans la sauvegarde, l’archivage et le traitement numérique des données sonores issues des enquêtes de terrain menées dans le passé par les membres du Centre. Notre contribution visait notamment à décrire et mettre en évidence les caractéristiques principales des matériaux sonores faisant l’objet central de cette action. Ce projet de longue haleine nous semble convoquer des intérêts scientifiques et des compétences de natures variées, sur le plan des domaines linguistiques, des niveaux de production concernés, mais aussi de nature technique liée à la nécessité de conserver et valoriser ces données à l’aide des nouvelles technologies en évolution constante, ainsi que des compétences de nature juridique incontournables dans le traitement de données représentatives de la parole humaine.
Nous sommes donc persuadés de disposer d’un trésor, composé de voix humaines et de récits de vie de femmes et d’hommes qui ne sont plus parmi nous, que nous avons le devoir de préserver mais aussi de faire connaitre au plus vite, dans les meilleures conditions possibles.
ALAVAL = Kristol, Andres et Federica Diémoz. 1994-2019. Atlas linguistique audiovisuel des dialectes francoprovençaux du Valais romand, <https://alaval.unine.ch>.
ALEPO = Canobbio, Sabina et Tullio Telmon, dir. 2003-. Atlante linguistico e etnografico del Piemonte orientale. Ivrea (Turin) : Priuli & Verlucca. <https://www.alepo.unito.it/>.
ALF = Gilliéron, Jules et Edmond Edmont. 1902-1910. Atlas linguistique de la France. Paris : Honoré Champion.
ALJA = Martin, Jean-Baptiste et Gaston Tuaillon. 1971-1981. Atlas linguistique et ethnographique du Jura et des Alpes du Nord. Paris : CNRS.
ALMuRA = Médélice, Jeanine. 2015. Atlas linguistique Multimédia de la Région Rhône-Alpes. <https://www.atlas-almura.net>.
ANAE = Labov, William, Beth Sharon Ash, et Charles Boberg. 2006. The atlas of North American English: phonetics, phonology and sound change: a multimedia reference tool. Berlin, New York : Mouton de Gruyter.
APV = Favre, Saverio et Gianmario Raimondi. 2020. Atlas des Patois valdôtains, vol. 1, Arvier (Vallée d’Aoste) : Le Château Edizioni.
Abry, Dominique, Louis-Jean Boë, et Hippolyte Rakotofiringa. 1997. « Théodore Rosset et l’établissement de la phonétique expérimentale à Grenoble. Une consonance entre une nouvelle discipline et le dynamisme d’un Comité de patronage ». Documents pour l’Histoire du Français Langue Etrangère ou Seconde, 20: 54-72.
Blasco Ferrer, Edoardo. 1988. Le parlate dell’Alta Ogliastra. Cagliari : Edizioni della Torre.
Boë, Louis-Jean et Jean-François Bonnot. 2010. « Création et émergence de la phonétique expérimentale en France : de l’abbé Rousselot à Théodore Rosset ». Dans Un siècle de phonétique expérimentale, fondation et éléments de développements. Hommage à Théodore Rosset et John Ohala. Sous la direction de Louis-Jean Boë et Coriandre-Emmanuel Vilain, 103-24. Lyon : ENS Éditions.
Bottiglioni, Gino. 2003[1922]. Leggende e tradizioni di Sardegna, Nuoro : Ilisso.
Bouvier, Jean-Claude et Xavier Ravier. 1976. «Projet de recherche interdisciplinaire sur les ethnotextes du Sud de la France». Le Monde alpin et rhodanien, 4-1-2 : 207-12.
Brunetti, Dimitri et Enrico Demaria. 2021. « La digitalizzazione dei documenti sonori, il restauro e la conservazione del digitale ». Dans Documenti sonori voce, suono, musica in archivi e raccolte. Sous la direction de Diego Robotti et Elisa Salvalaggio, 245-63. Turin : Regione Piemonte, Centro Studi Piemontesi.
Canobbio, Sabina. 2001. « Le rapport entre Passé – Présent – Futur dans les ethnotextes de L’Atlas linguistique et ethnographique du Piémont occidental ». Le Monde alpin et rhodanien, 1-3 : 189-202.
Carpitelli, Elisabetta et Gabriele Iannàccaro. 1995. « Dall’impressione al metodo : per una ridefinizione del momento escussivo ». Dans Dialetti e lingue nazionali: Atti del XXVII Congresso della Società di Linguistica Italiana Lecce, 28-30 octobre 1993. Sous la direction de Maria Teresa Romanello et Immacolata Tempesta, 99-120. Rome : Bulzoni.
Contini, Michel. 1987. Études de géographie phonétique et de phonétique instrumentale du sarde, 2 vol. Alessandria : Edizioni dell’Orso.
Contini, Michel. 2010. « Antonin Duraffour : un phonéticien dialectologue ». Dans Un siècle de phonétique expérimentale, fondation et éléments de développements. Hommage à Théodore Rosset et John Ohala. Sous la direction de Louis-Jean Boë et Coriandre-Emmanuel Vilain, 147-61. Lyon : ENS Éditions.
Cossu, Maria Giuseppa. 2000. Unité et variabilité phonétique des parlers sardes méridionaux. Thèse de doctorat. Grenoble : Université Stendhal Grenoble 3.
Dalbera Stefanaggi, Marie-Josée. 1992. « L’oral et la recherche dialectologique ». Bulletin de l’AFAS, 28-29 : 27-35.
Depau, Giovanni et Jean-Pierre Lai. 2016. « Voyage en Sardaigne à travers les ethnotextes de Michel Contini ». Dans Estudos Geossociolinguísticos Brasileiros e Europeus: uma homenagem a Michel Contini. Sous la direction de V. de Andrade Aguilera et M. Pereira Barbosa Doiron. Londrina : Eduel, Edunioeste.
Depau, Giovanni, Jean-Pierre Lai et Carole Chauvin-Payan. 2022. « Valorisation du patrimoine (ethno)linguistique et de la recherche dialectale : numérisation et nouvelles perspectives de traitement de données dialectales dans l’arc alpin français ». Dans La Suisse romande et ses patois. Autour de la place et du devenir des langues francoprovençale et oïlique. Sous la direction de Dorothée Aquino-Weber et Maguelone Sauzet, 203-20. Neuchâtel : Alphil-Presses Universitaires Suisses.
Depau, Giovanni et Jean-Pierre Lai. 2023. Voix et culture de la Sardaigne : ethnographie d’une île / Voci e cultura della Sardegna: etnografia di un’isola. Alessandria : Dell’Orso.
Favier, René. 2017. Le roman de l’université. Grenoble 1339-2016. Grenoble : PUG et UGA Éditions.
Foata, Dominique. 2015. « Da l’etnutesti à a biugrafia linguaghjaghja: a Banca di Dati Linguistichi Corsi in lu filu di u Quadru Cumunu di Rifarenza per e Lingue ». Dans Paroddi varghji. Mélanges offerts à Marie-José Dalbera-Stefanaggi. Sous la direction de Stella Retali-Medori. Alessandria : Edizioni dell’Orso.
Ginouvès, Véronique et Véronique Traverso. 2022. « Le droit et l’éthique : qu’est-ce qui change dans les pratiques de terrain ? – Introduction ». Bulletin de l’AFAS, 48 : 8-24. https://doi.org/10.4000/afas.7470.
Marquet, Isabelle. 1995. Atlas linguistique parlant d’une région des Alpes occidentales : étude de la variabilité phonétique entre le Vercors et la frontière italienne. Thèse de doctorat : Université Stendhal Grenoble III (1970-2015) (1995GRE39051).
Pelen, Jean-Noël. 1992. « La recherche sur les ethnotextes : notes sur un cheminement », Iker 7, numéro spécial « Actes du Congrès International de Dialectologie » (Bilbao, 21-25 août 1991) : 709-26.
Robotti, Diego et Elisa Salvalaggio, dir. 2021. Documenti sonori voce, suono, musica in archivi e raccolte. Turin : Regione Piemonte, Centro Studi Piemontesi.
Robotti, Diego et Elisa Salvalaggio. 2021. « Conservare i suoni. I documenti sonori come patrimonio culturale ». Dans Documenti sonori voce, suono, musica in archivi e raccolte. Sous la direction de Diego Robotti et Elisa Salvalaggio. Turin : Regione Piemonte, Centro Studi Piemontesi.
Romano, Antonio, Matteo Rivoira, Federica Cugno, Giovanni Ronco, Valentina De Iacovo et Valentina Colonna. 2018. « Atlanti linguistici e archivi vocali di lingue locali e minoritarie in Italia ». Géolinguistique, 18. https://doi.org/10.4000/geolinguistique.290.
Wagner, Max Leopold. 1914. Südsardische Trutz- und Liebes-, Wiegen- und Kinderlieder, Halle a.S. : Neimeyer Verlag.
1 Cependant l’intitulé a été attribué en 1908 (Favier 2017, 103).
2 Nous remercions Coriandre Vilain, ingénieur de recherche au laboratoire GIPSA-lab, pour nous avoir transmis ces précieux documents.
3 Un projet de récupération des manuscrits et des annotations d’Antonin Duraffour est à l’étude actuellement au sein de notre laboratoire et à l’initiative de l’équipe SYLDO du GIPSA-lab à laquelle les dialectologues grenoblois sont rattachés, afin de valoriser ce patrimoine qui risque de disparaître.
4 Voir Dalbera Stefanaggi (1992).
5 Suite à la réforme des régions administratives menée par la République française en 2015, l’ancienne région Rhône-Alpes compose avec l’Auvergne la nouvelle région Auvergne-Rhône-Alpes. Dans notre texte nous utilisons « Rhône-Alpes » pour indiquer plus précisément la région qui historiquement a constitué le terrain d’études des chercheurs impliqués dans les activités de l’ancien Centre de dialectologie de Grenoble, dont nous rendons compte dans cette contribution.
6 Ce chercheur, né en 1923 à Fourneaux en Savoie, est décédé en 2011 à Grenoble.
7 L’ethnotexte occupe une place particulière dans la tradition de recherche en dialectologie depuis l’émergence de celle-ci comme discipline scientifique : « Les dialectologues ont éprouvés le besoin de compléter les atlas linguistiques actuels par des enquêtes au magnétophones sur les textes dialectaux oraux présentant le langage en situation » (Bouvier 1976, 208). On rappellera que la recherche sur les ethnotextes est née surtout d’une demande des dialectologues en interaction avec les historiens et les ethnologues (Pelen 1992, 724 ; Canobbio 2001). Dans cette perspective, « [p]ar ethnotexte il faut entendre avant tout des textes oraux, littéraires ou non, dialectaux ou français, ayant une valeur d’information ethnologique, historique, linguistique » (Bouvier et Ravier 1976, 207).
8 ALMURA (Atlas Linguistique Multimédia de la Région Rhône-Alpes) : https://www.atlas-almura.net.
9 Isabelle Marquet est l’auteure de cette thèse qui comporte un livrable, l’Atlas parlant de Alpes, encore consultable en se connectant au site http://www.centrededialectologie-grenoble.fr/atlas/couverture/index.html.
10 Voir Depau et Lai (2016) pour le lancement du projet de récupération des données sardes.
11 Voir à ce propos l’article de Carpitelli et Iannàccaro (1995) au sujet de la relation enquêteur / locuteur.
12 Dans le questionnaire de Contini, les entrées du tableau ci-dessous n’étaient pas en API – Alphabet Phonétique International – mais dans un alphabet phonétique ad hoc fondé sur les usages des romanistes de l’époque (voir Romano et al. 2018).
13 Brunetti et Demaria (2021, 245-63) à propos de la numérisation des documents sonores, de leur restauration et conservation.
14 <https://www.huma-num.fr/quest-ce-que-l-ir-huma-num/> : le site propose cette définition de la structure : « […] Elle met en œuvre une infrastructure numérique permettant aux communautés SHS de développer, de réaliser et de préserver sur le long terme les programmes de recherche – leurs données et outils – dans un contexte de science ouverte et de partage des données. »
15 Voir à ce propos Ginouvès et Traverso (2022).