Prénoms, régions et analyse en composante principale (2ème partie)

La première partie de cet article est disponible ici.

Résumé de l’épisode précédent

L’objectif est d’étudier les différences géographiques dans l’utilisation des prénoms. Pour ce faire, nous utilisons une analyse en composantes principales. Nous avons vu que la première composante capture 25% des différences observées entre départements. Cette composante semble en fait capturer les différences entre zones urbaines où l’on trouve beaucoup de personnes aux noms étrangers et zones rurales où l’on rencontre des personnes aux noms traditionnels mais démodés.

L’effet Astérix

Intéressons-nous maintenant à la seconde composante. Celle-ci capture 10% des différences entre départements, mais que capture-t-elle ? Si l’on représente graphiquement cette composante, on obtient la carte suivante :

Représentation graphique de la seconde composante principale. Les zones roses représentent les départements où la composante est positive et les les bleus ceux où elle est négative. On remarque immédiatement un clivage nord-ouest / sud-est.

Les zones roses représentent les départements dans lesquels la composante est positive et les zones bleues ceux où elle est négative. On remarque immédiatement que la carte est coupée en deux : quasiment tous les départements de la moitié nord-ouest sont roses tandis que ceux de la moitié sud-est sont bleus. En matière d’usage des prénoms, il existerait un clivage entre le nord-ouest et le sud-est.

Les 100 prénoms les plus corrélés avec cette composante sont les suivants :

Corentin, Tiphaine, Anne-Sophie, Eloise, Yohann, Clemence, Tanguy, Matheo, Armelle, Gwendoline, Adelaide, Nolan, Amelie, Steven, Elise, Flavie, Gwenaelle, Louanne, Orlane, Gwladys, Maryvonne, Alban, Adèle, Matthis, Valentin, Anaelle, Coraline, Emeline, Lolita, Lou-Anne, Mickael, Samuel, Agathe, Solenne, Solène, Héloise, Bénédicte, Anne-Claire, Johann, Nolann, Lou-Ann, Titouan, Anne-Charlotte, Louane, Noémie, Mélinda, Karl, Erwan, Morgan, Gaetan, Florentin, Teddy, Elouan, Ludivine, Ophelie, Alexane, Annabelle, Maxime, Anne-Laure, Enola, Justine, Maxence, Maelle, Hugues, Berenice, Marceau, Alan, Aymeric, Rodolphe, Bertrand, Louison, Louann, Pierrick, Romuald, Killian, Clotilde, Constance, Wilfried, Nolwenn, Leandre, Cassandre, Flavien, Typhaine, Noella, Pascaline, Kilian, Anne-Cecile, Donovan, Dimitri, Gwenael, Apolline, Jeannick, Janick, Francois-Xavier, Sullyvan, Jimmy, Melaine, Loanne, Bertille, Malo Antonin, Anne-Francoise, Yvonnick, Anatole, Maeliss, Nolwen, Baptiste, Tifenn

Une grande partie de ces prénoms est d’origine celte. Par exemple, pour le prénom Corentin, j’ai trouvé le commentaire suivant : “la popularité était telle en Armorique que Corentin, pour les Français, servait à désigner les Bretons avec condescendance : un domestique breton était un Corentin !”.

Regardons maintenant les 100 prénoms les plus négativement corrélés :

Robert, Simone, Georges, Serge, Michele, Christiane, Josiane, Marc, Christian, Pierre, Myriam, Andrée, Muriel, Eliane, Georgette, Jean-Marc, Danielle, Aimé, Marguerite, Raymond, Gisèle, Lucien, Maria, Suzanne, Henri, Josette, Rosette, Geneviève, Lucienne, Jeanine, Solange, Henriette, Jean-Louis, Bernard, Anne-Marie, Roland, André, Rose, Jean, Joelle, Renée, Fathia, Marie-Rose, Elisabeth, Sabine, René, Carmen, Roger, Marthe, Carine, Guy, Lionel, Mireille, Nouria, Laurent, Bernadette, Soumia, Zahia, Hassina, Marlene, Malek, Tahar, Mohand, Rachid, Fernand, Fadila, Fadela, Paulette, Zakia, Jeannette, Ikram, Gilbert, Max, Daniele, Raymonde, Hanan, Lisa, Arlette, Jacques, Pierrette, Lahcene, Faouzi, Nicole, Djilali, Mahmoud, Mourad, Souhila, Fethi, Sakina, Baya, Monique, Hayette, Saliha, Denise, Nabil, Yazid, Odette, Marie-Pierre, Houria, Eliette, Mohamed

Ce groupe est moins homogène que le précédent : on y trouve beaucoup de prénoms chrétiens (Marc, Pierre, Jean, etc.) et quelques prénoms d’origine arabe. Mais on peut surtout remarquer la présence de nombreux prénoms latins : Lucien, Rose, Carmen, Solenge, Sabine, Carine, Laurent…

Comment expliquer ce clivage nord-ouest/sud-ouest ? Ne serait-il pas le résultat de la résistance d’un village d’irréductibles gaulois à la colonisation romaine, telle que décrite dans une  célèbre bande dessinée ?

Mais d'où provient donc cette carte ?

Je ne suis pas compétent dans ce domaine, donc je vais éviter de répondre à cette question. L’idée que cette division existe depuis l’antiquité est amusante et séduisante, mais la vérité est sans doute moins simple que cela.

Le mystère des prénoms féminins du sud-est

On peut enfin noter un fait assez curieux : dans la liste des prénoms les plus négativement corrélés avec la deuxième composante principale, on trouve de nombreux prénoms masculins féminisés : Michèle, Christianne, Andrée, Georgette, Danielle, Lucienne, Renée, Pierrette, Raymonde, etc. D’où celà peut-il bien venir ? Si vous avez des idées pour expliquer cela, n’hésitez pas à laisser un commentaire.

A suivre

Dans la dernière partie de cet article, nous nous attaquerons à la troisième composante principale. Nous verrons que cette dernière est liée à des différences de composition sociale entre les départements.

Si la problématique de l’usage des prénoms vous intéresse, je vous conseille d’aller voir le blog de Baptiste Coulmont.

Cette entrée a été publiée dans Analyse. Vous pouvez la mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>