Prénoms, régions et analyse en composantes principales (3ème partie)

Cet article commence ici et la deuxième partie se trouve là.

Résumé des épisodes précédents

L’objectif est de décrire et expliquer les différences géographiques en matière d’utilisation des prénoms. Pour cela nous utilisons une analyse en composantes principales. La première composante capture 25% des différences entre départements : nous avons vu que cette composante capture en fait les différences entre les zones urbaines où les prénoms d’origine étrangère sont surreprésentés et les zones rurales où ce sont les prénoms traditionnels démodés qui sont surreprésentés.

La seconde composante capture 10% des différences entre départements et révèle une fracture entre la moitié nord-ouest de la France où l’on trouve de nombreux prénoms d’origine celte et la moitié sud-est où l’on rencontre plutôt des prénoms latins. Nous avons appelé ce phénomène l’effet Astérix !

Prénoms bourgeois et prénoms populaires

Nous nous attaquons maintenant à la troisième composante principale. Celle-ci ne capture que 5% des différences entre départements, mais elle révèle néanmoins des phénomènes intéressants.

Valeurs de la troisième composante. Les zones bleues correspondent à des valeurs positives et les zones roses à des valeurs négatives.

Voici la liste des 100 prénoms les plus corrélés avec la composante :

Ambroise, Laure-Anne, Mathurin, Constantin, Hermine, Ferdinand, Hector, Hortense, Melchior, Balthazar, Marie-Caroline, Baudouin, Jan, Octave, Rosalie, Ariel, Mahaut, Gaspard, Zachary, Marin, Barnabe, Lancelot, Theodore, Albane, Philomène, Alberic, Elvire, Toscane, Ourida, Robinson, Priscille, Tancrede, Sixtine, Carolina, Colombe, Domitille, Camel, Emile, Blanche, Eugene, Louis, Hippolyte, Anne, Yvonne, Ida, Brune, Malo, Malou, Jean-Eric, Aurèle, Guillemette, Prune, Achille, Lorette, Jean-Gabriel, Brieuc, Vadim, Julio, Penelope, Blaise, Isaure, Albert, Ethel, Javier, Ian, Pierre-Yves, Anatole, Leonore, Marie-Emmanuelle, Nicholas, Jean-Guillaume, Solal, Theophane, Milla, Ava, Gaële, Aristide, Oscar, Irène, Marie-Anne, Leon, Anne-France, Ulysse, Victoire, Gwenola, Servane, Sidonie, Come, Saadia, Alma, Leonard, Anne-Francoise, Anne-Gaelle, Augustin, Albertine, Gildas, Yaelle, Pierre-Olivier, Leopoldine, Yves-Marie

On y trouve essentiellement des prénoms rares :la plupart d’entre eux n’ont pas été utilisés plus de quelques centaines de fois en 60 ans. On y trouve pas mal de prénoms composés, mais surtout ce que l’on remarque c’est que ces prénoms dénotent un milieu aisé, plutôt bourgeois ou aristocrate. À l’opposé, si l’on regarde les 100 prénoms les plus négativement corrélés :

Émilie, Sebastien, Dylan, Coralie, Séverine, David, Damien, Celine, Melanie, Océane, Aurore, Fabien, Amandine, Jason, Christophe, Jeremy, Élodie, Aurélie, Jérome, Aurélien, Sandrine, Cyril, Angelique, Cédric, Kevin, Ludovic, Cindy, Jordan, Ophélie, Bryan, Théo, Romain, Jimmy, Cloé, Ludivine, Nadège, Florian, Brandon, Laetitia, Cassandra, Anaïs, Virginie, Melissa, Delphine, Alison, Jordy, Quentin, Benjamin, Jessy, Jennifer, Stéphanie, Teddy, Dimitri, Karine, Valentin, Stecy, Mélodie, Alicia, Laurine, Christelle, Kessy, Steffy, Matheo, Kelly, Christopher, Yohan, Jessica, Geoffrey, Tiffany, Kimberley, Enzo, Amélie, Dawson, Julien, Ingrid, Mylène, Lana, Lea, Curtis, Lenny, Stacy, Brenda, Sandy, Manon, Mégane, Sandra, Iness, Nathalie, Wesley, Vanessa, Alexis, Émeline, Joffrey, Johnny, Jonathan, Justine, Vivien, Adeline, Wendy, Tony, Melody

Il s’agit au contraire de prénoms de la classe populaire. On peut noter la forte représentation de prénoms américains, de prénoms à l’orthographe modifiée (Karine, Cloé, Mélody, Tiffany) et de quelques diminutifs (Theo, Teddy).

La composante capturerait donc des différences dans la composition sociale des départements : elle serait élevée dans les départements où les milieux aisés sont surreprésentés et serait au contraire négative dans les départements où la classe populaire est surreprésentée.

Pour tester cette hypothèse, j’ai récupéré les données du recensement 2006 disponibles sur le site de l’INSEE et j’ai calculé pour chaque département la proportion de la population que représente chaque catégorie socio-professionnelle (CSP). Enfin, j’ai réalisé une régression linéaire de la valeur de la composante sur la proportion des différentes CSP. Les résultats de la régression sont reproduits dans le tableau ci-dessous :

Estimation écart-type t pvalue
Constante 112.45 32.14 3.50 0.00
agriculteurs -77.71 130.03 -0.60 0.55
artisans -56.18 241.45 -0.23 0.82
cadres 202.00 76.39 2.64 0.01
intermédiaires -172.31 113.83 -1.51 0.13
employés -668.02 144.95 -4.61 0.00
ouvriers -101.13 77.43 -1.31 0.20
Régression de la composante principale sur la part de chaque CSP dans la population des départements.

Le R-deux de la régression est d’environ 50%, c’est-à-dire que les variables explicatives expliqueraient la moitié des variations observées de la composante. La régression semble donc de bonne qualité. On peut voir que la proportion de cadres dans un département a un impact positif et statistiquement significatif sur la composante tandis que la proportion d’employés a un impact significativement négatif. Cela confirmerait donc l’hypothèse que la composante capture les différences de structure sociale entre départements.

Au lieu d’utiliser les CSP, on pourrait adopter la même stratégie que celle utilisée dans cet article de Baptiste Coulmont et utiliser le niveau de diplôme. La régression est un peu moins robuste et l’on trouve que la proportion d’individus ayant un diplôme supérieur a un impact significativement positif sur la composante.

L’Odyssée versus Beverly Hills

Nous venons de voir que selon leur catégorie socio-professionnelle, les parents ne choisissent pas les mêmes prénoms. Mais essayons d’aller plus loin et posons-nous la question suivante : pourquoi des parents évoluant dans des milieux sociaux différents choisissent-ils des prénoms différents ?

Il est clair que le milieu social joue un rôle important dans la perception que l’on a d’un prénom : un prénom que l’on a entendu fréquemment autour de nous nous paraît familier et on lui associe souvent des images positives ou négatives. Par exemple, depuis que j’ai commencé ce petit travail sur les prénoms, plusieurs personnes m’ont dit quelque chose du genre “je déteste ce prénom ! Quand j’étais petit(e) je connaissais quelqu’un qui avait ce prénom et [il était méchant avec moi, idiot, moche, etc.]…” ! Au contraire, un prénom que l’on n’a quasiment jamais entendu nous semblera étrange, bizarre, voire incongru.

Les prénoms des deux listes ci-dessus sont trop rares pour qu’un tel effet soit à l’oeuvre. Néanmoins, beaucoup de ces prénoms sont très célèbres et on les a entendus plus d’une fois. Dans la première liste, on trouve plusieurs prénoms de personnages de l’Iliade et l’Odyssée (Achile, Ulysse, Pénélope), de la Bible (Melchior, Gaspard et Balthazar) et quelques autres personnages fictifs (Lancelot, Robinson) ou historiques (Aristide, Léopoldine, Anatole). Ce que l’on peut noter, c’est que ce sont surtout des prénoms rencontrés dans des livres.

Dans la seconde liste, on retrouve également des prénoms célèbres, mais que l’on entend plutôt à la télévision ou la radio : on y trouve notamment Johnny, Mylène ou Jordy. L’évolution de ces trois prénoms est assez impressionnante. Les Johnny étaient très rares jusqu’à ce que la carrière de Johnny Halliday débute.

Evolution du prénom Johnny. La courbe explose lorsque la carrière de Johnny Hallyday débute, en 1960.

Les Mylène étaient moins rares, mais on observe un boom au milieu des années 1980 lorsque Mylène se lance dans la chanson.

Evolution du prénom Mylène. Ce prénom était à la mode mais on observe un pic correspondant au début de la carrière de Mylène Farmer

Et que dire des Jordy ? Ce prénom inconnu en France a été très populaire en 1992, date de la sortie du tube “Dur dur d’être bébé”.

Evolution du prénom Jordy. Le pique de 1992 correspond à la sortie du tube "Dur dur d'être bébé".

Les nombreux prénoms américains sont sans doute sortis tout droit de séries américaines. Par exemple, Brandon et Dylan sont deux beaux gosses de “Beverly Hills”, série diffusée en France à partir de 1992. La même année le nombre de Brandon et Dylan explose !

Evolution du prénom Brandon. Le nombre de Dylan explose à partir de 1992, année de diffusion de la série BeverlyHills

Evolution du prénom Dylan. Lui aussi explose à partir de 1992, lorsque Beverly Hills est diffusée. On peut noter que Dylan a beaucoup plus de succès que Brandon !

Compte tenu de ces éléments, on peut soupçonner que les différences dans les choix de prénoms ne sont pas dues au milieu social en lui-même, mais plutôt aux pratiques culturelles des parents : quelqu’un dont les parents lisent beaucoup a plus de chances de s’appeler Ulysse ou Aristide alors que quelqu’un dont les parents regardent beaucoup la télévision a plus de chances de s’appeler Jordi ou Dylan.

Pour vérifier cette nouvelle hypothèse, j’utilise un autre fichier de l’INSEE sur les pratiques culturelles des Français. Malheureusement, ce fichier contient non pas des données départementales mais régionales. Au lieu d’avoir 95 observations, on n’en a plus que 22. Les résultats suivants sont donc à prendre avec précaution. J’ai choisi quatre variables qui me semblaient pertinentes : le nombre d’heures passées devant la télé, le nombre de livres lu, la proportion de ménage indiquant préférer regarder arte — chaine réputée intellectuelle — et la proportion de ceux qui préfèrent M6 — chaine connue pour ses variétés et ses nombreuses séries américaines.

Estimation Ecart-type t p-value
constante -33.27 39.61 -0.84 0.41
livre 1.65 3.02 0.55 0.59
tele 1.41 1.46 0.97 0.35
arte 164.21 101.67 1.62 0.12
m6 -52.03 34.12 -1.52 0.15
Résultat de la régression de la composante principale sur différentes variables relatives aux pratiques culturelles. On utilise les moindres carrés pondérés pour tenir compte des différences de taille des populations entre départements. Sans cette pondération, tous les coefficients sont systématiquement non significatifs. Si l’on supprime les variables « livre » et « télé », les coefficients des deux autres variables sont significatifs au seuil de 5%.

Seules les deux dernières variables semblent significatives. Ce ne seraient donc pas les activités culturelles elles-mêmes, mais les contenus culturels choisis qui influenceraient la perception et le choix des prénoms par les parents.

Prénoms, modes et milieux sociaux

Une croyance assez commune est que les milieux aisés font les modes et que les autres couches sociales suivent avec quelques années de retard. Ce phénomène serait également présent en matière de prénoms. Selon cet article, les cadres adopteraient de nouveaux prénoms et les milieux populaires auraient tendance à suivre avec un retard de cinq ans environ.

Cet effet existe sans doute, mais dans les données nous observons des modes qui touchent surtout les couches populaires et qui ne sont pas initiées par les milieux favorisés, mais par la radio et la télévision.

Néanmoins, la plupart des prénoms que l’on a identifiés comme “bourgeois” connaissent une importante croissance depuis quelques années.

Evolution du prénom Pénélope. La courbe semble croître exponentiellement. Assiste-t-on aux débuts d'une nouvelle mode ?

S’agirait-il des prochains prénoms à la mode ? Cela n’est pas impossible…

Remerciements

Je remercie Lydie, Anna et Florent pour leur aide, leurs conseils et leurs excellentes réflexions.

Cette entrée a été publiée dans Analyse. Vous pouvez la mettre en favoris avec ce permalien.

Laisser un commentaire

Votre adresse de messagerie ne sera pas publiée. Les champs obligatoires sont indiqués avec *

*

Vous pouvez utiliser ces balises et attributs HTML : <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>