Mois : avril 2011

  • Prénoms, régions et analyse en composantes principales (3ème partie)

    Cet article commence ici et la deuxième partie se trouve là. Résumé des épisodes précédents L’objectif est de décrire et expliquer les différences géographiques en matière d’utilisation des prénoms. Pour cela nous utilisons une analyse en composantes principales. La première composante capture 25% des différences entre départements : nous avons vu que cette composante capture en fait les différences entre…

  • Prénoms, régions et analyse en composante principale (2ème partie)

    La première partie de cet article est disponible ici. Résumé de l’épisode précédent L’objectif est d’étudier les différences géographiques dans l’utilisation des prénoms. Pour ce faire, nous utilisons une analyse en composantes principales. Nous avons vu que la première composante capture 25% des différences observées entre départements. Cette composante semble en fait capturer les différences entre…

  • Prénoms, départements et analyse en composantes principales (1ère partie)

    Le site www.aufeminin.com met à disposition du public des statistiques sur l’usage des prénoms en France entre 1946 et 2006. Les données sont ventilées par département. J’ai écrit un petit script pour récupérer toutes ces données afin de réaliser quelques analyses statistiques à l’aide de R, mon logiciel favori d’analyse de données. Venant du Pays Basque, une question me…