Prénoms, régions et analyse en composantes principales (3ème partie)

Troisième partie de notre petit travail sur la géographie des prénoms. Nous montrons qu’une partie des différences géographiques des prénoms est liée à des différences dans la composition sociale des départements. Mais la composition sociale est-elle réellement la cause de ces différences ? N’est-ce pas plutôt le résultat de différences dans les pratiques culturelles ? Continuer la lecture

Publié dans Analyse | 2 commentaires

Prénoms, régions et analyse en composante principale (2ème partie)

Deuxième partie d’une petite étude sur la géographie des prénoms. Grâce à une analyse en composantes principales, nous découvrons un clivage important entre le nord-ouest et le sud-est de la France. Continuer la lecture

Publié dans Analyse | Un commentaire

Prénoms, départements et analyse en composantes principales (1ère partie)

Comment sont utilisés les prénoms en France ? existe-t-il des particularismes régionaux forts ? Les prénoms sont-ils attribués partout dans les mêmes proportions ou bien existe-t-il des spécificités géographiques ? A l’aide de données collectées sur le web et de quelques connaissances en statistiques, nous allons essayer de répondre à cette question. Continuer la lecture

Publié dans Analyse | 6 commentaires

La vie d’un bouchon

Récemment le site kaggle.com a organisé une compétition de data-mining dont l’objectif était de prédire le temps de trajet d’une voiture sur différentes portions d’une autoroute australienne à différents moments.

A l’aide des données mises à dispositions par le site, il est possible de visualiser l’apparition et la résorption des embouteillages sur l’autoroute en question. Continuer la lecture

Publié dans Visualisation | 2 commentaires

Le Détecteur de robots

Êtes-vous sûr et certain que vous n’êtes pas un robot construit dans le but de réaliser dieu sait quel plan maléfique ? Pour le savoir, essayez le détecteur de robots ci-dessous. Le but est de générer une séquence de 0 … Continuer la lecture

Publié dans Probabilités | Un commentaire

Le juge est-il raciste – Seconde partie

Suite de l’article Le Juge est-il raciste ?. Si vous ne l’avez pas lu, je vous conseille de le faire avant de lire celui-ci.

Dans cette seconde partie, nous discutons de la difficulté de mettre en oeuvre des tests de significativité lorsqu’on a très peu de données disponibles. Nous parlons alors des des stratégies que l’on peut adopter dans ces situations : bootstrap, simulation ou carrément changement de modèle. Continuer la lecture

Publié dans Analyse | Laisser un commentaire

L’Éloge de R

Cet article est destiné à deux types de lecteurs : ceux qui utilisent déjà R et qui aimeraient convaincre leur entourage d’en faire de même. ceux qui n’utilisent pas encore R. J’espère qu’à ceux-là, ces quelques paragraphes leur donneront l’envie … Continuer la lecture

Publié dans R | Un commentaire

Le Juge est-il raciste ?

En ce moment je me passionne pour The Good Wife, une série qui raconte l’histoire d’une femme au foyer devenue avocate après que son mari-procureur ait été jeté en prison pour corruption. L’épisode 10 de la première saison a particulièrement … Continuer la lecture

Publié dans Analyse | 6 commentaires

Hello World !

Puisque la coutume l’exige, la première phrase du premier article de ce blog sera consacrée au traditionnel salut du monde : BONJOUR LE MONDE ! Bienvenue sur le Blog de François Guillem. À Qui s’adresse ce blog ? Contrairement à … Continuer la lecture

Publié dans Non classé | 5 commentaires