Auteur/autrice : fguillem

  • Analyse des Programmes de la Présidentielle 2022 avec Word2vec

    Analyse des Programmes de la Présidentielle 2022 avec Word2vec

    Il y a dix ans, j’ai réalisé une rapide étude des mots utilisés dans les professions de foi des candidats à la présidentielle de 2012. Ce qui était intéressant avec cet article, c’est que les distances sémantiques obtenues étaient révélatrices des stratégies adoptées par les différents candidats. Il montrait par exemple que la profession de…

  • Estimer une Distribution avec Keras

    Quand on parle de machine learning supervisé, il est usuel de distinguer deux types de problème en fonction de la nature de l’information que l’on souhaite prédire: Si les variables à prédire sont qualitatives, on parle de classification Si elles sont quantitatives, on parle de régression Les modèles de classification estiment une loi de probabilité…

  • Le Retour du Blog

    Il y a quelques années, j’avais un blog personnel dans lequel je publiais régulièrement des articles de statistique en français. A l’époque, je travaillais à mon compte et ce blog me servait essentiellement de vitrine professionnelle. Je rajoutais régulièrement du contenu, mais essentiellement pendant les périodes où je ne travaillais pas. Sauf que ça fait…

  • Analyse de ma Collection de Picsou

    Lorsque je ne fais pas des statistiques, je lis des bandes dessinées et en particulier des Picsou Magazine ! Cela fait plus de dix-huit que j’achète et que je collectionne ce merveilleux magazine. Comme tout bon collectionneur, je tiens à jour un fichier contenant la liste de tous les numéros que je possède et de…

  • Une analyse statistique de la campagne présidentielle

    Comme la plupart des français en âge de voter, j’ai reçu il y a quelques jours les programmes des différents candidats à l’élection présidentielle de 2012. C’était l’occasion rêvée de faire un peu de text-mining et ainsi de comprendre le positionnement des différents candidats. Principe Le text-mining est l’étude statistique des textes. Elle consiste à…

  • Un mot sur les infographies

    L’internet est un outil de communication incroyable, mais on ne peut pas nier qu’il y circule tout un tas d’horreurs et d’immondices. Parmi elles, celles qui me répugnent le plus sont de loin les infographies ! Il s’agit de grandes images qui contiennent tout un tas de chiffres et d’informations sur un thème particulier, présentés…

  • Argent, politique et… critiques cinéma !

    Aller au cinéma est une activité divertissante mais aussi fort risquée : c’est une activité coûteuse en argent mais aussi en temps, difficile à organiser dès lors qu’il y a plus d’un participant et qui comporte de multiples petits dangers qui peuvent gâcher une séance : se retrouver derrière un géant ou à coté d’une…

  • Cartes de visites

    Je viens de recevoir mes nouvelles cartes de visite. Merci à Amélia qui s’est occupée de tout. Au risque de me répéter, si vous avez des données et que vous ne savez pas comment les exploiter, n’hésitez pas à me contacter.

  • Le juste prix d’un ipad

    Si vous vivez dans une grande ville et que vous n’avez pas d’ipad, il y a de bonnes chances pour que plusieurs de vos amis en aient et que vous soyez frustré de ne pas en avoir un vous-même. Seulement voilà, ces bestioles technologiques coûtent drôlement cher ! Néanmoins, la sortie de l’ipad 2 le 25…

  • Prénoms, régions et analyse en composantes principales (3ème partie)

    Cet article commence ici et la deuxième partie se trouve là. Résumé des épisodes précédents L’objectif est de décrire et expliquer les différences géographiques en matière d’utilisation des prénoms. Pour cela nous utilisons une analyse en composantes principales. La première composante capture 25% des différences entre départements : nous avons vu que cette composante capture en fait les différences entre…