Cloudwords est une application web de data-science dédiée aux chercheurs d’emploi : des nuages de mots pour cerner les attentes des recruteurs de façon statistique et rapide en comptant et classifiant les mots importants des annonces postées sur France Travail (anciennement Pole Emploi).

C’est l’une des premières applications que j’ai développé quand je suis passée de l’écriture d’articles techniques avec l’appui de projets démos réalisés pour l’occasion à des projets entièrement dev sans écriture.

Tout a commencé par un désespoir et une fatigue face à la quantité astronomique d’offres d’emploi que j’avais à décortiqué chaque jour. J’ai eu envie de les sauver de façon automatisée et d’en extraire la moelle pour perdre moins de temps. Au tout début, avec Selenium, qui offre des options de scrapping sur forme de no-code, accompagnées d’une version java pour les automatisations les plus pointues.

Et puis à un moment, j’en ai eu marre, je suis passée 100% en Java dans mon automatisation. Scrapper c’est bien (non 😈 ) mais passé par une API m’offrait bien plus de souplesse et de performance et c’est que j’ai fini par faire, toujours en Java. Pour finir, j’ai découvert et maitriser le langage R ainsi que ses options de plot pour la représentation graphique des nuages de mots et petit à petit, le visage d’une application web autonome a émergée de lui-même 🙂

Le projet est disponible sur Github et il serait intéressant de reprendre le projet et d’en faire quelque chose de 100% fonctionnel, sur un serveur etc, au moins en démo, car cette analyse est riche d’informations. Il en ressort que les mots utilisés dans les annonces, quand on regarder des milliers d’annonces, sont très riches de sens.

Leave a Reply