Dans le cadre du projet européen COMPOSITE (Comparative Police Studies in the EU) le groupe CAPGEMINI propose, en partenariat avec l’URCA (laboratoire CReSTIC/SIC) et l’UTT (équipe Tech-CICO), le sujet de thèse CIFRE ci-dessous (démarrage dès que possible).
Les candidats sont invités à contacter Francis Rousseaux (francis.rousseaux@univ-reims.fr) et Eddie Soulier (eddie.soulier@utt.fr).
Titre de la thèse : Théories, méthodes et mécanismes d’extraction de signaux faibles de formes et patterns de présence et de comportements identifiables et quantifiables à partir de sources multiples.
Contexte et objectif : Dans le cadre d’un grand projet de R&D financé par l’Europe, le sujet consiste à mettre au point les méthodes, les mécanismes et la théorie permettant d’extraire de signaux faibles des formes ou « patterns » significatifs d’une présence, de sentiments, de comportements identifiables, voire quantifiables. Il s’agit d’un programme qui s’inscrit au meilleur niveau de la recherche impliquant l’utilisation des données ouvertes (Open data), en vue de mieux renseigner, piloter, partager, mais aussi de mieux percevoir le sentiment de populations envers leurs forces de police.
La mise en œuvre passe nécessairement par l’usage de technologies existantes Open source. Des données ont déjà été collectées, modélisées et analysées au sein d’une activité de monitoring. Des outils d’analyse de données ont été mis en œuvres, d’autres relèvent du Data Mining.
La thèse s’inscrit dans la suite des travaux exploratoires, et consistera à :
1) développer des techniques d’analyse de données, comparer les sources manuelles et les sources automatiques.
2) ouvrir la récolte vers d’autres sources allant jusqu’au contenu des réseaux sociaux si nécessaire.
3) par ailleurs les modélisations avancées des chercheurs du projet seront à comparer à l’aune de l’analyse des données récoltées.
4) la mise à disposition d’une « Open Data Base COMPOSITE » contenant les données des sources ouvertes à l‘usage des chercheurs a déjà connu une phase pilote qu’il s’agira de continuer tout en améliorant l’accès.
COMPOSITE possède un site Web : http://www.composite-project.eu/index.php/Home-fr.html
Profil recherché : Master 2 ou ingénieur en informatique, vous désirez préparer une thèse en milieu industriel et conduire la R&D associée. Vous avez un bon niveau d'anglais, suffisamment pour converser avec la communauté de chercheurs COMPOSITE, présenter des résultats, intervenir de concert avec l’équipe COMPOSITE de CAPGEMINI, et vous appréciez le travail en équipe. Vous avez de fortes capacités de communication et d'organisation.
Vos compétences généralistes en informatique sont doublées de capacités pluridisciplinaires dans les domaines de la Business Intelligence versus Data Mining versus data Analytics. L’analyse de données vous intéresse, ainsi que l’exploitation des technologies et des langages comme RapidMiner, le langage R. L’analyse prédictive illustrée par des approches intégrées dans KXEN vous sont familières. La mise à disposition des données suivant des moteurs comme Yacy, ou Elastic Search, voire des requêtes à base de HIVE ou PIG vous parlent ou bien il vous semble possible de les mettre en œuvre dans le cadre du projet COMPOSITE.
Rattachement et lieu principal de la thèse : Rattaché(e) au domaine d’activités Défense et Global Security sur le site de Suresnes en Ile-de-France.