Definition and development of a high performance architecture to proces data from Twitter in real-time.
Project COCKTAIL : detection of trends and weak signals on Twitter, applied on food-related discourse
- kc_data:
- a:8:{i:0;s:0:"";s:4:"mode";s:2:"kc";s:3:"css";s:0:"";s:9:"max_width";s:0:"";s:7:"classes";s:0:"";s:9:"thumbnail";s:0:"";s:9:"collapsed";s:0:"";s:9:"optimized";s:0:"";}
- kc_raw_content:
- [kc_row _id="58760"][kc_column width="12/12" video_mute="no" _id="410467"][kc_tabs speed="450" pagination="yes" active_section="1" _id="738686"][kc_tab title="Travaux de recherche" _id="365053"][kc_column_text _id="618253"]
La thématique générale de mes travaux concerne la gestion des données hétérogènes. Avec l'émergence du Big Data, la variété des données se manifeste au niveau du contenu, des sources de données, ou encore du modèle. En effet, les cas d'utilisation et les données elles-mêmes définissent le ou les modèles utilisés. Par exemple, le modèle relationnel permet de stocker facilement les attributs, le modèle graphe les relations entre les entités et les séries temporelles incorporent nativement une dimension temporelle.
J'aborde cette thématique suivant deux axes :- axe polystores :La diversité des modèles de données servant à stocker ou traiter les données rend difficile leur exploitation. Les polystores permettent d'utiliser plusieurs systèmes de stockage hétérogènes avec une interface unifiée. Toutefois, les polystores sont bien plus complexes à mettre en œuvre qu'un système de stockage unique, puisqu'ils doivent traiter de multiple modèles de données sans perdre leur expressivité, mais également autoriser l'exécution de requêtes visant différents systèmes de stockage tout en prenant en compte leur optimisation. Je vise à proposer une formalisation basée sur la théorie des catégories représentant les différents niveaux d'abstraction des données contenues dans un polystore (par exemple modèle et schéma) et les opérations applicables sur les données.
[/kc_column_text][/kc_tab][kc_tab title="Enseignements" _id="218116"][kc_column_text _id="188515"]
- axe tenseurs :
Je m'intéresse également à l'analyse de données, principalement à l'aide d'opérateurs tensoriels. Les tenseurs sont des objets mathématiques multidimensionnels, qui peuvent jouer le rôle de modèle pivot pour la majorité des modèles de données. Cela est un avantage certain pour modéliser les données à analyser. Les décompositions tensorielles peuvent avoir différentes finalités, incluant la détection de communautés ou de singularités. Je développe de nouveaux algorithmes basés sur ces décompositions, et les optimise afin de pouvoir les exécuter sur des données réelles qui produisent souvent des tenseurs creux mais ayant des tailles de dimensions importantes.Licence 2 – Principe des Systèmes d’Exploitation
Master 1 – Systèmes Distribués
Master 2 BDIA – Bases de données et Environnements distribués
Master 2 BDIA – Informatique Décisionnelle
[/kc_column_text][/kc_tab][/kc_tabs][/kc_column][/kc_row] - identite:
- Gillet Annabelle
- statut:
- a:1:{i:0;s:3:"MCF";}
- equipe:
- Science des Données
- fonction:
- a:1:{i:0;s:8:"searcher";}
- adresse_postale:
- 9, Avenue Alain Savary - Université de Bourgogne - 21078 Dijon
- telephone:
- localisation:
- Mirande, aile H
- courriel:
- annabelle.gillet@u-bourgogne.fr
- url_site_perso_ou_professionnel:
- travaux_de_recherche_passes:
- enseignements_dispenses:
- autres_activites:
- photo_de_profil:
- 1176