Guide d’introduction à la donnée synthétique

Qu’est-ce que la donnée synthétique

Origine de la donnée synthétique

Types de données synthétiques

  • Les microdonnées: des données structurées tabulaires utilisées à des fins statistiques
  • Le texte : des données textuelles utilisées dans le traitement automatique du langage naturel (Natural Language Processing, ou NLP)
  • Les médias : des images, vidéos ou sons utilisés, par exemple, pour entraîner des algorithmes de reconnaissance.

Comment génère-t-on des données synthétiques

Modélisation à base d’agents

Distribution statistique et modèles deep learning

Mécanismes de protection : la differential privacy

Quelles sont les applications de la donnée synthétique

  • La donnée est confidentielle, ou contient des informations à caractère personnel régulées par des lois comme le Règlement général de protection des données (RGPD), et donc complexe à exploiter.
  • La donnée est trop coûteuse à collecter ou à produire.
  • Le volume de données existant n’est pas suffisant pour l’application souhaitée.
  • La donnée n’existe pas.
  • La donnée est difficilement accessible au sein de l’organisation, à cause de formats complexes à exploiter ou de silos dans l’infrastructure.

Donnée synthétique et machine learning

Donnée synthétique et partage de données

Donnée synthétique pour environnements de test

La donnée synthétique comme méthode d’anonymisation des données personnelles

La donnée personnelle

L’anonymisation aux yeux de la loi

Extrait des résultats d’audits présentés par Monir Azraoui, ingénieur expert au service de l’expertise technologique à la CNIL, lors d’un atelier organisé par l’Agence Européenne de ‘cyber-sécurité’.

Garantir la confidentialité de données synthétiques

Capture d’écran d’un Tweet
Commentaire d’Aymeric Pontvianne, Conseiller Finance & innovation pour la Direction de la conformité sur les méthodes d’anonymisation et la donnée synthétique lors du Forum Fintech ACPR — AMF

--

--

Tech enthusiast, digital marketing manager. Working at Statice, startup specialized in synthetic data for privacy-preserving data applications 👉 www.statice.ai

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store