tous les documents
  • tous les documents
  • Images
  • Films
  • Rushes
  • Publications
  • Audio
Recherche avancée
Ensemble de recherche :
tous les documents
  • tous les documents
  • Images
  • Films
  • Rushes
  • Publications
  • Audio
Recherche par couleur
Ensemble de recherche :
tous les documents
  • tous les documents
  • Images
  • Films
  • Rushes
  • Publications
  • Audio
Code HTML Copiez-collez le code ci-dessous pour l'intégrer dans une page Web.
Titre :
RII - Technologies du web avec ZENITH
Légende - Résumé :
Rencontres Inria Industrie sur le thème "technologies du web, ce réseau de ressources numériques mondial", le 26 novembre 2014.
Florent Masseglia, chercheur de l'équipe-projet Zenith, parle de la gestion et l'analyse de très grandes quantités de données scientifiques.
Nom de fichier :
Inria-898_RII_TechnoWeb_ZENITH-VF.mp4
Titre :
RII - Technologies du web avec ZENITH
Année :
2014
Durée (min) :
00:02:49
Publications :
https://videotheque.inria.fr/videotheque/doc/898
Autres versions :
Master VF : 898
Master VEN :
Autre : Lien externe :
Lien Equipe-projet :
Lien Centre de Recherche :
Mots clés :
N° master :
898
Durée :
02 min 49 sec
IsyTag :
analyse - c' - clustering - clusters - donnée - données-là - évènements - intérêt - j' - l' - qu' - usage
Transcription automatiqu :
L'équipe Zenith a pour thématique de recherche la gestion et l'analyse de très grandes quantités de données scientifiques C'est Florent Masseglia chercheur qui nous propose une démonstration d'analyse de journaux d'évènements La démonstration je vais la faire sur deux cas d'usage Un premier cas d'usage qui est des données d'utilisateurs sur un portail mobile avec un grand opérateur télécom en France Et le deuxième cas d'usage c'est sur les noeuds de calcul d'un super-calculateur par un fabricant de super-calculateurs Donc vous savez ces très grands racks dans des pièces immenses avec des couloirs de machines où on a des milliers de noeuds qui vont tout le temps dire ce qu'ils sont en train de faire par exemple je sors d'une procédure je rentre dans une fonction j'ai eu un problème en mémoire j'ai utilisé un service mail etc Je vais lancer le moteur qui permet d'analyser ces données il est en train de tourner ici et l'interface graphique qui va nous permettre de voir que on peut faire des analyses sur ces données-là Alors l'interface graphique elle a été développée simplement pour montrer qu'il est possible de faire des analyses sur ces données qui sont très similaires à celles qu'on fait sur les données d'origine Chaque ligne ici est le résumé d'un cluster qui a été fait sur les données d'origine et qui résume ces données-là Et on peut voir qu'on a des statistiques sur des informations Par exemple celui-là a utilisé un service de mail et a eu un message de warning Ce sont exactement les mêmes statistiques qu'on pourrait obtenir sur les données d'origine mais elles sont obtenues sur des données résumées Et on a des informations ici sur la longueur des séquences ou bien la taille des clusters qu'on obtient à partir des données Et l'avantage évidement c'est qu'on peut filtrer ici en disant finalement je ne veux que ce qui est le plus fréquent et ce qui va largement simplifier l'affichage Il y a plusieurs intérêts pour un industriel à utiliser ce genre de technologie à partir du moment où il veut collecter des évènements dans un log Le premier intérêt c'est si les données à collecter sont extrêmement massives et qu'on a pas la place de tout garder on va proposer un résumé Et ce résumé on montre qu'il est sans perte importante et donc il est tout à fait exportable Le deuxième intérêt c'est de fabriquer un clustering en temps réel sur les données et le clustering c'est quelque chose de très difficile de très coûteux Là ce qu'on montre c'est qu'on arrive à fabriquer les profils la plupart du temps en temps réel Par exemple sur les données d'un opérateur télécom on a un million d'enregistrements sur ce petit ordinateur portable on arrive à les à fabriquer ce clustering en une minute environ pour un million de données Et le dernier intérêt c'est la confidentialité des données Imaginons que la CNIL vous demande de ne pas stocker de données individuelles et nominatives vous pouvez remplacer ces données-là par des données agrégées qui sont issues de la fabrication de ces clusters
Inria-898_RII_TechnoWeb_ZENITH-VF.mp4

Format : .mp4
220,2 Mo
1920 x 1080 pixels
Inria-898_RII_TechnoWeb__HD.MP4

Format : .mp4
103,1 Mo
1024 x 576 pixels
Moyenne définition - équivalent DVD
Encodage PAL .MP4 H264
5 Mbits/s
Encodage PAL .MP4 H264
5 Mbits/s
Sélection
Voir Selection
Déposer ici pour retirer de la sélection