{"id":524,"date":"2020-08-19T15:30:33","date_gmt":"2020-08-19T13:30:33","guid":{"rendered":"http:\/\/www.studioh.fr\/?p=524"},"modified":"2020-08-19T15:30:33","modified_gmt":"2020-08-19T13:30:33","slug":"tout-savoir-sur-le-clustering","status":"publish","type":"post","link":"http:\/\/www.studioh.fr\/tout-savoir-sur-le-clustering\/","title":{"rendered":"Tout savoir sur le clustering"},"content":{"rendered":"

Le machine learning est un outil indispensable pour faire face \u00e0 l’enjeu de la digitalisation. En effet, les algorithmes classiques ont montr\u00e9 leurs limites face \u00e0 la croissance exponentielle de la quantit\u00e9 des donn\u00e9es \u00e0 prendre en compte. Parmi les techniques de manipulation de donn\u00e9es \u00e0 grande \u00e9chelle, il y a le clustering. Qu’est-ce que c’est ? Quelle est son importance pour l’analyse des donn\u00e9es ?<\/p>\n

<\/p>\n

Qu’est-ce que le clustering ?<\/h2>\n

Le clustering est une technique de machine learning qui a pour objectif de regrouper les donn\u00e9es selon leurs similarit\u00e9s ou leurs distances. Il s’agit d’un type d’apprentissage automatique non supervis\u00e9. Il est tr\u00e8s populaire dans le domaine de l’\u00e9tude statistique des donn\u00e9es. En informatique, il est principalement utilis\u00e9 pour la fragmentation ou la classification des donn\u00e9es. Le clustering est, aussi, utile pour l’extraction des connaissances, afin de trouver des sous-ensembles humainement ind\u00e9tectables.<\/p>\n

\"\"<\/p>\n

L’importance du clustering pour un data analyste<\/h2>\n

La principale utilit\u00e9 de cette m\u00e9thode est l’extraction des donn\u00e9es dans un ensemble structur\u00e9 ou non et d’identifier un sens commun entre elles. En effet, les algorithmes de clustering s\u00e9parent les donn\u00e9es par des groupes de clusters, en tenant compte de leurs similitudes.
\nLe clustering peut \u00eatre utilis\u00e9 dans tous les domaines d’activit\u00e9 existants. Par exemple, dans le domaine m\u00e9dical, il permet de classifier les maladies suivant un point commun sp\u00e9cifique. Dans le domaine commercial, il peut classifier les clients potentiels selon le type de march\u00e9.<\/p>\n

Quelques algorithmes de clustering pour l’exploration de donn\u00e9es<\/h2>\n

Le mod\u00e8le graphique est le plus utilis\u00e9 dans le domaine de l’exploration de donn\u00e9es. Il consiste \u00e0 organiser les donn\u00e9es en grappe et \u00e0 d\u00e9terminer les relations entre les membres, en utilisant un graphe. Parmi les algorithmes les plus connus, il y a le \u00ab centroid-based \u00bb, qui utilise des vecteurs de valeurs, et le \u00ab distributed-based \u00bb, qui combine chaque objet en fonction d’un mod\u00e8le statistique pr\u00e9d\u00e9fini. Il est \u00e9galement possible de citer l’algorithme bas\u00e9 sur la densit\u00e9, qui g\u00e9n\u00e8re des grappes en fonction de la densit\u00e9 des donn\u00e9es.<\/p>\n","protected":false},"excerpt":{"rendered":"

Le machine learning est un outil indispensable pour faire face \u00e0 l’enjeu de la digitalisation. En effet, les algorithmes classiques ont montr\u00e9 leurs limites face \u00e0 la croissance exponentielle de […]<\/p>\n","protected":false},"author":1,"featured_media":526,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":[],"categories":[1],"tags":[],"_links":{"self":[{"href":"http:\/\/www.studioh.fr\/wp-json\/wp\/v2\/posts\/524"}],"collection":[{"href":"http:\/\/www.studioh.fr\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"http:\/\/www.studioh.fr\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"http:\/\/www.studioh.fr\/wp-json\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"http:\/\/www.studioh.fr\/wp-json\/wp\/v2\/comments?post=524"}],"version-history":[{"count":1,"href":"http:\/\/www.studioh.fr\/wp-json\/wp\/v2\/posts\/524\/revisions"}],"predecessor-version":[{"id":527,"href":"http:\/\/www.studioh.fr\/wp-json\/wp\/v2\/posts\/524\/revisions\/527"}],"wp:featuredmedia":[{"embeddable":true,"href":"http:\/\/www.studioh.fr\/wp-json\/wp\/v2\/media\/526"}],"wp:attachment":[{"href":"http:\/\/www.studioh.fr\/wp-json\/wp\/v2\/media?parent=524"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"http:\/\/www.studioh.fr\/wp-json\/wp\/v2\/categories?post=524"},{"taxonomy":"post_tag","embeddable":true,"href":"http:\/\/www.studioh.fr\/wp-json\/wp\/v2\/tags?post=524"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}