L'analyse exploratoire des données (eda)

Avant d'appliquer des techniques statistiques pour un ensemble de données, il est important d'examiner les données pour comprendre ses propriétés de base. Vous pouvez utiliser une série de techniques qui sont collectivement connus comme Analyse exploratoire des données

Sommaire

(EDA) pour analyser un ensemble de données. EDA permet de garantir que vous choisissez les techniques statistiques correctes pour analyser et prévoir les données. Les deux types de base de techniques EDA sont graphique techniques et quantitatif techniques.

Techniques EDA graphique

Techniques EDA graphique montrent les propriétés clés d'un ensemble de données dans un format pratique. Il est souvent plus facile de comprendre les propriétés d'une variable et les relations entre les variables en regardant des graphiques plutôt que de regarder les données brutes. Vous pouvez utiliser plusieurs techniques graphiques, selon le type de données en cours d'analyse. Vous utilisez ce qui suit:

  • Les boîtes à moustaches

  • Histogrammes




  • Tracés de normalité

  • Les diagrammes de dispersion

Techniques quantitatives EDA

Techniques quantitatives EDA fournissent une méthode plus rigoureuse de la détermination des propriétés clés d'un ensemble de données. Deux des plus importantes de ces techniques sont

  • L'estimation d'intervalle.

  • Tests d'hypothèses.

Intervalle Les estimations sont utilisées pour créer un gamme de valeurs dans laquelle une variable est susceptible de tomber. Hypothèse test est utilisé pour tester diverses propositions sur un ensemble de données, tels que

  • La valeur moyenne de l'ensemble de données.

  • L'écart type de l'ensemble de données.

  • La distribution de probabilité du jeu de données suivant.

Test d'hypothèse est une technique de base dans les statistiques.


» » » » L'analyse exploratoire des données (eda)