Les techniques d’analyse des données ont connu un essor
important surtout avec le développement de l’informatique et big
data. Le volume important des données nécessite comme un prétraitement:la
réduction des données, ce qui est l’objectif principal de l’analyse des
données en premier lieu. Pour résoudre le problème de la
dimensionalité, les méthodes multidimensionnelles telles que l’Analyse
en Composantes Principales (ACP) et l’Analyse Factorielle des
Correspondances (AFC)seront exploitées et expliquées en détail dans cet
ouvrage.En second lieu, l’interprétation et la classification des
données dans le domaine de la reconnaissance des formes, la fouille des
données et l’intelligence artificielle font appel aux méthodes de
classification plus particulièrement l’algorithme de la classification
hiérarchique qui permet une représentation
arborescente appelée dendrogrammeet les méthodes de partitionnement
«clustering»comme l’algorithme des centres mobiles qui est très utilisé
dans l’apprentissage non-supervisé.En plus, les méthodes
morphologiques à base des opérateurs de traitement d’image comme
l’érosion, dilatation, ouverture et fermeture peuvent être utilisées dans
le domaine de la classification.La prévision dans le domaine
d’économie et le domaine d’épidémiologie nécessitent des modèles
statistiques puissants. Pour cela, nous avons introduit la
méthode des moindres carrés et les séries chronologiques.
Généralement, deux modèles sont exploités comme la prévision
linéaire et la prévision exponentielle. Pour juger l’efficacité des
modèles proposés, un coefficient de corrélation doit être mesuré.Cet
ouvrage est organisé autour de cinq chapitres de la façon
suivante:Chapitre1décrit d’une façon détaillée la nature des variables,
les mesures de similarité ainsi les différents types de tableaux de
données. De plus, quelques ingrédients dédiés à l’analyse factorielle
des correspondances (AFC) ont été proposés.Chapitre 2représentele
noyau de cet ouvrage car il explique profondément l’algorithme
d’ACP avec des exercices d’applications en variant la
métrique selon des données homogènes/hétérogènes.Chapitre3a un
grand impact dans le clustering c.à.d.la classification
non-supervisée. Ce chapitre explique 4 méthodes de
classification:Classification Hiérarchique ascendante(CHA), Algorithme
des Centres Mobiles (ACM), Maximum de Vraisemblance et les méthodes
morphologiquesChapitre4joue un rôle important dans la prévision en se
basant sur des méthodes statistiques comme la méthode des moindres
carrés.Chapitre5:introduit les séries chronologiques qui entre dans
le cadre de la prédiction en tenant compte de la composante
temporelle.
- Enseignant: nabil neggaz