III.6 Modèles paramétriques ou non
paramétriques
On pale de modèles paramétriques lorsque la
fonction de prédiction f prend une forme particulière
comme exemple on peut voir la régression non linéaire ou on a une
relation de forme y = a1x1 + a x + ... + anxn n
+ c.(J , 2007)
Un tel modèle qui présuppose pour f
une forme particulière,avec un nombre de de paramètres
ajustables déjà spécifié est un
modèle paramétrique.(PFANzAGL , 1994)
Lorsque aucune forme particulière n'est
postulée pour la fonction de prédiction,on parle de
modèle non paramétrique.
III.7 Apprentissage hors ligne ou incremental
Dans le cas ou l'on connaît l'intégralité
des données d'apprentissage,on parle d'une méthode
d'apprentissage hors ligne ou
statique.(ref26)
Dans la situation ou il existe un flot continu d'informations
auxquels l'algorithme
PRévISON DE DATE DE PASSAGE DES JALONS 2022
42 CHAPITRE III. TRAITEMENT
Amassin NACERDDINE Université Paris 8 Vincennes
doit s'adapter et ajuster la fonction de prédiction
f au fur et à mesure que les données lui parviennent
sont dits online ou incrémentaux.
III.8 Modèles géométriques ou
probabilistes
On parle de modèles géométrique lorsque
il est question de distance ou de proximité entre les valeurs,à
titre d'exemple on peut citer l'algorithme KNN qui vas chercher lors de la
classification la classe la plus représentatif des K valeurs les plus
proches. On parle de modèles probabilistes lorsque les valeurs des
variables prédicatives et des variables cibles sont liées et
obéissent a une certaines loi de probabilité.
III.9 Les principaux algorithmes
Nous allons présenter dans cette section les
différents algorithmes utilisés
III.9.1 La régression linéaire
La régression linéaire est l'un des
modèles de ML supervisé et non paramétrique les plus
simple. il suppose que la fonction de
prédiction f qui lie les variables prédictives
a1x1 + ... + anxn a
la variable cible a la forme f(x) = a1x1 +
... + anxn + c. L'apprentissage du
modèle consiste a calculer les coefficients de tel sorte a minimiser les
erreurs de prédiction sur le jeux de données
d'apprentissage.(cette erreur est définie par la somme des carrés
des écarts entre les valeurs prédites et les valeurs
observées.)(T.HASTIE , 2009)
· Avantages : Peu être représenté
sous forme d'une expression mathématique,ce qui rend le modèle
simple a interpréter.
· Inconvénients :La relation que l'on
souhaite mettre en évidence doit être
linéaire. et le jeux de
données ne doit pas contenir de valeurs aberrantes.
|