L`objectif de cet exercice est de construire un modèle de régression simple que nous pouvons utiliser pour prédire distance (DIST) en établissant une relation linéaire statistiquement significative avec Speed (vitesse). Mais avant de sauter dans la syntaxe, permet d`essayer de comprendre graphiquement ces variables. En règle générale, pour chacune des variables indépendantes (prédicteurs), les tracés suivants sont dessinés pour visualiser le comportement suivant: # multiple régression linéaire exemple ajustement <-LM (y ~ x1 + x2 + x3, Data = mydata) résumé (ajustement) # afficher les résultats vous pouvez détecter les points en regardant l`objet contenant le modèle linéaire, en utilisant la fonction cuisiniers. distance, puis tracer ces distances. Modifiez une valeur à des fins pour voir à quoi elle ressemble sur le tracé de distance des cuisiniers. Pour modifier une valeur spécifique, vous pouvez directement pointer dessus avec ageandheight [numéro de ligne, numéro de colonne] = [nouvelle valeur]. Dans ce cas, la hauteur est changée à 7,7 du deuxième exemple: jusqu`à présent, nous avons vu comment construire un modèle de régression linéaire à l`aide de l`ensemble de données. Si nous le construisons de cette façon, il n`y a aucun moyen de dire comment le modèle va effectuer avec de nouvelles données. Par conséquent, la pratique préférée consiste à diviser votre jeu de données en un échantillon 80:20 (formation: test), puis à créer le modèle sur l`échantillon 80%, puis à utiliser le modèle ainsi conçu pour prédire la variable dépendante sur les données de test. Une régression linéaire est un modèle statistique qui analyse la relation entre une variable de réponse (souvent appelée y) et une ou plusieurs variables et leurs interactions (souvent appelées variables x ou explicatives). Vous faites ce genre de relations dans votre tête tout le temps, par exemple lorsque vous calculez l`âge d`un enfant en fonction de sa taille, vous êtes en supposant que l`aîné, elle est, le plus grand qu`elle sera.

La régression linéaire est l`un des modèles statistiques les plus élémentaires là-bas, ses résultats peuvent être interprétés par presque tout le monde, et il a été autour depuis le 19ème siècle. C`est précisément ce qui rend la régression linéaire si populaire. C`est simple, et il a survécu pendant des centaines d`années. Même si elle n`est pas aussi sophistiquée que d`autres algorithmes comme les réseaux neuronaux artificiels ou les forêts aléatoires, selon une enquête réalisée par KD Nuggets, la régression a été l`algorithme le plus utilisé par les scientifiques de données en 2016 et 2017. Il est même prédit qu`il va encore être utilisé dans l`année 2118! Note technique: vous avez peut-être remarqué que nous avons utilisé le tracé de fonction avec toutes sortes d`arguments: une ou deux variables, un bloc de données et maintenant un modèle linéaire.

Modele lineaire sur r