Lineare Regression - Kurs 4900 Rubel. ab Offener Bildung, Ausbildung 5 Wochen, ca. 2 Stunden pro Woche, Datum 29. November 2023.
Verschiedenes / / November 29, 2023
Wenn die Korrelationsanalyse es ermöglicht, die Stärke und Richtung der Beziehung zwischen zwei Größen zu quantifizieren, bietet die Konstruktion von Regressionsmodellen größere Möglichkeiten. Mithilfe der Regressionsanalyse ist es möglich, das Verhalten der untersuchten Größen in Abhängigkeit von Prädiktorvariablen quantitativ zu beschreiben und Vorhersagen auf der Grundlage neuer Daten zu erhalten. Sie lernen, wie Sie mit der Sprache R einfache und mehrere lineare Modelle erstellen. Jede Methode hat ihre Grenzen, daher helfen wir Ihnen zu verstehen, in welchen Situationen Die lineare Regression kann und kann nicht verwendet werden, und wir zeigen Ihnen Methoden zur Diagnose ausgewählter Modelle. Einen besonderen Stellenwert nimmt im Kurs die vertiefte Anatomie der Regressionsanalyse ein: Sie beherrschen Operationen mit Matrizen sind die Grundlage der linearen Regression, um komplexere Varianten der linearen Regression verstehen zu können Modelle.
Wenn Sie vor der Notwendigkeit stehen, Zusammenhänge zwischen bestimmten quantitativ messbaren Phänomenen zu suchen und zu beschreiben, Dann ist dieser Kurs eine gute Gelegenheit, die Funktionsweise der einfachen und multiplen linearen Regression zu verstehen und deren Möglichkeiten und Grenzen kennenzulernen Methoden.
Der Kurs richtet sich an diejenigen, die bereits mit den grundlegenden Techniken der Datenanalyse mithilfe der R-Sprache vertraut sind und mit der Erstellung einfacher .html-Dokumente mit rmarkdown und knitr.
Wissenschaftliche Interessen: Struktur und Dynamik mariner Benthosgemeinschaften, räumliche Skalen, Sukzession, interspezifische und intraspezifische biotische Interaktionen, Wachstum und Fortpflanzung mariner Wirbelloser, demografische Struktur der Populationen, Mikroevolution, Bio-Statistiken.
Der Kurs besteht aus 5 Modulen:
1. Korrelationsanalyse. Einfache lineare Regression
Wir beginnen unser Gespräch über Methoden zur numerischen Beschreibung von Beziehungen zwischen quantitativen Größen mit Kovarianz- und Korrelationskoeffizienten, die es uns ermöglichen, die Stärke und Richtung der Beziehung abzuschätzen. Anschließend erfahren Sie, welche zusätzlichen Informationen über Beziehungen durch die Erstellung eines linearen Modells der Beziehung zwischen Größen gewonnen werden können. Sie lernen, Regressionskoeffizienten zu interpretieren und erfahren, wann und wie lineare Modelle verwendet werden können, um Vorhersagen zu neuen Daten zu treffen. Am Ende dieses Moduls lernen Sie, wie Sie eine lineare Modellgleichung anpassen und sie mit einem Konfidenzbereich grafisch darstellen.
2. Testen der Signifikanz und Gültigkeit linearer Modelle
Das Erstellen eines linearen Modells und das Aufschreiben seiner Gleichung ist nur der Anfang der Analyse. In diesem Modul lernen Sie, wie Sie die Ergebnisse der Regressionsanalyse beschreiben, wie Sie die statistische Signifikanz des Gesamtmodells oder seiner Koeffizienten testen und die Qualität der Anpassung beurteilen. Lineare Modelle (oder besser gesagt die statistischen Tests, die für sie verwendet werden) haben wie jede Methode ihre Grenzen. Sie erfahren, was diese Einschränkungen sind und woher sie kommen. Die von uns verwendeten grafischen Diagnosemethoden sind universell für verschiedene lineare Modelle – mehr Übung hilft Ihnen, Entscheidungen sicherer zu treffen. Sobald Sie das alles verstanden haben, können Sie ein vollständiges Skript in R schreiben, um die Ergebnisse einer einfachen linearen Regression anzupassen, zu diagnostizieren und darzustellen.
3. Eine kurze Einführung in die Welt der linearen Algebra
In diesem Modul tauchen wir in die Grundlagen linearer Modelle ein. Dazu müssen Sie die Grundlagen der linearen Algebra erlernen oder sich daran erinnern. Wir besprechen die verschiedenen Arten von Matrizen, wie man sie in R erstellt und grundlegende Operationen mit ihnen. All dies benötigen wir, um zu verstehen, wie die lineare Regression von innen heraus funktioniert. Sie erfahren, was eine Modellmatrix ist, wie Sie eine lineare Regressionsgleichung in Form von Matrizen schreiben und ihre Koeffizienten ermitteln. Sie sehen mit eigenen Augen die Hutmatrix, mit der Sie vorhergesagte Werte erhalten und diese sogar manuell berechnen können. Schließlich lernen Sie, die Restvarianz und die Varianz-Kovarianz-Matrix zu berechnen und all dies zum Aufbau einer Regressions-Konfidenzzone zu verwenden. Dann hilft Ihnen dieses Wissen, die Struktur komplexerer Modelle zu verstehen: mit diskreten Prädiktoren, mit unterschiedlichen Residuenverteilungen, mit einer anderen Struktur der Variation-Kovarianz-Matrix.
4. Multiple lineare Regression
Meistens sind die Beziehungen zwischen Größen komplexer, als sie mit einer einfachen linearen Regression beschrieben werden können. Mithilfe der multiplen linearen Regression wird beschrieben, wie eine Antwortvariable von mehreren Prädiktoren abhängt. Mit dem Auftreten mehrerer Prädiktoren im Modell hat die lineare Regression eine neue Anwendbarkeitsbedingung – die Anforderung der Abwesenheit von Multikollinearität. In diesem Modul erfahren Sie, wie Sie Multikollinearität erkennen und vermeiden. Schließlich gibt es in mehreren Modellen oft mehr Variablen, als auf einer Ebene dargestellt werden können. Deshalb bringen wir Ihnen einfache Techniken bei, die Ihnen dabei helfen, auch hier informative Grafiken zu erstellen Fall.
5. Vergleich linearer Modelle
Mehrere lineare Modelle ähneln einem Baukasten: Komplexere Modelle können auseinandergenommen und vereinfacht werden. Sie erfahren, wie verschachtelte Modellvergleiche mithilfe des partiellen F-Tests verwendet werden, um die Signifikanz einzelner Prädiktoren oder Gruppen von Prädiktoren zu testen. Komplexere Modelle beschreiben die Originaldaten besser, aber eine übermäßige Komplikation ist gefährlich, weil Solche Modelle beginnen, schlechte Vorhersagen auf der Grundlage neuer Daten zu treffen. Mit partiellen F-Tests können Sie Modelle vereinfachen, indem Sie nicht signifikante Prädiktoren schrittweise eliminieren. Vereinfachte Modelle lassen sich einfacher interpretieren und Ergebnisse präsentieren. Alles, was Sie bisher über lineare Regression gelernt haben, können Sie anwenden, indem Sie ein Datenanalyseprojekt dort durchführen, wo Sie es benötigen Erstellen Sie korrekt ein optimales multiples lineares Modell und präsentieren Sie seine Ergebnisse in einem Bericht, der mit erstellt wurde Abschlag und Strickr.