Verallgemeinerte lineare Modelle - Kurs 3600 Rubel. ab Offener Bildung, Ausbildung 3 Wochen, ca. 6 Stunden pro Woche, Datum 29. November 2023.
Verschiedenes / / December 01, 2023
Eine der Voraussetzungen für die Anwendbarkeit konventioneller linearer Modelle ist die Unabhängigkeit der Beobachtungen voneinander, auf deren Grundlage das Modell ausgewählt wird. In der Praxis gibt es jedoch häufig Situationen, in denen die Gestaltung der Materialsammlung so gestaltet ist, dass ein Verstoß gegen diese Bedingung unvermeidlich ist. Stellen Sie sich vor, Sie haben beschlossen, ein Modell zu erstellen, das die Beziehung zwischen den Leistungen im Sportunterricht und den IQ-Testergebnissen von Schülern beschreibt. Um dieses Problem zu lösen, haben Sie an mehreren Institutionen zahlreiche Proben angefertigt. Ist es möglich, solche Daten in einer Analyse zu kombinieren, die nach dem traditionellen Schema erstellt wird? Natürlich nicht. Die Studierenden an den einzelnen Universitäten können einander in mancher Hinsicht ähnlich sein. Sogar die Art der Beziehung zwischen den untersuchten Größen kann etwas unterschiedlich sein. Diese Art von Daten, bei denen gruppeninterne Korrelationen bestehen, sollten mithilfe linearer gemischter Modelle analysiert werden. Wir werden zeigen, dass einige Prädiktoren als sogenannte „Zufallsfaktoren“ in das Modell einbezogen werden sollten. Sie erfahren, dass Zufallsfaktoren hierarchisch untergeordnet werden können. Wir werden diskutieren, wie solche gemischten Modelle für abhängige Variablen erstellt werden können, die unterschiedlichen Verteilungstypen folgen. Darüber hinaus werden wir zeigen, dass der Zufallsteil des Modells noch komplexer sein kann – er kann eine Komponente enthalten, die das Verhalten der Varianz als Reaktion auf den Einfluss einer Kovariate modelliert. Am Ende des Kurses finden Sie ein Projekt, in dem Sie die Erstellung gemischter Modelle üben können, indem Sie einen von mehreren Datensätzen auswählen. Basierend auf der Analyse dieser Daten können Sie einen Bericht in der Tradition reproduzierbarer Forschung erstellen.
Außerordentlicher Professor, Abteilung für Wirbellose Zoologie, Fakultät für Biologie, Staatliche Universität St. Petersburg, Ph.D.
Wissenschaftliche Interessen: Struktur und Dynamik mariner Benthosgemeinschaften, räumliche Skalen, Sukzession, interspezifische und intraspezifische biotische Interaktionen, Wachstum und Fortpflanzung mariner Wirbelloser, demografische Struktur der Populationen, Mikroevolution, Bio-Statistiken.
Der Kurs besteht aus 4 Modulen:
1) Einführung in verallgemeinerte lineare Modelle
Mit verallgemeinerten linearen Modellen (GLMs) können Sie das Verhalten von Größen modellieren, die keiner Normalverteilung folgen. Um Ihnen den Einstieg in die Welt des GLM zu erleichtern, analysieren wir deren Struktur am Beispiel des GLM für normalverteilte Größen – so können Sie Parallelen zu einfachen linearen Modellen ziehen. Sie erfahren, was eine Link-Funktion ist, wie die maximale Wahrscheinlichkeit funktioniert und wie Sie GLM-Hypothesen mithilfe von Wald-Tests und Likelihood-Ratio-Tests testen.
2) Modellauswahlproblem
In diesem Modul werden wir über methodische Probleme im Zusammenhang mit der Erstellung von Modellen sprechen. Ein Modell ist eine vereinfachte Darstellung der Realität, und die Wahl zwischen verschiedenen konkurrierenden Methoden einer solchen Vereinfachung ist eine häufige Aufgabe für den Analytiker. In diesem Modul lernen Sie, Modelle anhand von Informationskriterien zu vergleichen. Wir besprechen die wichtigsten Möglichkeiten der Analyse bei der Modellauswahl und sprechen über die Schwierigkeiten, die sich im Zusammenhang mit der verborgenen Modellvielfalt ergeben. Abschließend zeigen wir Ihnen, wie Sie die wichtigsten Arten von Missbrauch bei der Modellauswahl (Datenfischerei, P-Hacking) erkennen.
3) Verallgemeinerte lineare Modelle zum Zählen von Daten
In diesem Modul besprechen wir grundlegende Methoden zur Modellierung abzählbarer Größen. Zunächst diskutieren wir, warum herkömmliche lineare Modelle nicht zum Zählen von Daten geeignet sind. Die Eigenschaften zählbarer Verteilungen helfen Ihnen, die Unterschiede zwischen den GLM-Typen für zählbare Daten und die Merkmale ihrer Diagnose zu verstehen. Sie werden die Verknüpfungsfunktion bei der Arbeit sehen, wenn Sie GLM-Vorhersagen auf der Verknüpfungsfunktionsskala und auf der Antwortvariablenskala visualisieren.
4) Verallgemeinerte lineare Modelle mit binärer Antwort
Manchmal besteht die Notwendigkeit zu simulieren, ob ein Ereignis eingetreten ist oder nicht, ob das Fußballmannschaft oder verloren, ob sich der Patient nach der Behandlung erholt hat oder nicht, ob der Klient sich verpflichtet hat kaufen oder nicht. Herkömmliche lineare Modelle sind für die Modellierung solcher binären Daten (Ereignisse mit zwei Ausgängen) nicht geeignet, dies lässt sich jedoch problemlos mit verallgemeinerten linearen Modellen bewerkstelligen. In diesem Modul lernen Sie, die Eintrittswahrscheinlichkeiten von Ereignissen zu modellieren, indem Sie sie als Quoten darstellen. Wir werden uns ansehen, wie die Logit-Link-Funktion funktioniert und wie GLM-Koeffizienten interpretiert werden, wenn sie verwendet wird. Abschließend können Sie die Analyse verallgemeinerter linearer Modelle mit unterschiedlichen Verteilungen üben, indem Sie ein Datenanalyseprojekt abschließen. Die Ergebnisse dieser Analyse müssen als Bericht im HTML-Format präsentiert werden, der mit rmarkdown/knitr geschrieben wurde.
• Erfahren Sie, welche Fähigkeiten für den Einstieg in Analytics und Data Science erforderlich sind. • Lernen Sie, mit Excel, SQL, Power BI und Google Data Studio zu arbeiten Daten und schreiben Sie Ihren ersten Code in Python. Holen Sie sich eine Schritt-für-Schritt-Anleitung und erfahren Sie, wie Sie in den Bereich Data Science einsteigen und eine Rolle in Data Science auswählen
4,4
1 490 ₽