Data Science – kostenloser Kurs der School of Data Analysis, Ausbildung 4 Semester, Datum 2. Dezember 2023.
Verschiedenes / / December 05, 2023
Für diejenigen, die mithilfe der Datenanalyse Probleme aufwerfen, Lösungen vorschlagen und deren Wirksamkeit nicht nur in einem synthetischen Experiment, sondern auch unter realen Bedingungen bewerten möchten.
Statistik, maschinelles Lernen und Arbeiten mit verschiedenen Datentypen.
Daten sind die Grundlage der meisten modernen Dienste und Produkte, von Wettervorhersage-Apps bis hin zu selbstfahrenden Autos. Ein Data Scientist führt Experimente durch, erstellt Metriken, weiß, wie man den Betrieb von Diensten optimiert und versteht, wo ihre Wachstumspunkte liegen.
Jeder Studierende muss im Laufe des Semesters mindestens drei Lehrveranstaltungen erfolgreich absolvieren. Wenn es beispielsweise im Hauptprogramm zwei davon gibt, müssen Sie sich für einen der Spezialkurse entscheiden.
Die Wissensüberprüfung erfolgt vor allem durch Hausaufgaben – Prüfungen und Tests werden nur in einigen Fächern durchgeführt.
Erstes Semester
Obligatorisch
Algorithmen und Datenstrukturen, Teil 1
01.Komplexität und Rechenmodelle. Analyse buchhalterischer Werte (Anfang)
02.Analyse der Buchhaltungswerte (Ende)
03.Merge-Sort- und Quick-Sort-Algorithmen
04. Ordnungsstatistik. Haufen (Anfang)
05. Haufen (Ende)
06.Hashing
07. Bäume suchen (Anfang)
08.Suchbäume (Fortsetzung)
09.Bäume suchen (Ende). System disjunkter Mengen
10. RMQ- und LCA-Aufgaben
11.Datenstrukturen für die geometrische Suche
12. Das Problem der dynamischen Konnektivität in einem ungerichteten Graphen
Python-Sprache
01.Sprachgrundlagen (Teil 1)
02.Sprachgrundlagen (Teil 2)
03.Objektorientierte Programmierung
04.Fehlerbehandlung
05. Code-Design und -Tests
06.Arbeiten mit Saiten
07.Speichermodell
08Funktionale Programmierung
09.Bibliotheksrezension (Teil 1)
10. Bibliotheksüberprüfung (Teil 2)
11.Paralleles Rechnen in Python
12.Fortgeschrittene Arbeit mit Objekten
Maschinelles Lernen, Teil 1
01.Grundlegende Konzepte und Beispiele für angewandte Probleme
02. Metrische Klassifizierungsmethoden
03.Logische Klassifizierungsmethoden und Entscheidungsbäume
04.Gradientenlineare Klassifizierungsmethoden
05.Unterstützung der Vektormaschine
06.Multivariate lineare Regression
07. Nichtlineare und nichtparametrische Regression, nicht standardmäßige Verlustfunktionen
08. Zeitreihenvorhersage
09. Bayesianische Klassifizierungsmethoden
10.Logistische Regression
11.Suchen Sie nach Assoziationsregeln
Zweites Semester
Obligatorisch
Grundlagen der Statistik im maschinellen Lernen
01.Einführung
02.Hauptaufgaben und Methoden der Theorie der statistischen Inferenz
03. Verteilungsschätzung und statistische Funktionale
04.Monte-Carlo-Simulation, Bootstrap
05. Parametrische Schätzung
06. Hypothesentest
07. Reduzierung der Dimensionalität mehrdimensionaler Daten
08.Beurteilung der Empfindlichkeit des Modells
09.Lineare und logistische Regression
10. Methoden der Versuchsplanung
11. Verschiedene Arten der Regularisierung in der linearen Regression
12. Nichtlineare Methoden zur Konstruktion von Regressionsabhängigkeiten
13. Nichtparametrische Schätzung
14. Bayesianischer Ansatz zur Schätzung
15.Bayesianischer Ansatz zur Regression
16. Bayesianischer Ansatz zur Regression und Optimierung
17. Verwendung des zufälligen Gaußschen Feldmodells bei Datenanalyseproblemen
18.Verwendung statistischer Modelle und Methoden bei Ersatzmodellierungs- und Optimierungsproblemen
Maschinelles Lernen, Teil 2
01.Neuronale Netzwerkmethoden zur Klassifizierung und Regression
02.Kompositionelle Methoden der Klassifizierung und Regression
03.Kriterien zur Auswahl von Modellen und Methoden zur Auswahl von Merkmalen
04.Rangliste
05. Verstärkungslernen
06.Lernen ohne Lehrer
07.Probleme bei Teilschulung
08.Kollaboratives Filtern
09. Themenmodellierung
Drittes Semester
Zur Auswahl
Automatische Textverarbeitung
01Kursmaterial
oder
Computer Vision
Der Kurs widmet sich Methoden und Algorithmen des Computer Vision, d.h. Informationen aus Bildern und Videos extrahieren. Schauen wir uns die Grundlagen der Bildverarbeitung, Bildklassifizierung, Bildsuche nach Inhalt, Gesichtserkennung und Bildsegmentierung an. Dann sprechen wir über Videoverarbeitungs- und Analysealgorithmen. Der letzte Teil des Kurses ist der 3D-Rekonstruktion gewidmet. Für die meisten Probleme werden wir bestehende neuronale Netzwerkmodelle diskutieren. Im Kurs versuchen wir, nur auf die modernsten Methoden zu achten, die derzeit zur Lösung praktischer und wissenschaftlicher Probleme eingesetzt werden. Der Kurs ist weitgehend praktisch und nicht theoretisch. Daher sind alle Vorlesungen mit Labor- und Hausaufgaben ausgestattet, die es Ihnen ermöglichen, die meisten der besprochenen Methoden in der Praxis auszuprobieren. Die Arbeit wird in Python unter Verwendung verschiedener Bibliotheken durchgeführt.
01.Digitale Bild- und Tonkorrektur.
02.Grundlagen der Bildverarbeitung.
03.Bilder kombinieren.
04. Klassifizierung von Bildern und Suche nach ähnlichen Bildern.
05. Faltungs-Neuronale Netze zur Klassifizierung und Suche nach ähnlichen Bildern.
06.Objekterkennung.
07. Semantische Segmentierung.
08.Stilübertragung und Bildsynthese.
09.Videoerkennung.
10.Spärliche 3D-Rekonstruktion.
11.Dichte dreidimensionale Rekonstruktion.
12.Rekonstruktion aus einem Einzelbild und Punktwolken, parametrische Modelle.
Viertes Semester
Empfohlene Spezialkurse
Tiefes Lernen
01.Kursmaterial
Verstärkungslernen
01.Kursmaterial
Selbstfahrende Autos
Der Kurs behandelt die Kernkomponenten der selbstfahrenden Technologie: Lokalisierung, Wahrnehmung, Vorhersage, Verhaltensebene und Bewegungsplanung. Für jede Komponente werden die wichtigsten Ansätze beschrieben. Darüber hinaus werden die Studierenden mit aktuellen Marktbedingungen und technologischen Herausforderungen vertraut gemacht.
01.Überblick über die Hauptkomponenten und Sensoren eines unbemannten Fahrzeugs. Ebenen der Autonomie. Drive-by-Wire. Selbstfahrende Autos als Geschäftsprodukt. Möglichkeiten zur Bewertung des Fortschritts bei der Entwicklung von Drohnen. Lokalisierungsgrundlagen: GPS, Radodometrie, Bayesianische Filter.
02.Methoden der Lidar-Lokalisierung: ICP, NDT, LOAM. Einführung in visuelles SLAM am Beispiel von ORB-SLAM. Erklärung des GraphSLAM-Problems. Reduzierung des GraphSLAM-Problems auf eine nichtlineare Methode der kleinsten Quadrate. Auswahl der richtigen Parametrierung. Systeme mit einer speziellen Struktur in GraphSLAM. Architekturansatz: Frontend und Backend.
03. Erkennungsaufgabe in einem selbstfahrenden Auto. Statische und dynamische Hindernisse. Sensoren für das Erkennungssystem. Darstellung statischer Hindernisse. Erkennung statischer Hindernisse mittels Lidar (VSCAN, neuronale Netzwerkmethoden). Verwendung von Lidar in Verbindung mit Bildern zur Erkennung statischer Daten (semantische Bildsegmentierung, Tiefenvervollständigung). Stereokamera und die Tiefe eines Bildes gewinnen. Stixel-Welt.
04. Stellen Sie sich dynamische Hindernisse in einem selbstfahrenden Auto vor. Neuronale Netzwerkmethoden zur Erkennung von Objekten in 2D. Erkennung basierend auf der Vogelperspektive der Lidar-Wolkendarstellung. Verwendung von Lidar mit Bildern zur Erkennung dynamischer Hindernisse. Fahrzeugerkennung in 3D anhand von Bildern (3D-Boxenmontage, CAD-Modelle). Radarbasierte dynamische Hinderniserkennung. Objektverfolgung.
05.Fahrmuster des Autos: Hinterrad, Vorderrad. Wegplanung. Das Konzept des Konfigurationsraums. Diagrammmethoden zur Konstruktion von Trajektorien. Flugbahnen, die den Ruck minimieren. Optimierungsmethoden zur Konstruktion von Trajektorien.
06.Geschwindigkeitsplanung in einem dynamischen Umfeld. ST-Planung. Vorhersage des Verhaltens anderer Verkehrsteilnehmer.