Mathematik und maschinelles Lernen für Data Science – Kurs 50.040 RUB. von SkillFactory, Ausbildung 5,5 Monate, Datum: 13. August 2023.
Verschiedenes / / November 29, 2023
Sie können von überall auf der Welt lernen. Neue Module werden einmal pro Woche eröffnet. Speziell gestaltete Inhalte und Zusatzmaterialien helfen Ihnen, das Thema zu verstehen.
Die Übung besteht aus drei Teilen: Durchführen einfacher Rechenübungen; Durchführen von Python-basierten Übungen; Lösung von Lebensproblemen im Bereich Datenanalyse, Prognose und Optimierung.
Sie kommunizieren ständig mit Ihren Kommilitonen in privaten Slack-Kanälen. Wenn Sie etwas nicht verstehen oder eine Aufgabe nicht bewältigen können, helfen wir Ihnen, es herauszufinden.
Am Ende des Kurses erhalten Sie eine spezielle Aufgabe, in der Sie alle erworbenen Fähigkeiten anwenden und Ihr erfolgreiches Erlernen des Stoffes bestätigen können.
Mathematik-Kursprogramm
Teil 1 – Lineare Algebra
- Wir untersuchen Vektoren und Matrizentypen
- Lernen, Operationen an Matrizen durchzuführen
- Bestimmung der linearen Abhängigkeit mithilfe von Matrizen
- Wir untersuchen inverse, singuläre und nicht singuläre Matrizen
- Wir untersuchen Systeme linearer Gleichungen, Eigenzahlen und komplexer Zahlen
- Beherrschung der Matrix- und Singularzerlegung
- Lösung linearer Abhängigkeitsprobleme mithilfe von Matrizen
- Optimierung mit der Hauptkomponentenmethode
- Stärkung der mathematischen Grundlagen der linearen Regression
Teil 2 – Grundlagen der mathematischen Analyse
- Wir untersuchen Funktionen einer und mehrerer Variablen und Ableitungen
- Beherrschung des Konzepts des Gefälles und Gefälles
- Schulung zu Optimierungsproblemen
- Wir untersuchen die Lagrange-Multiplikator-Methode, die Newton-Methode und das simulierte Tempern
- Wir lösen Probleme der Vorhersage und Suche nach einer erfolgreichen Strategie mithilfe abgeleiteter und numerischer Optimierungsmethoden
- Verstärkung der Mathematik hinter dem Gradientenabstieg und dem simulierten Tempern
Teil 3 – Grundlagen der Wahrscheinlichkeitsrechnung und Statistik
- Wir studieren die allgemeinen Konzepte der deskriptiven und mathematischen Statistik
- Kombinatorik beherrschen
- Wir untersuchen die wichtigsten Arten von Verteilungen und Korrelationen
- Den Satz von Bayes verstehen
- Erlernen eines Naive-Bayes-Klassifikators
- Wir lösen Probleme der Kombinatorik, Validität und Prognose mithilfe von Statistik und Wahrscheinlichkeitstheorie
- Wir festigen die mathematischen Grundlagen der Klassifikation und der logistischen Regression
Teil 4 – Zeitreihen und andere mathematische Methoden
- Einführung in die Zeitreihenanalyse
- Beherrschung komplexerer Arten von Regressionen
- Prognose des Budgets anhand von Zeitreihen
- Stärkung der mathematischen Grundlagen klassischer Modelle des maschinellen Lernens
Kurzes Kursprogramm zum maschinellen Lernen
Tutorunterstützung während der Ausbildung
Modul 1 – Einführung in maschinelles Lernen
Wir machen uns mit den Hauptaufgaben und Methoden des maschinellen Lernens vertraut, studieren praktische Fälle und wenden den grundlegenden Algorithmus für die Arbeit an einem ML-Projekt an
Wir lösen über 50 Probleme, um das Thema zu vertiefen
Modul 2 – Datenvorverarbeitungsmethoden
Wir studieren Datentypen, lernen, Daten zu bereinigen und anzureichern, nutzen Visualisierung für die Vorverarbeitung und beherrschen das Feature-Engineering
Wir lösen über 60 Probleme, um das Thema zu vertiefen
Modul 3 – Regression
Wir beherrschen lineare und logistische Regression, untersuchen die Grenzen der Anwendbarkeit, analytische Schlussfolgerung und Regularisierung. Regressionsmodelle trainieren
Wir lösen über 40 Probleme, um das Thema zu vertiefen
Modul 4 – Clustering
Wir beherrschen das Lernen ohne Lehrer, üben seine verschiedenen Methoden und arbeiten mit Texten mithilfe von ML
Wir lösen über 50 Probleme, um das Thema zu vertiefen
Modul 5 – Baumbasierte Algorithmen: Einführung in Bäume
Machen wir uns mit Entscheidungsbäumen und ihren Eigenschaften vertraut, beherrschen Bäume aus der Sklearn-Bibliothek und verwenden Bäume, um ein Regressionsproblem zu lösen
Wir lösen über 40 Probleme, um das Thema zu vertiefen
Modul 6 – Baumbasierte Algorithmen: Ensembles
Wir untersuchen die Merkmale von Baumensembles, üben Boosting und verwenden das Ensemble zum Aufbau einer logistischen Regression
Wir lösen über 40 Probleme, um das Thema zu vertiefen
Wir nehmen an einem Wettbewerb auf Kaggle teil, bei dem es darum geht, ein baumbasiertes Modell zu trainieren
Modul 7 – Bewertung der Qualität von Algorithmen
Wir studieren die Prinzipien der Stichprobenaufteilung, Unter- und Überanpassung, bewerten Modelle anhand verschiedener Qualitätsmetriken und lernen, den Lernprozess zu visualisieren
Bewertung der Qualität mehrerer ML-Modelle
Wir lösen über 40 Probleme, um das Thema zu vertiefen
Modul 8 – Zeitreihen im maschinellen Lernen
Machen wir uns mit der Zeitreihenanalyse in ML vertraut, beherrschen lineare Modelle und XGBoost und studieren die Prinzipien der Kreuzvalidierung und Parameterauswahl
Wir lösen über 50 Probleme, um das Thema zu vertiefen
Modul 9 – Empfehlungssysteme
Wir untersuchen Methoden zum Aufbau von Empfehlungssystemen, beherrschen den SVD-Algorithmus und bewerten die Qualität der Empfehlungen des trainierten Modells
Wir lösen über 50 Probleme, um das Thema zu vertiefen
Modul 10 – Abschluss-Hackathon
Wir wenden alle untersuchten Methoden an, um eine maximale Genauigkeit der Modellvorhersagen auf Kaggle zu erreichen