Maschinelles Lernen in der Praxis – Kurs 41.500 Rubel. vom IBS Training Center, Schulung 24 Stunden, Datum 26. November 2023.
Verschiedenes / / December 02, 2023
Der Kurs basiert auf mehreren praktischen Fällen, die Tabellen mit Ausgangsdaten enthalten.
Für jeden Fall durchlaufen wir den gesamten Lebenszyklus eines maschinellen Lernprojekts:
Recherche, Bereinigung und Aufbereitung von Daten,
Auswahl einer für die Aufgabe geeigneten Trainingsmethode (lineare Regression für Regression, Random Forest für die Klassifizierung, K-Means und DBSCAN für Clustering),
Training mit der gewählten Methode,
Ergebnisauswertung,
Modelloptimierung,
Präsentation des Ergebnisses beim Kunden.
Im Diskussionsteil des Kurses diskutieren wir praktische Probleme der Studierenden, die mit den besprochenen Methoden gelöst werden können.
Behandelten Themen:
1. Überprüfung der Aufgabe (Theorie – 1 Stunde)
Welche Probleme werden durch maschinelles Lernen gut gelöst und welche Probleme versuchen sie zu lösen?
Was passiert, wenn Sie anstelle eines Datenwissenschaftlers einen Nicht-Spezialisten auf diesem Gebiet (nur einen Entwickler/Analysten/Manager) einstellen, in der Erwartung, dass dieser dabei lernt?
2. Vorbereitung, Reinigung, Datenrecherche (Theorie – 1 Stunde, Praxis – 1 Stunde)
So verstehen Sie die Quellgeschäftsdaten (und erkennen im Allgemeinen jede Reihenfolge darin).
Reihenfolge der Bearbeitung.
Was kann und sollte an Domänenanalysten delegiert werden und was sollte am besten vom Data Scientist selbst erledigt werden?
Prioritäten zur Lösung eines bestimmten Problems.
3. Klassifikatoren und Regressoren (Theorie – 2 Stunden, Praxis – 2 Stunden)
Praktischer Teil – gut formalisierte Aufgaben mit aufbereiteten Daten.
Unterschied zwischen Aufgaben (binäre/nicht-binäre/probabilistische Klassifizierung, Regression), Umverteilung von Aufgaben zwischen Klassen.
Beispiele zur Klassifizierung praktischer Probleme.
4. Clustering (Theorie – 1 Stunde, Praxis – 2 Stunden)
Wo und wie wird Clustering durchgeführt: Datenrecherche, Überprüfung der Problemstellung, Überprüfung der Ergebnisse.
Welche Fälle können auf Clustering reduziert werden?
5. Modellbewertung (Theorie – 1 Stunde, Praxis – 1 Stunde)
Geschäftskennzahlen und technische Kennzahlen.
Metriken für Klassifizierungs- und Regressionsprobleme, Fehlermatrix.
Interne und externe Metriken der Clustering-Qualität.
Kreuzvalidierung.
Beurteilung einer Umschulung.
6. Optimierung (Theorie – 5 Stunden, Praxis – 3 Stunden)
Was ein Modell besser macht als ein anderes: Parameter, Funktionen, Ensembles.
Einstellungsverwaltung.
Übung zur Funktionsauswahl.
Überprüfung der Tools zum Finden der besten Parameter, Funktionen und Methoden.
7. Diagramme, Berichte, Arbeiten mit Live-Aufgaben (Theorie – 2 Stunden, Praxis – 2 Stunden)
Wie Sie klar erklären, was passiert: sich selbst, dem Team, dem Kunden.
Schönere Antworten auf bedeutungslose Fragen.
So präsentieren Sie drei Terabyte an Ergebnissen auf einer Folie.
Halbautomatische Tests, welche Prozesskontrollpunkte wirklich benötigt werden.
Von Live-Aufgaben bis hin zu einem vollständigen F&E-Prozess („F&E in der Praxis“) – Analyse und Analyse der Aufgaben aus dem Publikum.