Data Scientist von der Pike auf zum PRO – Kurs 233.640 RUB. von SkillFactory, Ausbildung 24 Monate, Datum 15. August 2023.
Verschiedenes / / November 29, 2023
Nach dem Grundkurs haben Sie die Möglichkeit, eine engere Spezialisierung in Data Science zu wählen – ML Engineer, CV Engineer oder NLP Engineer
M.L. Ingenieur — Entwickler für maschinelles Lernen
Entwickeln Sie ein Bonitätsvorhersagemodell
Lösen Sie das Problem der Klassifizierung von Spam-SMS-Nachrichten
Entwickeln Sie ein System zur Empfehlung geeigneter Produkte beim Kauf
Erstellen Sie ein Modell zur Umsatzsteigerung im Einzelhandel
Erstellen Sie Bilder basierend auf Textbeschreibungen mithilfe des neuronalen Netzwerks DALL-E
CV-Ingenieur — Spezialist für Computer Vision
Lernen Sie, alle grundlegenden Probleme im Bereich Computer Vision zu lösen
Sie erwerben Kenntnisse über den tatsächlichen Ablauf der Arbeit mit Lebenslaufmodellen, aktuelle Ansätze und fortgeschrittene Tools, die für die Erstellung von Lebenslaufdiensten erforderlich sind
Erstellen Sie im Abschlussprojekt einen virtuellen Trainer, der in der Lage ist, die Richtigkeit von Übungen per Video zu beurteilen
NLP-Ingenieur — Spezialist für die Verarbeitung natürlicher Sprache
Lernen Sie die Verarbeitung natürlicher Sprache kennen
Verschaffen Sie sich einen Überblick über NLP-Aufgaben – Klassifizierung, Zusammenfassung und Textgenerierung, Erstellung von Systemen für maschinelle Übersetzung und Frage-Antwort-Systeme
Im Abschlussprojekt entwickeln Sie eigenständig Werkzeuge zur automatisierten Kontextsuche zu vorgegebenen Themen.
BASE
In dieser Phase erlernen Sie die Grundlagen der Programmierung in Python, lernen die Vorverarbeitung und Analyse von Daten und machen sich zudem mit den Hauptaufgaben eines Data Scientists vertraut.
Einführung – 1 Woche
Sie werden in der Lage sein, echte Lernziele für sich selbst zu formulieren, herauszufinden, welchen Wert DS für Ihr Unternehmen hat, Machen Sie sich mit den Hauptaufgaben eines Datenwissenschaftlers vertraut und verstehen Sie, wie sich diese entwickeln DS-Projekt.
INTRO-1. So lernen Sie effektiv – Onboarding in der Ausbildung
INTRO-2. Berufsübersicht. Arten von Problemen in der Datenwissenschaft. Phasen und Ansätze zur Entwicklung eines Data Science-Projekts
Entwicklungsdesign - 5 Wochen
Sie lernen, mit Python mit grundlegenden Datentypen zu arbeiten und können Schleifenkonstrukte, bedingte Anweisungen und Funktionen in Ihrer täglichen Arbeit verwenden.
PYTHON-1. Python-Grundlagen
PYTHON-2. Eintauchen in Datentypen
PYTHON-3. Bedingte Anweisungen
PYTHON-4. Fahrräder
PYTHON-5. Funktionen und funktionale Programmierung
PYTHON-6. Üben
PYTHON-7. Python-Styleguide (Bonus)
Grundlegende Mathematik – 7 Wochen
MATH-1. Zahlen und Ausdrücke
MATH-2. Gleichungen und Ungleichungen
MATH-3. Grundbegriffe der Funktionentheorie
Mathe-4. Grundlagen der Geometrie: Planimetrie, Trigonometrie und Stereometrie
MATH-5. Mengen, Logik und Elemente der Statistik
Mathe-6. Kombinatorik und Grundlagen der Wahrscheinlichkeitstheorie
Mathe-7. Probleme lösen
Arbeiten mit Daten – 8 Wochen
In dieser Phase beherrschen Sie grundlegende Datenkompetenzen: wie Sie Daten vorbereiten, bereinigen und transformieren, damit sie für die Analyse geeignet sind. Apropos Analyse: Sie analysieren Daten mit den beliebten Bibliotheken Matplotlib, Seaborn, Plotly.
PYTHON-8. Data-Science-Tools
PYTHON-9. NumPy-Bibliothek
PYTHON-10. Einführung in Pandas
PYTHON-11. Grundlegende Techniken für die Arbeit mit Daten in Pandas
PYTHON-12. Fortgeschrittene Datentechniken in Pandas
PYTHON-13. Datenreinigung
PYTHON-14. Datenvisualisierung
PYTHON-15. Prinzipien von OOP in Python und Debugging-Code (optionales Modul)
Projekt 1. Datensatzanalyse zu geschlossenen Problemen
Datenladen – 6 Wochen
Sie können Daten aus verschiedenen Formaten und Quellen herunterladen. Und SQL, eine strukturierte Abfragesprache, hilft Ihnen dabei. Sie lernen den Umgang mit Aggregatfunktionen, Tabellen-Joins und komplexen Joins.
PYTHON-16. So laden Sie Daten aus Dateien verschiedener Formate herunter
PYTHON-17. Abrufen von Daten aus Webquellen und APIs
SQL-0. Hallo SQL!
SQL-1. SQL-Grundlagen
SQL-2. Aggregatfunktionen
SQL-3. Tische zusammenfügen
SQL-4. Komplexe Verknüpfungen
Projekt 2. Neue Daten werden geladen. Verfeinerung der Analyse
Statistische Datenanalyse – 7 Wochen
Ihr Schwerpunkt liegt auf der Intelligence Data Analysis (EDA). Sie werden mit allen Phasen einer solchen Analyse vertraut gemacht und lernen, wie Sie diese mithilfe der Bibliotheken Statsmodels, Scikit Learn, Seaborn, Matplotlib, SciPy, Pandas durchführen. Darüber hinaus können Sie an Kaggle arbeiten, einem beliebten Dienst zur Teilnahme an Wettbewerben.
EDA-1. Einführung in die nachrichtendienstliche Datenanalyse. EDA-Algorithmen und -Methoden
EDA-2. Mathematische Statistik im Kontext von EDA. Arten von Funktionen
EDA-3. Feature-Engineering
EDA-4. Statistische Datenanalyse in Python
EDA-5. Statistische Datenanalyse in Python. Teil 2
EDA-6. Versuchsplanung
EDA-7. Kaggle-Plattform
Projekt 2
Einführung in maschinelles Lernen – 9 Wochen
Sie lernen ML-Bibliotheken zur Modellierung von Datenabhängigkeiten kennen. Sie sind in der Lage, die wichtigsten Arten von ML-Modellen zu trainieren, Validierungen durchzuführen, die Ergebnisse der Arbeit zu interpretieren und wichtige Merkmale auszuwählen (Feature-Wichtigkeit).
ML-1. Theorie des maschinellen Lernens
ML-2. Überwachtes Lernen: Regression
ML-3. Überwachtes Lernen: Klassifizierung
ML-4. Unüberwachtes Lernen: Clustering- und Dimensionsreduktionstechniken
ML-5. Datenvalidierung und Modellbewertung
ML-6. Auswahl und Auswahl von Merkmalen
ML-7. Optimierung von Modellhyperparametern
ML-8. ML-Kochbuch
Projekt 3. Klassifizierungsproblem
HAUPTEINHEIT
Lineare Algebra, mathematische Analyse, diskrete Mathematik – es klingt beängstigend, aber keine Angst: Wir analysieren all diese Themen und zeigen Ihnen, wie Sie damit arbeiten! In der zweiten Phase tauchen Sie in die Mathematik und die Grundlagen des maschinellen Lernens ein, erfahren mehr über DS-Berufe und wählen durch Berufsberatung einen Studiengang im zweiten Jahr aus.
Mathematik und maschinelles Lernen. Teil 1 – 6 Wochen
Sie können praktische Probleme mithilfe manueller Berechnungen und Python lösen (Vektor- und Matrizenberechnungen, Arbeiten mit Mengen, Studieren von Funktionen mithilfe der Differentialanalyse).
MATH&ML-1. Lineare Algebra im Kontext linearer Methoden. Teil 1
MATH&ML-2. Lineare Algebra im Kontext linearer Methoden. Teil 2
MATH&ML-3. Mathematische Analyse im Kontext eines Optimierungsproblems Teil 1
MATH&ML-4. Mathematische Analyse im Kontext eines Optimierungsproblems. Teil 2
MATH&ML-5. Mathematische Analyse im Kontext eines Optimierungsproblems. Teil 3
Projekt 4. Regressionsproblem
Mathematik und maschinelles Lernen. Teil 2 – 6 Wochen
Sie werden mit den Grundkonzepten der Wahrscheinlichkeitstheorie und der mathematischen Statistik sowie Algorithmen vertraut gemacht Clustering und lernen auch, die Qualität des durchgeführten Clusterings zu bewerten und die Ergebnisse darzustellen grafische Form.
MATH&ML-6. Wahrscheinlichkeitstheorie im Kontext eines Naive Bayes-Klassifikators
MATH&ML-7. Algorithmen basierend auf Entscheidungsbäumen
MATH&ML-8. Boosten und Stapeln
MATH&ML-9. Clustering- und Dimensionsreduktionstechniken. Teil 1
MATH&ML-10. Clustering- und Dimensionsreduktionstechniken. Teil 2
Projekt 5. Ensemble-Methoden
Diskrete Mathematik – 4 Wochen
MATH&MGU-1 Mengen und Kombinatorik
MATH&MGU-2 Logik
MATH&MGU-3-Grafiken. Teil 1
MATH&MGU-4-Grafiken. Teil 2
ML im Geschäft - 8 Wochen
Sie lernen, ML-Bibliotheken zur Lösung von Zeitreihenproblemen und Empfehlungssystemen zu verwenden. Sie können ein ML-Modell trainieren und validieren, einen funktionierenden Prototyp erstellen und das Modell in der Weboberfläche ausführen. Und erwerben Sie außerdem A/B-Testkenntnisse, damit Sie das Modell bewerten können.
MATH&ML-11. Zeitfolgen. Teil 1
MATH&ML-12. Zeitfolgen. Teil 2
MATH&ML-13. Empfehlungssysteme. Teil 1
MATH&ML-14. Empfehlungssysteme. Teil 2
PROD-1. Vorbereiten des Modells für die Produktion
PROD-2. PrototypStreamlit+Heroku
PROD-3. Geschäftsverständnis. Fall
Projekt 6. Thema zur Auswahl: Zeitreihen oder Empfehlungssysteme
PRO-NIVEAU
Im dritten Schritt lernen Sie eine der Methoden des maschinellen Lernens kennen – Deep Learning (DL). Und auch ein vollwertiger Block der gewählten Spezialisierung erwartet Sie: Sie beherrschen maschinelle Lernfähigkeiten (ML), machen Sie sich mit der Routine von CV (Computer Vision) vertraut oder verbessern Sie NLP*, natürliche Verarbeitung Sprache.
Zweites Studienjahr - 3 Spezialisierungen zur Auswahl
Berufsberatung
ML, CV oder NLP: In dieser Phase müssen Sie sich endlich entscheiden, welchen Weg Sie als Nächstes einschlagen möchten. Wir informieren Sie über jede Spezialisierung und bieten Ihnen die Lösung mehrerer praktischer Probleme an, um Ihnen die Entscheidung zu erleichtern.
Track ML - Ingenieur
Im ML-Track lernen Sie, tiefgreifende Probleme des maschinellen Lernens zu lösen, die Kompetenzen eines Dateningenieurs zu beherrschen und Ihre Fähigkeiten im Umgang mit Python-Bibliotheken zu verbessern. Sie erfahren außerdem, wie Sie ein MVP (Minimum Viable Version eines Produkts) erstellen, lernen alle Feinheiten der Ausgabe eines ML-Modells für die Produktion kennen und erfahren, wie ML-Ingenieure im wirklichen Leben arbeiten.
Einführung in Deep Learning
Grundlagen der Datentechnik
Zusätzliche Python- und ML-Kapitel
Ökonomische Wirkungsbewertung und MVP-Entwicklung
ML zur Produktion
Eingehende Untersuchung der ML-Entwicklung und Abschlussprojekt zu einem ausgewählten Thema
Lebenslauf verfolgen - Ingenieur
Im CV-Track lernen Sie, Computer-Vision-Probleme wie Bildklassifizierung, Segmentierung und Erkennung, Bilderzeugung und -stilisierung, Wiederherstellung und Qualitätsverbesserung Fotos. Darüber hinaus erfahren Sie, wie Sie neuronale Netze in die Produktion einführen.
Einführung in Deep Learning
Grundlagen der Datentechnik
Zusätzliche Python- und ML-Kapitel
Ökonomische Wirkungsbewertung und MVP-Entwicklung
ML zur Produktion
Eingehende Untersuchung der ML-Entwicklung und Abschlussprojekt zu einem ausgewählten Thema
Track NLP - Ingenieur
Während des NLP-Trainings lernen Sie, wie Sie die Hauptprobleme der Verarbeitung natürlicher Sprache lösen einschließlich Klassifizierung, Zusammenfassung und Textgenerierung, maschineller Übersetzung und Erstellung von Dialogen Systeme
Einführung in Deep Learning
Neuronale Netzmathematik für NLP
Hard- und Software zur Lösung von NLP-Problemen
NLP-Aufgaben und Algorithmen
Neuronale Netze in der Produktion
Eingehende Untersuchung der NLP-Entwicklung und Abschlussprojekt zu einem ausgewählten Thema
Wenn Sie sich für die CV- oder ML-Spezialisierung entscheiden, können Sie den NLP-Kurs ohne Mentorunterstützung kostenlos absolvieren.
Deep Learning und neuronale Netze
Wo werden neuronale Netze eingesetzt? Wie trainiere ich ein neuronales Netzwerk? Was ist Deep Learning? Die Antworten auf diese Fragen erfahren Sie im Bonusteil von DL.
Einführung in das Data Engineering
Sie lernen den Unterschied zwischen den Rollen eines Data Scientists und eines Data Engineers kennen, welche Tools dieser bei seiner Arbeit nutzt und welche Aufgaben er täglich löst. Die Wörter „Schneeflocke“, „Stern“ und „See“ werden neue Bedeutungen bekommen :)