MLOps - Rate 80.000 Rubel. von Otus, Ausbildung 5 Monate, Datum 30. November 2023.
Verschiedenes / / November 30, 2023
Sie beherrschen alle notwendigen maschinellen Lernfähigkeiten für das Streaming von Daten und verteilte Umgebungen. Das Programm beinhaltet die notwendigen Kenntnisse aus den Bereichen Data Science und Data Engineering, die es Ihnen ermöglichen, Big Data zu verarbeiten und verteilte Algorithmen in Spark zu schreiben.
Sie üben jedes Modul, indem Sie Hausaufgaben erledigen. Am Ende der Schulung erhalten Sie ein Abschlussprojekt, in dem Sie alle erworbenen Kenntnisse zusammenfassen und zu Ihrem Portfolio hinzufügen können. Es kann im Rahmen von Arbeitsaufgaben an Ihrem Datensatz durchgeführt werden oder ein Lernprojekt sein, das auf von OTUS bereitgestellten Daten basiert.
Für wen ist dieser Kurs geeignet?
Für Spezialisten für maschinelles Lernen oder Softwareentwickler, die lernen möchten, wie man mit Big Data arbeitet. Typischerweise gibt es solche Aufgaben in großen IT-Unternehmen mit einem groß angelegten digitalen Produkt.
Für Datenwissenschaftler, die ihre Fähigkeiten durch technische Fähigkeiten stärken möchten. Dank des Kurses sind Sie in der Lage, Daten zu verarbeiten und die Ergebnisse von ML-Lösungen selbstständig in der Produktion darzustellen.
Um zu lernen, benötigen Sie grundlegende datenwissenschaftliche Kenntnisse. Wir empfehlen Ihnen, einen Blick auf die Karte der Data Science-Kurse bei OTUS zu werfen, um das erforderliche Ausbildungsniveau herauszufinden.
Du wirst es lernen:
- Verwenden Sie Standard-ML-Pipeline-Tools in einer verteilten Umgebung.
- Entwickeln Sie Ihre eigenen Blöcke für ML-Pipelines;
- Anpassung von ML-Algorithmen an verteilte Umgebungen und Big-Data-Tools;
- Verwenden Sie Spark, SparkML, Spark Streaming;
- Entwicklung von Algorithmen zur Streaming-Datenvorbereitung für maschinelles Lernen;
- Gewährleisten Sie die Qualitätskontrolle in allen Phasen der Einführung von ML-Lösungen in den industriellen Betrieb.
Nachfrage nach Fachkräften
Die Fähigkeiten, die Sie erlernen, sind möglichst anwendungsorientiert und erfolgsversprechend. Auf dem Markt erscheinen immer mehr digitale Produkte, deren Entwicklung den Umgang mit Big Data und Stream-Processing erfordert. Bereits jetzt können sich Spezialisten mit einem solchen Pool an Fähigkeiten und etwas Berufserfahrung für ein Gehalt von 270.000 qualifizieren. Rubel Ein weiterer Trend – die Automatisierung von Trainings- und Validierungsprozessen – entwertet im Gegenteil in gewisser Weise die Arbeit eines klassischen Data Scientist. Alles bewegt sich auf einen Punkt zu, an dem selbst ein Nicht-Spezialist eine Vorhersage der Passform treffen kann. Daher sind diejenigen, die zumindest über oberflächliche Ingenieurskenntnisse verfügen, bereits im Fokus.
Kursfunktionen
Viel Übung im Umgang mit Daten
Breites Spektrum an Fähigkeiten von verteilter ML- und Stream-Datenverarbeitung bis hin zur Produktionsausgabe
Aktuelle Tools und Technologien: Scala, Spark, Python, Docker
Live-Kommunikation mit Experten über Webinare und Slack-Chat
4
KursBeteiligt an der Entwicklung eines Data-Science-Teams, das auf maschinellem Lernen basierende Funktionalität für die Produkte und Dienstleistungen des Unternehmens bereitstellt. Als Data Scientist war er an der Entwicklung von Kaspersky MLAD und MDR AI Analyst beteiligt. IN...
Beteiligt an der Entwicklung eines Data-Science-Teams, das auf maschinellem Lernen basierende Funktionalität für die Produkte und Dienstleistungen des Unternehmens bereitstellt. Als Data Scientist war er an der Entwicklung von Kaspersky MLAD und MDR AI Analyst beteiligt. Als C++-Entwickler war er an der Entwicklung von MaxPatrol SIEM beteiligt und unterrichtet seit vielen Jahren Computer. Naturwissenschaftliche Disziplinen an der MSTU GA. Autor einer Reihe von Berichten über ML-, C++- und DS-Projektmanagement und -Entwicklung Mannschaften. Mitglied der PC-Konferenz C++ Russland. Progamm Manager
8
KurseÜber 20 Jahre Erfahrung in kundenspezifischen Entwicklungsprojekten in der IT. Dutzende erfolgreiche Projekte, darunter auch solche im Rahmen von Regierungsaufträgen. Erfahrung in der Entwicklung und Implementierung von ERP-Systemen, Open-Source-Lösungen, Support für Hochlastanwendungen. Dozent für Kurse zum Thema...
Über 20 Jahre Erfahrung in kundenspezifischen Entwicklungsprojekten in der IT. Dutzende erfolgreiche Projekte, darunter auch solche im Rahmen von Regierungsaufträgen. Erfahrung in der Entwicklung und Implementierung von ERP-Systemen, Open-Source-Lösungen, Support für Hochlastanwendungen. Dozent für Kurse zu Linux, Kuber, MLOps, DataOps, SolutionArchitect, IaC, SRE sowie Mentor des HighLoad-Kurses
1
AlsoSpezialist für die Arbeit mit Big Data und maschinellem Lernen. 8 Jahre lang arbeitete er bei Odnoklassniki.ru. Leitung des OK Data Lab-Teams (ein Labor für Forscher im Bereich Big Data und Maschinen...
Spezialist für die Arbeit mit Big Data und maschinellem Lernen. 8 Jahre lang arbeitete er bei Odnoklassniki.ru. Leitung des OK Data Lab-Teams (ein Labor für Forscher im Bereich Big Data und maschinelles Lernen). Die Big-Data-Analyse in Odnoklassniki ist zu einer einzigartigen Chance geworden, theoretische Ausbildung und wissenschaftliche Grundlagen mit der Entwicklung realer, gefragter Produkte zu verbinden. Seit 2019 arbeitet er als Geschäftsführer bei der Sberbank. Fungiert als Leiter des Clusters zur Entwicklung einer Plattform für Empfehlungssysteme im Bereich Massenpersonalisierung. Er schloss 2004 sein Studium an der Staatlichen Universität St. Petersburg ab, wo er 2007 seinen Doktortitel in formalen logischen Methoden verteidigte. Ich habe fast 9 Jahre im Outsourcing gearbeitet, ohne den Kontakt zur Universität und zum wissenschaftlichen Umfeld zu verlieren.
Grundlegende Einführung zum Kursstart
-Thema 1.Gradientenabstieg und lineare Modelle
-Thema 2.Überblick über grundlegende Methoden und Metriken des maschinellen Lernens
-Thema 3.Entwicklung von Ansätzen zur Arbeit mit Daten
-Thema 4.Grundlagen der Programmierung in Scala
Technologische Grundlagen der verteilten Datenverarbeitung
-Thema 5. Verteilte Dateisysteme
-Thema 6. Ressourcenmanager in verteilten Systemen
-Thema 7. Entwicklung massiv paralleler und verteilter Computer-Frameworks
-Thema 8. Apache Spark 1-Grundlagen
-Thema 9. Apache Spark 2-Grundlagen
Verteilte ML-Grundlagen
-Thema 10. Übertragung von ML-Algorithmen in eine verteilte Umgebung
-Thema 11.ML in Apache Spark
-Thema 12. Eigene Blöcke für SparkML entwickeln
-Thema 13.Optimierung von Hyperparametern und AutoML
Stream-Verarbeitung
-Thema 14. Stream-Datenverarbeitung
-Thema 15. Bibliotheken von Drittanbietern zur Verwendung mit Spark
-Thema 16.Spark-Streaming
-Thema 17. Strukturiertes und kontinuierliches Streaming in Spark
-Thema 18. Alternative Streaming-Frameworks
Zielsetzung und Ergebnisanalyse
-Thema 19. Bestimmung des Ziels des ML-Projekts und vorläufige Analyse
-Thema 20. Langfristige ML-Ziele am Beispiel der Aufgabe der Abwanderungsreduzierung
-Thema 21.A/B-Tests
-Thema 22. Zusätzliche Themen
Ausgabe von ML-Ergebnissen an die Produktion
-Thema 23. Ansätze zur Einführung von ML-Lösungen in die Produktion
-Thema 24.Versionierung, Reproduzierbarkeit und Überwachung
-Thema 25.Online-Bereitstellung von Modellen
-Thema 26. Muster für asynchrones Streaming ML und ETL
-Thema 27. Wenn Sie Python benötigen
ML in Python in der Produktion
-Thema 28.Produktionscode in Python. Organisations- und Verpackungskodex
-Thema 29.REST-Architektur: Flask-API
-Thema 30.Docker: Struktur, Anwendung, Bereitstellung
-Thema 31. Kubernetes, Container-Orchestrierung
-Theme 32.MLOPS-Tools für Kubernetes: KubeFlow, Seldon Core. Merkmale des Betriebs heterogener Systeme in der Industrie.
-Thema 33.Amazon Sagemaker
-Thema 34.AWS ML-Dienst
Fortgeschrittene Themen
-Thema 35. Neuronale Netze
-Thema 36. Verteiltes Lernen und Inferenz neuronaler Netze
-Thema 37. Steigungsverstärkung bei Bäumen
-Thema 38. Verstärkungslernen
Projektarbeit
-Thema 39. Themenauswahl und Organisation der Projektarbeit
-Thema 40. Beratung zu Projekten und Hausaufgaben
-Thema 41. Schutz von Designarbeiten