Data Engineer von Null bis Junior – kostenloser Kurs von Skillbox, Schulung, Datum: 29. November 2023.
Verschiedenes / / November 30, 2023
Für Anfänger
Lernen Sie Python und SQL von Grund auf. Lernen Sie, Daten zu sammeln, zu analysieren und zu verarbeiten. Lösen Sie Probleme anhand realer Fälle und fügen Sie sie Ihrem Portfolio hinzu. Sie können bereits während Ihres Studiums eine Karriere im Bereich Data Engineering starten.
Für Programmierer
Verbessern Sie Ihre SQL-Kenntnisse für die Arbeit mit Datenbanken. Sie durchlaufen den gesamten Weg eines Dateningenieurs von der Erfassung der Rohdaten bis zur Bereitstellung des Modells. Erfahrung in der Programmierung hilft Ihnen, sich schnell in einen neuen Beruf einzuarbeiten und Ihr Fachgebiet zu wechseln.
Für angehende Analysten
Lernen Sie alle Phasen der Arbeit mit Daten kennen. Lernen Sie, Informationen aus verschiedenen Quellen zu sammeln, eine Architektur für deren Speicherung aufzubauen und Berichte zu visualisieren. Sie sind in der Lage, Daten selbstständig für die anschließende Analyse aufzubereiten.
Autor des Kurses „Maschinelles Lernen“. Senior Data Scientist, Teamleiter bei SberData, Sber. 5+ Jahre im Beruf
Kurssprecher, F&E-Direktor, UBIC Tech. Mehr als 15 Jahre Erfahrung in der Entwicklung
Datenwissenschaftler bei der Sberbank, Mathematiker am Rechenzentrum der Russischen Akademie der Wissenschaften. Block „Grundlagen der Mathematik für Data Science“. Mehr als 4 Jahre Erfahrung im Unterrichten höherer Mathematik
Erste Stufe: Grundausbildung
Machen Sie sich mit den Hauptbereichen von Data Science vertraut, trainieren und implementieren Sie Ihr erstes ML-Modell. Erwerben Sie Grundkenntnisse in Mathematik, Statistik und Wahrscheinlichkeitstheorie. All dies wird Ihnen helfen, die Grundprinzipien der Arbeit mit Daten zu verstehen. Die durchschnittliche Fertigstellungszeit beträgt 6 Monate.
Einführung in die Datenwissenschaft
Sie durchlaufen alle Phasen der Arbeit mit Daten. Lernen Sie, Probleme zu identifizieren und Geschäftsanforderungen zu erfassen. Sie laden Daten aus verschiedenen Quellen herunter, führen explorative Analysen durch und bereiten den Datensatz für die weitere Verwendung vor. Trainieren und implementieren Sie ein vorgefertigtes ML-Modell und versuchen Sie sich als Produkt- und Marketinganalyst. Erfahren Sie, wie Sie Hypothesen formulieren und testen. Beherrschen Sie die grundlegenden Arbeitswerkzeuge: Python, SQL, Excel, Power Bi, Airflow.
Grundlegende Mathematik für Data Science
Erwerben Sie Grundkenntnisse der Mathematik, um mit maschinellem Lernen zu arbeiten. Sie werden verstehen, was Approximation, Interpolation, Funktionen, Regressionen, Matrizen und Vektoren sind. Lernen Sie, mit mathematischen Entitäten in der SymPy Python-Bibliothek zu arbeiten.
Grundlagen der Statistik und Wahrscheinlichkeitstheorie
Sie verstehen die Prinzipien der Arbeit mit Zufallsvariablen und Ereignissen. Machen Sie sich mit einigen Arten von Verteilungen und statistischen Tests vertraut, die beim Erstellen von Modellen und beim Testen von Hypothesen hilfreich sind.
Praktikumsmöglichkeit
Um ein Praktikum zu absolvieren, genügen Grundkenntnisse und Fertigkeiten – Sie können Ihr Studium im Studium und gleichzeitig im Unternehmen fortsetzen.
Zweite Ebene: Data Engineer Junior
Lernen Sie, komplexe Datensätze zu sammeln, Showcases vorzubereiten und Pipelines für die Arbeit zu erstellen, DS-Projekte von Grund auf bereitzustellen und Code zu testen. Sie sind bereit, als Junior Data Engineer zu arbeiten. Die durchschnittliche Fertigstellungszeit beträgt 6 Monate.
Einführungsblock
Finden Sie heraus, was ein Data Engineer macht, welche Rolle er in einem Data Science-Projekt spielt und welche Karrierewege er einschlägt. Sie werden verstehen, wie der Kurs aufgebaut ist und welche Themen Sie studieren werden.
SQL
Erfahren Sie, wie Sie Daten in vorhandenen Tabellen bearbeiten und Einfüge-, Lösch- und Aktualisierungsvorgänge durchführen. Sie können Daten aus der Datenbank in verschiedenen Formaten speichern. Erfahren Sie mehr über Fensterfunktionen und die Grundlagen der Vorbereitung von Data Marts mit SQL. Erfahren Sie, wie Sie die korrekte Eingabe von Informationen im Transaktionsmodus sicherstellen. Sie können das Transaktionsprotokoll lesen und verstehen. Erfahren Sie, was Indizes sind, welche Indexarchitektur sie haben und wo sie verwendet werden. Lernen Sie Techniken zur Beschleunigung von Abfragen.
Python. LVL 2
Berücksichtigen Sie Datentypen, wie sie konvertiert werden können und wie Python und SQL zusammenarbeiten – Daten aus einer Datenbank abrufen, mit den Daten arbeiten und Abfragen ausführen. Lernen Sie die Grundkonzepte von JSON- und XML-Datenschemata kennen. Sie können das Anwendungs-Debugging konfigurieren, Tests schreiben sowie Daten anonymisieren und verschlüsseln.
Bibliotheken für Python
Sie erfahren, was Bibliotheken für die Arbeit mit Diagrammen sind, überwachtes Lernen, Visualisierung von Metriken und Quellen von Datensätzen. Erfahren Sie, wie Sie mit Python und Bibliotheken mit Daten arbeiten. Sie können weiterhin Pandas lernen.
Luftstrom
Sehen Sie sich die wichtigsten Konzepte und Praktiken für die Arbeit mit Airflow an. Lernen Sie die Grundlagen der Architektur und Interoperabilität von der Benutzeroberfläche bis zur CLI kennen. Erstellen Sie Ihre erste Datenpipeline.
Spark-Grundlagen
Master Spark: Erfahren Sie, auf welchen Rechenressourcen es läuft, wie es Daten speichert und mit Speicher und Festplatte arbeitet. Richten Sie Ihren ersten lokalen Stand ein. Lernen Sie die Grundlagen von RDD: Grundkonzepte, Arbeiten mit Quellen, Aktionen. Erfahren Sie, wie Sie mit der Dataframe-API arbeiten. Erfahren Sie mehr über Leistungs- und Optimierungsprobleme bei der Verwendung von Dataframe, Datenquellen und -typen, der Arbeit mit gültigen/ungültigen Daten, Fehlerbehandlung, UDF, Interaktion mit Python und SQL.
Grundlagen maschineller Lernalgorithmen
Sie verstehen die wichtigsten Arten von Modellen für maschinelles Lernen, Schlüsselbegriffe und Definitionen. Lernen Sie Regressionsalgorithmen und Clustering-Algorithmen.
Einsatz
Lernen Sie die Hauptphasen der Vorbereitung eines Modells für die Bereitstellung, Ansätze zum Erstellen einer API sowie Möglichkeiten zum Umgang mit Fehlern und zum Debuggen von Anwendungen kennen. Sie werden in der Lage sein, Bereitstellungsprobleme zu beheben und die grundlegenden Swagger-Tools zu beherrschen. Machen Sie sich mit den wichtigsten Prozessen von Bash vertraut: Schreiben von Skripten, Arbeiten mit Variablen und den Texteditoren sed und awk.
Abschlussprojekte
Bereiten Sie nach dem Bestehen der ersten Stufe ein Einführungsprojekt vor. Am Ende des Kurses präsentieren Sie Ihre Abschlussarbeit.
Einführung in die Datenwissenschaft
Konsolidieren Sie Ihr neues Wissen an einem individuellen Projekt – Sie gelangen vom Laden der Daten bis zur Implementierung eines Modells. Lösen Sie die Probleme eines Dateningenieurs, ML-Ingenieurs und Datenanalysten, um sich für Ihre Spezialisierung zu entscheiden.
Dateningenieur
Abschlussprojekt auf Junior-Ebene. Führen Sie eine Kohortenanalyse durch und laden Sie API-Referenzen herunter. Erstellen Sie Dashboards basierend auf den empfangenen Daten.
Bonuskurse
Entwicklerkarriere: Beschäftigung und Entwicklung
Sie erfahren, wie Sie eine passende Stelle auswählen, sich auf ein Vorstellungsgespräch vorbereiten und mit einem Arbeitgeber verhandeln. Sie erhalten schnell eine Stelle, die Ihren Erwartungen und Fähigkeiten entspricht.
Git-Versionskontrollsystem
Erfahren Sie, wie Sie Codeänderungen versionieren, Repositorys und Branches erstellen und verwalten und Versionskonflikte lösen. Lernen Sie nützliche Regeln für die Arbeit mit Git.
Englisch für IT-Spezialisten
Erwerben Sie Sprachkenntnisse, die Ihnen helfen, ein Vorstellungsgespräch bei einem ausländischen Unternehmen zu bestehen und in gemischten Teams problemlos zu kommunizieren.