Spezialisierung „Datenanalyst“ – Kurs 2900 Rubel. von Stepik, Ausbildung 36 Lektionen, Datum: 29. Oktober 2023.
Verschiedenes / / December 05, 2023
Datenanalyst, Produktanalyst, Kundenstammanalyst, CRM-Analyst, Datenwissenschaftler – alle diese Berufe haben mit der Datenanalyse zu tun.
🎯 TOP-Anforderungen für diese Berufe:
- Kenntnisse in SQL und Erfahrung im Umgang mit Datenbanken;
- Kenntnisse der grundlegenden Python-Syntax und Kenntnisse der Pandas-Bibliothek;
- Kenntnisse in Statistik und Fähigkeit, diese in der Datenanalyse anzuwenden;
- Analytisches Denken.
Dies ist keine vollständige Liste. Webanalysten müssen beispielsweise Google Analytics und Yandex kennen. Metriken und für Datenwissenschaftler – maschinelles Lernen. Aber ich habe die grundlegenden Anforderungen genannt, die in 70-80 % der offenen Stellen zu finden sind.
Die Data Analyst-Spezialisierung besteht derzeit aus zwei Kursen:
1️⃣ SQL für alle
Während des Kurses beherrschen Sie SQL bis zum Schreiben komplexer SQL-Abfragen und üben die Verwendung von Daten eines Handelsunternehmens in einem der beliebtesten Datenbankverwaltungssysteme.
Der Kurs richtet sich sowohl an Einsteiger, die SQL beherrschen möchten, als auch an diejenigen, die SQL auf einem Grundniveau beherrschen, aber Lücken schließen und ihr Wissen in der Praxis festigen möchten.
2️⃣ Python: Datenanalyse mit Pandas
Der Kurs ist der praktischen Arbeit mit Pandas gewidmet. Sie erhalten die nötige Theorie und vertiefen diese mit einer Vielzahl praktischer Probleme.
Der Kurs ist für diejenigen geeignet, die bereits mit der grundlegenden Python-Syntax vertraut sind:
- Kennt grundlegende Datentypen (einschließlich Listen und Wörterbücher) und deren Operationen;
- Hat ein Verständnis dafür, was eine Funktion und eine Methode sind.
Der Kurs kann auch von Anfängern besucht werden, die selbstständig herausfinden können, wie man Python und die Pandas-Bibliothek installiert. Wenn Sie jedoch gerade erst mit Python beginnen, müssen Sie sich im Verlauf des Kurses selbst einige grundlegende Dinge aneignen. Übrigens können Sie sich in diesem Kurs Grundkenntnisse der Python-Syntax aneignen. Dann wird es viel einfacher sein, Pandas zu lernen.
Das Konzept der Kurse basiert auf drei Prinzipien:
Einfachheit
Die Präsentation des Materials ist zugänglich und konsistent – so können Sie Schritt für Schritt die notwendige Wissensbasis aufbauen.
Üben
Es wird viel Wert auf die Praxis gelegt – damit Sie nicht nur die Studienaufgaben lösen, sondern das Wissen in Zukunft auch in realen Projekten anwenden können.
Unterstützung
Stellen Sie Fragen gerne in den Kommentaren, es ist mir wichtig, dass der gesamte Stoff gelernt wird. Ich antworte innerhalb eines Tages auf Kommentare.
Die Reihenfolge, in der die Kurse belegt werden, ist nicht wichtig.
1. SQL für alle
Operationen an einer Tabelle
1. Einführung in die Datenbank
2. Filtern von WHERE-Zeilen. Reguläre Ausdrücke LIKE. UND und ODER
3. Sortieren von Zeichenfolgen ORDER BY
4. Aggregationsfunktionen: COUNT, SUM, MIN, MAX, AVG. Aliase
5. Gruppierung von GROUP BY- und HAVING-Zeilen. Erstellen von Berichten
6. Übung basierend auf den Ergebnissen des 1. Moduls
Operationen an mehreren Tabellen
1. Konzepte von Primärschlüssel und Fremdschlüssel. Arten von Beziehungen in der Datenbank
2. Generieren von Abfragen aus mehreren Tabellen. INNER JOIN und Aliase
3. LEFT JOIN und andere Arten von JOINs
4. Verbinden mehrerer Tabellen mit UNION und UNION ALL
5. Unterabfragen
6. Übung basierend auf den Ergebnissen des 2. Moduls
Weitere wichtige Themen
1. CASE-Ausdruck
2. Beliebte Funktionen zum Arbeiten mit Strings
Praktische Aufgaben zur Vertiefung des Lehrstoffs
1. Einfache Abfragen
2. Komplexe Abfragen
3. Abschluss
2. Python: Datenanalyse mit Pandas
Datenrahmen einzeln analysieren
1. Daten aus Dateien lesen
2. Express-Einführung in Daten
3. Spaltenausgabe
4. Datentypen
5. Zeilen filtern
6. Reguläre Ausdrücke
7. Strings sortieren
8. Aggregationsfunktionen
9. Zeilengruppierung
Analyse mehrerer zusammengehöriger Datenrahmen
1. Zusammenführen a. k. ein Beitritt
2. Verkettung
Zusätzliches erforderliches Modul
1. Arbeiten mit Datum und Uhrzeit
2. Pivot-Tabellen
3. Neue Möglichkeiten zum Erstellen von Datenrahmen
4. Kategorisierung nominaler Merkmale
5. Ersetzen von Werten in einem Datenrahmen
6. Visualisierung bei Pandas
7. Schneiden
8. Abschluss