Kurs „Datenanalyst“ – Kurs 96.000 Rubel. von Yandex Workshop, Schulung 7 Monate, Datum 7. Dezember 2023.
Verschiedenes / / December 02, 2023
Ein Datenanalyst extrahiert aus Zahlen und Werten die Bedeutung: Er erkennt Trends, sagt Ereignisse voraus und hilft einem Unternehmen, Kunden zu verstehen, Prozesse zu optimieren und zu wachsen.
Der Markt braucht Spezialisten, die Daten sinnvoll nutzen können. Eine Studie des Personalunternehmens Ancor für September 2022 ergab, dass 45 % der russischen Unternehmen auf der Suche nach Analysten für ihr Team sind.
Fähigkeiten, die Sie im Kurs erlernen
Berufsbezeichnung
Analyst, Datenanalyst, Datenanalyst
Entwicklungsmöglichkeiten: Produktanalyst, Marketinganalyst, BI-Analyst, Data Science-Spezialist
Hier sind die Technologien und Tools, die Sie verwenden werden:
Python
Jupyter-Notizbuch
SQL
PostgreSQL
Tableau
A/B-Tests
Beginnen Sie mit der Analyse Geld zu verdienen
Sie beginnen auf einer Junior-Position und kommen dann nur voran. Sie werden die Karriereleiter erklimmen und an Wert gewinnen. Und eines Tages wird es keinen Preis mehr für dich geben.
Komplettes Kursprogramm zur Datenanalyse
Wir aktualisieren es regelmäßig, um sicherzustellen, dass es den Anforderungen der Branche und der Arbeitgeber entspricht.
Mit anderen Worten: Sie lernen nur das, was Ihnen bei Ihrer Arbeit definitiv nützlich sein wird.
Kostenloser Teil - 1 Woche
Kostenlose Einführung: Grundlagen von Python und Datenanalyse
Lernen Sie die Grundkonzepte der Datenanalyse kennen und verstehen Sie, was Datenanalysten und Datenwissenschaftler tun.
• Moskauer Catnamycs. Daten auf dem Bildschirm anzeigen. CSV-Dateien. Arbeiten mit Tabellen. Wärmekarten. Multiplizieren einer Spalte mit einer Ganzzahl.
• Fehler im Code. Syntaxfehler. Namensfehler. Fehler beim Teilen durch Null. Fehler beim Importieren eines Moduls.
• Variablen und Datentypen. Variablen. Datentypen. Arithmetische Operationen mit Zahlen und Strings.
• Wie man Hypothesen aufstellt. Hypothesen. HADI-Zyklen. Analytisches Denken. Grafiken lesen.
• Was Datenwissenschaftler tun. Analystenaufgaben. Klärung der Aufgaben. Zersetzung. Projektphasen.
• Konvertierungen prüfen. Konvertierung. Datenexploration. Bildung von Schlussfolgerungen.
• Amortisation von Werbekampagnen. Säulendiagramm. Unterschied der Elemente. Indizierung in Spalten.
• Maschinelles Lernen und Datenwissenschaft. Schulung im maschinellen Lernen. Eindeutige Werte in Spalten finden. Logische Indizierung. Gruppieren von Werten in einer Tabelle. Vorhersagefehler.
• Abschlussprojekt. Benutzersegmentierung.
PythonPandasErrorsSeabornHypothesesConversionVariablesData TypesHeatmaps
1 Sprint 3 Wochen
Grundlegendes Python
Tauchen Sie tiefer in die Programmiersprache Python und die Pandas-Bibliothek ein.
• Variablen und Datentypen. Python-Sprache. Variablen. Daten auf dem Bildschirm anzeigen. Objekte auf dem Bildschirm anzeigen. Fehlerbehandlung, versuchen...außer Operator. Datentypen. Datentypkonvertierungen.
• Linien. Indizes in Zeilen. Linienschnitte. Operationen an Strings. String-Methoden. Formatierungszeichenfolgen, format()-Methode, F-Zeichenfolgen.
• Listen. Indizes in Listen. Slices auflisten. Elemente zu einer Liste hinzufügen. Listenelemente entfernen. Addition und Multiplikation von Listen. • Listen sortieren. Suchen Sie nach Elementen in einer Liste. Aufteilen einer Zeichenfolge in eine Liste von Zeichenfolgen, Verketten einer Liste von Zeichenfolgen zu einer Zeichenfolge.
• For-Schleife. Fahrräder. Aufzählung von Elementen. Iterieren über Elementindizes. Listenelemente mithilfe von Schleifen verarbeiten: Summe und Produkt von Elementen ermitteln.
• Verschachtelte Listen. Durchlaufen verschachtelter Listen mit Zählwerten. Elemente zu verschachtelten Listen hinzufügen. Verschachtelte Listen sortieren.
• Bedingter Operator. While-Schleife. Boolescher Datentyp. Boolesche Werte. Logische Ausdrücke. Zusammengesetzte logische Ausdrücke. Bedingte Anweisung if...elif...else. Verzweigung. Filtern von Listen mit einem bedingten Operator. While-Schleife.
• Funktionen. Zuweisung von Funktionen. Parameter und Argumente. Parameter mit Standardwerten. Positionsargumente und benannte Argumente. Ein Ergebnis einer Funktion zurückgeben.
• Wörterbücher. Schlüssel und Werte. Suche nach einem Wert nach Schlüssel. Elemente zum Wörterbuch hinzufügen. Liste der Wörterbücher. Schöne Ausgabe von Wörterbüchern.
• Pandas-Bibliothek. CSV-Dateien lesen. Datenrahmen. Datenrahmenkonstruktor. Drucken der ersten und letzten Zeile eines Datenrahmens. Indizierung in Datenrahmen. Indizierung für Reihenspalten.
• Datenvorverarbeitung. Das GIGO-Prinzip. Datenrahmenspalten umbenennen. Umgang mit fehlenden Werten. Umgang mit expliziten und impliziten Duplikaten.
• Datenanalyse und Präsentation der Ergebnisse. Daten gruppieren. Daten sortieren. Grundlagen der deskriptiven Statistik.
• Jupyter Notebook – ein Notebook in einer Zelle. Jupyter Notebook-Schnittstelle. Jupyter Notebook-Verknüpfungen.
SchleifenPythonPandasStringsListsFunktionenDictionariesDataFrameVariablesDataTypesBedingte Anweisung
Projekt
Vergleichen Sie die Benutzerdaten von Yandex Music nach Stadt und Wochentag.
2 Sprint 2 Wochen
Datenvorverarbeitung
Erfahren Sie, wie Sie Daten von Ausreißern, Auslassungen und Duplikaten bereinigen und verschiedene Datenformate konvertieren.
• Arbeiten mit Pässen. Konvertierung. Kekse. Kategoriale und quantitative Variablen. Umgang mit Lücken in kategorialen Variablen. Umgang mit Lücken in quantitativen Variablen. Umgang mit Lücken in quantitativen Variablen nach Kategorie.
• Datentypen ändern. Excel-Dateien lesen. Konvertieren Sie Reihen in einen numerischen Typ. Zahlenmodul, abs()-Methode. Arbeiten mit Datum und Uhrzeit. Fehlerbehandlung, versuchen...außer Operator. Datenrahmen zusammenführen, Methode merge(). Pivot-Tabellen.
• Suche nach Duplikaten. Suche nach Duplikaten, Groß- und Kleinschreibung beachten.
• Datenkategorisierung. Zerlegung von Tabellen. Kategorisierung nach Zahlenbereichen. Kategorisieren Sie basierend auf mehreren Werten pro Zeile.
• Systematisches und kritisches Denken in der Arbeit eines Analytikers. Systemdenken. Ursachen für Datenfehler. Kritisches Denken.
PythonPandasLückenbehandlungDatenverarbeitungDoppelte VerarbeitungDatenkategorisierung
Projekt
Analysieren Sie Daten über Bankkunden und ermitteln Sie den Anteil kreditwürdiger Kunden.
3 Sprint 2 Wochen
Explorative Datenanalyse
Lernen Sie die Grundlagen der Wahrscheinlichkeitsrechnung und Statistik. Nutzen Sie sie, um die grundlegenden Eigenschaften von Daten zu erkunden und nach Mustern, Verteilungen und Anomalien zu suchen. Lernen Sie die Matplotlib-Bibliothek kennen. Zeichnen Sie Diagramme und üben Sie die Analyse von Diagrammen.
• Erste Grafiken und Schlussfolgerungen. Verwendung von Pivot-Tabellen. Balkendiagramm. Verteilungen. Reichweitendiagramm.
• Untersuchung von Datenscheiben. Die query()-Methode. Arbeiten mit Datum und Uhrzeit. Diagramme mit der plot()-Methode zeichnen. Ockhams Rasiermesser.
• Arbeiten mit mehreren Datenquellen. Datenausschnitt basierend auf externen Objekten. Hinzufügen neuer Spalten zu einem Datenrahmen. Daten aus anderen Datenrahmen hinzufügen. Spalten umbenennen. Kombinieren von Tabellen mit den Methoden merge() und join().
• Datenbeziehungen. Streudiagramm. Korrelation von Variablen. Streudiagrammmatrix.
• Validierung der Ergebnisse. Konsolidierung von Gruppen. Daten in Gruppen einteilen.
PythonPandasMatplotlibHistogramsData SlicesData AnalysisScatterplotScatterplotData VisualizationDescriptive Statistics
Projekt
Entdecken Sie das Archiv der Anzeigen für den Verkauf von Immobilien in St. Petersburg und der Region Leningrad.
4 Sprint 3 Wochen
Statistische Datenanalyse
Lernen Sie, Beziehungen in Daten mithilfe statistischer Methoden zu analysieren. Erfahren Sie, was statistische Signifikanz und Hypothesen sind.
• Kombinatorik. Kombinationen. Multiplikationsregel. Umordnungen. Anzahl der Permutationen. Platzierungen. Anzahl der Platzierungen. Kombinationen. Anzahl der Kombinationen.
• Wahrscheinlichkeitstheorie. Experiment. Wahrscheinlichkeitsraum. Veranstaltungen. Wahrscheinlichkeit. Sich überschneidende und sich gegenseitig ausschließende Ereignisse. Euler-Venn-Diagramm. Gesetz der großen Zahlen.
• Beschreibende Statistik. Kategoriale und quantitative Variablen. Modus und Median. Mittlere Bedeutung. Streuung. Standardabweichung. Quartile und Perzentile. Reichweitendiagramm. Säulendiagramm. Frequenzdichte. Balkendiagramm.
• Zufällige Variablen. Diskrete Zufallsvariable. Wahrscheinlichkeitsverteilung für eine diskrete Zufallsvariable. Summenfunktion (Verteilungsfunktion) einer diskreten Zufallsvariablen. Mathematischer Erwartungswert einer diskreten Zufallsvariablen. Streuung einer diskreten Zufallsvariablen.
• Verteilungen. Bernoullis Experiment. Binomialexperiment. Binomialverteilung. Kontinuierliche gleichmäßige Verteilung. Normalverteilung. Standardnormalverteilung. CDF und PPF für Normalverteilung. Poisson-Verteilung. Annäherung einer Verteilung an eine andere.
• Hypothesen testen. Durchschnittsbevölkerung. Probe. Stichprobenverteilung. Zentraler Grenzwertsatz. Einseitige und zweiseitige Hypothesen. P-Wert. Testen einseitiger und zweiseitiger Hypothesen für eine Stichprobe. Testen der Hypothese über die Gleichheit der Mittelwerte zweier Allgemeinbevölkerungen. Testen der Hypothese der Mittelwertgleichheit für abhängige Stichproben.
ScipyNumpyPythonPandasMatplotlibCombinatoricsDistributionsHypothesetestsWahrscheinlichkeitstheorie
Projekt
Testen Sie Hypothesen zum Rollerverleih, um Ihr Geschäft auszubauen.
Extrasprint
Wahrscheinlichkeitstheorie
Erinnern oder erkennen Sie die Grundbegriffe der Wahrscheinlichkeitstheorie: unabhängige, gegensätzliche, inkompatible Ereignisse usw. Anhand einfacher Beispiele und unterhaltsamer Probleme üben Sie den Umgang mit Zahlen und den Aufbau der Logik von Lösungen.
Dies ist ein optionaler Sprint. Das bedeutet, dass jeder Studierende selbst eine der Optionen wählt:
• Einen zusätzlichen Sprint von 10 kurzen Lektionen meistern, Theorie auffrischen und Probleme lösen.
• Öffnen Sie nur den Block mit Interviewaufgaben, erinnern Sie sich an die Praxis ohne Theorie.
• Überspringen Sie den Kurs ganz oder kehren Sie zu ihm zurück, wenn es Zeit und Bedarf ist.
PythonEreignisseWahrscheinlichkeitTheorem von BayesZufallsvariablenWahrscheinlichkeitstheorieStatistische Datenanalyse
5 Sprint 1 Woche
Abschlussprojekt des ersten Moduls
Erfahren Sie, wie Sie vorläufige Datenrecherchen durchführen und Hypothesen formulieren und testen.
ScipyNumpyPythonPandasMatplotlibDatenanalyseHypothesentestDatenverarbeitung
Projekt
Finden Sie Muster in Spieleverkaufsdaten.
6 Sprint 2 Wochen
Grundlegendes SQL
Erlernen Sie die Grundlagen der strukturierten Abfragesprache SQL und der relationalen Algebra für die Arbeit mit Datenbanken. Machen Sie sich mit den Funktionen der Arbeit in PostgreSQL, einem beliebten Datenbankverwaltungssystem (DBMS), vertraut. Lernen Sie, Abfragen unterschiedlicher Komplexität zu schreiben und Geschäftsprobleme in SQL zu übersetzen. Sie arbeiten mit einer Datenbank eines Online-Shops, der auf Filme und Musik spezialisiert ist.
• Einführung in Datenbanken. Datenbankverwaltungssysteme (DBMS). SQL-Sprache. SQL-Abfragen. Formatieren von SQL-Abfragen.
• Datenscheiben in SQL. Datentypen in PostgreSQL. Datentypkonvertierung. WHERE-Klausel. Logische Operatoren. Datenscheiben. Operatoren IN, LIKE, BETWEEN. Arbeiten mit Datum und Uhrzeit. Umgang mit fehlenden Werten. Bedingtes CASE-Konstrukt.
• Aggregationsfunktionen. Daten gruppieren und sortieren. Mathematische Operationen. Aggregationsfunktionen. Daten gruppieren. Daten sortieren. Filterung nach aggregierten Daten, HAVING-Operator.
• Beziehungen zwischen Tabellen. Arten von Tabellenverknüpfungen. ER-Diagramme. Felder und Tabellen umbenennen. Aliase. Tabellen zusammenführen. Arten von Joins: INNER JOIN, LEFT JOIN, RIGHT JOIN, FULL OUTER JOIN. Alternative Arten von Gewerkschaften UNION und UNION ALL.
• Unterabfragen und allgemeine Tabellenausdrücke. Unterabfragen. Unterabfragen in FROM. Unterabfragen in WHERE. Eine Kombination aus Joins und Unterabfragen. Gemeinsame Tabellenausdrücke (CTE). Variabilität der Anfragen.
SQLDBMSPostgreSQLUnterabfragenDatenbankenSQL-AbfragenDaten filternDaten sortierenDaten gruppierenTabellen verbindenGemeinsame Tabellenausdrücke
Projekt
Sie schreiben eine Reihe von Abfragen unterschiedlicher Komplexität an eine Datenbank, in der Daten zu Risikoinvestoren, Start-ups und Investitionen in diese gespeichert sind.
7 Sprint 3 Wochen
Analyse von Geschäftsindikatoren
Erfahren Sie, welche Kennzahlen in der Wirtschaft gelten. Lernen Sie, Tools zur Datenanalyse in der Wirtschaft zu nutzen: Kohortenanalyse, Verkaufstrichter und Einheitsökonomie.
• Metriken und Trichter. Konvertierung. Trichter. Marketing-Trichter. Eindrücke. Klicks. CTR. Produkttrichter.
• Kohortenanalyse. Benutzerprofil. Retentionsrate. Abwanderungsquote. Analysehorizont. Visualisierung der Kohortenanalyse. Retentionsanalyse zufälliger Kohorten. Konvertierung in der Kohortenanalyse. Berechnen von Metriken in Python.
• Einheitenökonomie. Kennzahlen LTV, CAC, ROI. ARPU, ARPPU. Berechnen von Metriken in Python. Erweiterte Visualisierung von Metriken. Sharey-Parameter. Gleitender Durchschnitt.
• Benutzerdefinierte Metriken. Bewertung der Benutzeraktivität. Benutzersitzung. Anomalieuntersuchung.
MetrikenTrichterConversionUnit EconomicsKohortenanalyseProduktmetrikenMarketingmetriken
Projekt
Verstehen Sie anhand der Daten das Benutzerverhalten, analysieren Sie die Kundenrentabilität und den Werbe-ROI, um Empfehlungen für die Marketingabteilung abzugeben.
8 Sprint 2 Wochen
Erweitertes SQL
Sie absolvieren einen Zusatzkurs zum Umgang mit Datenbanken und kommen dem Geschäft noch näher. Mithilfe der SQL-Sprache analysieren Sie die Berechnung der wichtigsten Geschäftskennzahlen, die Sie im Sprint „Business Indicators Analysis“ kennengelernt haben. Erwägen Sie die Arbeit mit einem komplexen Tool wie Fensterfunktionen. Lernen Sie, den Inhalt von Datenbanken lokal, ohne Simulator, mithilfe spezieller Client-Programme und Bibliotheken für Python zu ändern.
• Berechnung von Geschäftsindikatoren. Datenschema. Konvertierung. LTV. ARPU. ARPPU. ROI. Berechnung mit SQL.
• Aggregierende Fensterfunktionen. OVER-Ausdruck. Fensterparameter PARTITION BY.
• Fenster-Ranking-Funktionen. Ranking-Funktionen. Fenster ORDER BY-Operator. ZEILENNUMMER(). RANG(). DENSE_RANK(). NTILE(). Fensteroperatoren zusammen mit Ranking-Funktionen.
• Fensteroffset-Funktionen. Kumulierte Werte. Offset-Funktionen. FÜHREN(). VERZÖGERUNG(). Fensterfunktionen und Aliase.
• Kohortenanalyse. Bindungsrate, Abwanderungsrate. LTV.
• Installation und Konfiguration der Datenbank und des Datenbank-Clients. Datenbank-Client. PostgreSQL installieren. DBeaver installieren. DBeaver-Schnittstelle. Datenbankerstellung. Bereitstellen eines Datenbank-Dumps. Abfrageergebnisse hochladen. Präsentation der Abfrageergebnisse.
SQLDBMSMetrikenPostgreSQLDatenbankenSQL-AbfragenFensterfunktionenKohortenanalyse
Projekt
Stellen Sie mithilfe von Python und SQL eine Verbindung zu einer Datenbank her, berechnen und visualisieren Sie wichtige Kennzahlen in einem Programmier-Q&A-Servicesystem.
9 Sprint 2 Wochen
Entscheidungsfindung im Unternehmen
Sie erfahren, was A/B-Testing ist und in welchen Fällen es eingesetzt wird. Lernen Sie, A/B-Tests zu entwerfen und deren Ergebnisse auszuwerten.
• Grundlagen des Hypothesentests in der Wirtschaft. Führende Kennzahlen. Grundlagen von Experimenten. Generierung von Hypothesen. Priorisierung von Metriken. Auswahl einer Methode zur Durchführung eines Experiments. Qualitative Methoden zum Testen von Hypothesen. Quantitative Methoden zum Testen von Hypothesen. Vor- und Nachteile von A/B-Tests.
• Priorisierung von Hypothesen. RICE-Framework. Parameter erreichen. Wirkungsparameter. Vertrauensparameter. Aufwandsparameter.
• Vorbereitung auf die Durchführung eines A/B-Tests. A/A-Test. Fehler vom Typ I und II. Aussagekraft des statistischen Tests. Bedeutung des statistischen Tests. Mehrfachvergleiche, Methoden zur Reduzierung der Fehlerwahrscheinlichkeit. Berechnung der Stichprobengröße und Dauer eines A/B-Tests. Grafische Analyse von Metriken.
• Analyse der A/B-Testergebnisse. Prüfung der Hypothese der Aktiengleichheit. Shapiro-Wilk-Test zum Testen der Datennormalität. Nichtparametrische statistische Tests. Mann-Whitney-Test. Stabilität kumulativer Metriken. Analyse von Ausreißern und Ausbrüchen.
• Verhaltensalgorithmen. Fakten, Emotionen, Einschätzungen. Erläutern Sie Ihren Standpunkt.
A/B-TestingPriorisierung von HypothesenVorbereitung auf A/B-TestingAnalyse der A/B-TestergebnisseAnalyse der A/B-Testergebnisse
Projekt
Analysieren Sie die Ergebnisse von A/B-Tests in einem großen Online-Shop.
10 Sprint 1 Woche
Abschlussprojekt des zweiten Moduls
Lernen Sie, statistische Hypothesen mithilfe von A/B-Tests zu testen und Schlussfolgerungen und Empfehlungen im analytischen Berichtsformat vorzubereiten.
VerkaufstrichterA/B-TestsDatenverarbeitungForschungsdatenanalyse
Projekt
Erkunden Sie den Verkaufstrichter und analysieren Sie die Ergebnisse des A/B-Tests in der mobilen Anwendung.
11 Sprint 2 Wochen
Wie man mit Daten eine Geschichte erzählt
Sie erfahren, wie Sie die Ergebnisse Ihrer Recherche anhand von Grafiken richtig darstellen, die wichtigsten Kennzahlen und deren richtige Interpretation. Lernen Sie die Bibliotheken Seaborn und Plotly kennen.
• Wem, wie, was und warum sagen. Präsentation des Forschungsergebnisses. Die Zielgruppe des Erzählers. Was und warum man einem Datenanalysten sagen sollte.
• Seaborn-Bibliothek. Die Seaborn-Bibliothek als Erweiterung der Matplotlib-Bibliothek. jointplot()-Methode. Farbbereiche. Diagrammstile. Visualisierung von Verteilungen.
• Plotly-Bibliothek. Interaktive Grafiken. Liniendiagramm. Säulendiagramm. Kuchendiagramm. Trichterdiagramm.
• Datenvisualisierung in der Geoanalytik. Geoanalytik. Bibliotheksfolium. Kartendarstellung. Setzen von Markierungen mit angegebenen Koordinaten. Punktcluster erstellen. Benutzerdefinierte Symbole für Markierungen. Horoplet.
• Vorbereiten einer Präsentation. Schlussfolgerungen basierend auf der Studie. Saisonalität und externe Faktoren. Absolute und relative Werte. Simpsons Paradoxon. Prinzipien des Präsentationsaufbaus. Berichte im Jupyter Notebook.
PlotlyFoliumSeabornMatplotlibPräsentationGeoanalytikDatenvisualisierung
Projekt
Bereiten Sie eine Marktstudie auf der Grundlage offener Daten über öffentliche Gastronomiebetriebe in Moskau vor und visualisieren Sie die erhaltenen Daten.
12 Sprint 2 Wochen
Erstellen von Dashboards in Tableau
In diesem Sprint arbeiten Sie mit dem Tableau BI-System. Lernen Sie, eine Verbindung zu Daten herzustellen und diese zu ändern, verschiedene Arten von Diagrammen zu erstellen, Dashboards und Präsentationen zusammenzustellen.
• Grundlagen der Arbeit mit Tableau. BI-Systeme. Tableau. Ein Dokument erstellen. Speichern des Dokuments. Veröffentlichung des Dokuments.
• Arbeiten mit Datenquellen. Datenquellen. Datenzusammenführung. Beziehungsmethode. Join-Methode. Blend-Methode. Union-Methode. Ändern des Tabellenformats.
• Datentypen. Grundlegende Datentypen. Messungen. Maßnahmen. Arbeiten mit Datum und Uhrzeit. Sets. Gruppen. Optionen. Ändern des Formats von Variablen. Variablen Kennzahlnamen, Kennzahlwerte, Anzahl.
• Tabellen und Berechnungen. Oberfläche zur Blattbearbeitung. Pivot-Tabellen. Berechnete Felder. LOD-Ausdrücke.
• Filter und Sortierung. Sortiermaßnahmen. Dimensionen sortieren. Verschachtelte Sortierungen. Sortieren nach einem Parameter. Filter.
• Visualisierungen. Visualisierungskontrollen. Wärmekarten. Kreisdiagramme. Säulendiagramme. Histogramme. Reichweitendiagramme. Streudiagramm. Liniendiagramme. Kombinierte Diagramme. Flächendiagramme.
• Spezielle Visualisierungen und Tooltips. Karten. Zeichentabelle. Blasendiagramm. Baumkarte. Diagramme mit Kreisansichten. Bullet-Diagramme. Gantt-Diagramme. Messen Sie Namen und Messwerte in Visualisierungen. Reverse Engineering. Tooltips. Tooltips mit Visualisierungen. Schwellenwerte in Diagrammen. Analysetools in Custom.
• Präsentationen. Zusätzliche Optionen. Untersuchung typischer Parameter. Erstellen einer Präsentation.
• Dashboards. Laden und Aufbereiten von Daten. Visualisierungen vorbereiten. Montage des Armaturenbretts. Aktionen. Dashboard-Demonstration. Veröffentlichen eines Dashboards.
TableauDashboardsBI-ToolsBI-ToolsDatenvisualisierung
Projekt
Recherchieren Sie die Geschichte von TED-Konferenzen und erstellen Sie auf Basis der gewonnenen Daten ein Dashboard in Tableau.
Extrasprint
Grundlagen des maschinellen Lernens
Machen Sie sich mit den Grundlagen des maschinellen Lernens vertraut und lernen Sie die Hauptaufgaben des maschinellen Lernens in der Wirtschaft kennen.
PythonPandasSklearnMaschinelles Lernen. Aufgaben für maschinelles Lernen. Algorithmen für maschinelles Lernen
Extrasprint
Übe Python
Sie absolvieren mehrere Laborkurse mit Zusatzaufgaben in der Programmiersprache Python. Außerdem erfahren Sie, wie Sie Daten aus Webressourcen extrahieren.
Du wirst:
• in der Struktur von HTML-Seiten und der Funktionsweise von GET-Anfragen,
• lernen, einfache reguläre Ausdrücke zu schreiben,
• die API und JSON kennenlernen,
• Stellen Sie mehrere Anfragen an Websites und sammeln Sie Daten.
JSONPythonREST APIWeb Scraping
13 Sprint 3 Wochen
Abschlussprojekt
Bestätigen Sie im letzten Projekt, dass Sie einen neuen Beruf beherrschen. Klären Sie die Aufgabenstellung des Kunden und durchlaufen Sie alle Phasen der Datenanalyse. Jetzt gibt es weder Unterricht noch Hausaufgaben – alles ist wie bei einem richtigen Job.
Der letzte Sprint umfasst Projektarbeit, A/B-Tests und SQL-Aufgaben sowie eine zusätzliche Aufgabe. Das Projekt enthält eine Problemstellung, das erwartete Ergebnis, einen Datensatz und deren Beschreibung.
Die Aufgabe bezieht sich auf einen von fünf Geschäftsbereichen:
• Banken,
• Einzelhandel,
• Spiele,
• mobile Anwendungen,
• E-Commerce.
Es wird keine übliche Beschreibung der Schritte im Projekt geben. Sie werden sie selbst durcharbeiten.
SQ LPython PandasTableau Dashboards Postgre SQL-Zerlegung A/B-Tests