Moderne Ansätze zum Datenmanagement – Kurs 27.900 RUB. vom IBS Training Center, Schulung 16 Stunden, Datum 26. November 2023.
Verschiedenes / / December 02, 2023
Beim Entwerfen von Anwendungen ist eine der wichtigen Entscheidungen die Art und Weise, wie Daten gespeichert werden. Mehrere Jahrzehnte lang waren relationale DBMS die erste und einzige Option; Projekte unterschieden sich nur im Grad der Normalisierung, dem Standort der Geschäftslogik usw. Die Letzten In den letzten zehn bis fünfzehn Jahren haben sich alternative Systeme rasch weiterentwickelt – von objektorientierten und dokumentorientierten DBMS bis hin zu verteilten Dateisystemen und Stream-Verarbeitungssystemen Daten. Der Kurs untersucht eine Reihe moderner Lösungen, die eine langfristige sichere Speicherung von Daten ermöglichen. Gründe für die Entstehung von Lösungen verschiedener Klassen, ihre Vor- und Nachteile sowie bevorzugte Methoden verwenden.
Behandelten Themen:
1. Entwicklung von Ansätzen zur Datenspeicherung (Theorie – 2 Stunden).
Datenbanken, Data Warehouses, Datenbank-Engines, massiv parallele Architekturen, Hyperkonvergenz.
2. Relationales Modell (Theorie – 2 Stunden).
Welche Probleme löst es und zu welchem Preis?
Replikation, Sharding, verteilte Transaktionen.
3. Minimales Schlüsselwertmodell (Theorie – 1 Stunde, Praxis – 1 Stunde).
Schlüsselstrukturoptionen, Wertestrukturoptionen, Softwareschnittstellen.
Effizienz der Verwendung nicht relationaler Datenbanken: notwendige und ausreichende Bedingungen [Cassandra, HBase].
4. Dokumentorientiertes Modell [MongoDB] (Theorie – 0,5 Stunden, Praxis – 0,5 Stunden).
5. Verteilte Dateisysteme statt Datenmodelle: Cluster-Architektur [HDFS] (Theorie – 1 Stunde, Praxis – 1 Stunde).
6. SQL über verteilte Dateisysteme (Theorie – 1 Stunde, Praxis – 2 Stunden).
Architekturoptionen, Dateiformate, Einschränkungen, Transaktionen [Hive, Spark, Spark SQL, Parquet, ORC].
7. Verteilte Datenspeichersysteme im RAM [Hazelcast, Ignite, Tarantool] (Theorie – 1 Stunde).
8. Verteilte OLAP-Systeme [Clickhouse, Druid] (Theorie – 1 Stunde).
9. Verarbeitung von Datenströmen [Spark Streaming] (Theorie – 1 Stunde).
10. Selbstkonfigurierende und autonome Datenbanken (Theorie – 1 Stunde).