Was ist Azure SQL Data Warehouse?

Azure SQL Data Warehouse (SQL DW) ist ein analytisches MPP-Datenzentrum im Petabyte-Bereich, das auf SQL-Server aufbaut und als Teil der Rechenplattform Microsoft Azure Cloud betrieben wird. Wie bei anderen Cloud-MPP-Lösungen werden auch bei SQL DW Speicher und Rechenleistung voneinander getrennt und separat abgerechnet.​​​​​​​ Im Gegensatz zu vielen anderen analytischen Datenzentrumslösungen abstrahiert SQL DW physische Maschinen und stellt die Rechenleistung in Form von Data-Warehouse-Einheiten (DWUs) zur Verfügung, mit denen die Nutzer Rechenressourcen nahtlos und einfach nach Belieben skalieren können.

Azure SQL Data Warehouse ist Teil der Cloud-Computing-Plattform von Microsoft Azure. Aus diesem Grund ist diese Datenbank die erste Wahl für Unternehmen, die bereits in den Microsoft-Technologie-Stack investiert haben.

Entscheidung für Azure SQL Data Warehouse

Cloud-Computing-Plattform von Microsoft Azure

Das Azure-Ökosystem von Microsoft ist riesig und bietet eine umfassende Palette von Lösungen mit zahlreichen Tools, die leicht erweitert werden können, um bei Bedarf mehr aus dem Stack herauszuholen. Statt der Nutzung von einer Datenbank mit einer Reihe von Drittanbieter-Services können Sie komplett in die Microsoft-Plattform investieren.

Benutzerfreundlichkeit

Azure SQL DW abstrahiert die Rechenressourcen weg vom Nutzer und stellt sie stattdessen in Form von DWUs zur Verfügung. Nutzer können diese unkompliziert auf- und abwärts skalieren, um mehr oder weniger Ressourcen für ihr Datenzentrum bereitzustellen.

Flexibilität

Für Endnutzer stehen zahlreiche Optionen zur Skalierung der Leistung eines Azure SQL Data Warehouse zur Verfügung. Nutzer können entweder ihre individuellen virtuellen Maschinen upgraden oder mit zusätzlichen Maschinen weitere Rechenressourcen hinzufügen. Die Skalierung lässt sich automatisch durchführen.

Für welche Anwendungsfälle ist Azure SQL Data Warehouse am besten geeignet?

Unternehmen, die SQL Server/SQL-Datenbanken verwenden

Azure SQL Data Warehouse basiert auf der gleichen Technologie wie SQL Server und SQL Database, wodurch das Laden von Daten von SQL Server in SQL Data Warehouse unkompliziert ist.

Unternehmen, die Daten sowohl in Azure Blob Storage als auch in Hadoop speichern, erhalten mit Azure ein hervorragendes Tool. Mit seinem PolyBase-Service können Nutzer in Azure gespeicherte relationale Daten mit in Hadoop gespeicherten nicht-relationalen Daten kombinieren.

Preisliche Erwägungen

Rechenleistung und Speicher werden für Azure SQL DW separat in Rechnung gestellt. Im Gegensatz zu AWS wird die Azure DW zugrunde liegende Hardware dem Kunden nicht bekannt gegeben. Für die Rechenleistung wird die Anzahl der Data-Warehouse-Einheiten (DWUs) als Maß für die „Pferdestärke“ ausgewählt. Für den Speicherplatz wird dem Kunden derselbe Tarif in Rechnung gestellt wie für Azure Premium Storage.

Microsoft verwendet einen Preisrechner auf der Webseite des Unternehmens, um Kunden die Preisberechnung für Rechenleistung (für das SQL Data Warehouse) und die Preisberechnung für Speicher (für Azure Cloud Storage) zu erleichtern.

Azure SQL Data Warehouse – Architektur

Azure SQL Data Warehouse hat eine ähnliche Architektur wie andere verwaltete MPP-Datenbanken, da Speicher und Rechenleistung voneinander getrennt werden. Azure SQL Data Warehouse basiert auf Azure Blob Storage und ruft dynamisch Rechenressourcen ab, um dort gespeicherte Daten abzufragen.

Azure SQL Data Warehouse ist grundsätzlich in zwei Arten von Knoten unterteilt: einen Kontrollknoten und mehrere Rechenknoten.

Kontrollknoten sind für die Erstellung eines Ausführungsplans für Abfragen zuständig und teilen die Abfragen in parallele Phasen auf, die von jedem der Rechenknoten ausgeführt werden. Zusätzlich zur Abfrageoptimierung und -verteilung speichert der Kontrollknoten auch Metadaten über die Abfragen.

Die zahlreichen Rechenknoten enthalten jeweils eine Instanz der SQL-Datenbank und sind für die Verarbeitung der lokal auf ihren einzelnen Festplatten gespeicherten Daten verantwortlich. Sobald die Zwischenergebnisse für einen einzelnen Rechenknoten verarbeitet wurden, geben diese ihre Ergebnisse an den Kontrollknoten zurück, wo sie aggregiert werden.

Azure SQL Data Warehouse fragt die in Daten aus Azure Blob Storage, dem massiven unstrukturierten Speicher von Microsoft, ab. Grundsätzlich gibt es zwei Möglichkeiten, um Daten aus Azure Storage abzurufen:

Datentypen

Azure SQL Data Warehouse funktioniert sowohl mit relationalen Daten als auch mit nicht-relationalen Daten über PolyBase – einer Speicherschicht sowohl für relationale als auch für HDFS-Daten.

Zeilenbereich (Menge)

Azure SQL Data Warehouse kann zusammen mit Azure Blob Storage Daten im Petabyte-Bereich bearbeiten. Durch die Kompatibilität zu Azure Data Lake kann Azure SQL Data Warehouse Exabyte von Daten abfragen.

Azure SQL Data Warehouse – Verwaltung und Implementierung

Implementierung von Azure SQL Data Warehouse

Es ist sehr einfach, Azure SQL Data Warehouse zu testen und ein schnelles Benchmark durchzuführen. Bevor Sie beginnen, sollten Sie jedoch sowohl ein Azure-Konto als auch einen Azure SQL Server haben.

Die Dokumentation von Microsoft hat eine sehr gute schrittweise Anleitung für die ersten Schritte mit Azure SQL Data Warehouse.

Prozess für neue Daten

Microsoft bietet verschiedene Möglichkeiten an, um Daten in Azure DW einzugeben. Schnelle und mit der Rechenleistung skalierbare Datenmengen stammen von PolyBase von Azure. Traditionellere Optionen wie Microsofts Bulk Copy Process (BCP) und SQL Bulk Load stehen auch zur Verfügung, sind jedoch nur auf Threads skalierbar, nicht auf DWUs (Recheneinheiten von Azure). Wenn man bereits in einen umfassenden Microsoft-Stack investiert hat, dann kann SSIS als Teil der ETL-Pipeline in Azure DW verwendet werden.​​​​​​​

Wartung

Da es sich bei Azure SQL DW um eine Cloud-basierte Lösung handelt, können Nutzer von den Vorteilen des geringeren Wartungsaufwands profitieren, der mit ähnlichen Managed-Service-Lösungen einhergeht. Azure ist jedoch insofern einzigartig, da es den Nutzern genau die Anpassung bietet, die sie benötigen.

Data Warehouse Units (DWU)

Die Rechenleistung in Azure SQL Data Warehouse wird als Data-Warehouse-Einheit (DWU) abstrahiert. Nutzer können dynamisch mehr Rechenleistung zu ihrer Instanz hinzufügen, indem sie die Anzahl der DWUs auf unterschiedliche Weise erhöhen.

DWUs ermöglichen den Nutzern, die Ressourcen innerhalb des Datenzentrums sehr schnell und einfach nach oben und unten skalieren.

Elastische Skalierung von SQL Data Warehouse

Eine der Stärken von SQL Azure liegt in der Flexibilität der Skalierbarkeit der Datenbank. Microsoft ermöglicht sowohl vertikale als auch horizontale Skalierung des Datenzentrums.

Die Nutzer können Azure SQL Data Warehouse vertikal skalieren, indem sie den Service-Tier wechseln oder die Datenbank in einen elastischen Pool verlagern.

Nutzer können Azure SQL Data Warehouse horizontal skalieren, indem sie weitere Data-Warehouse-Einheiten hinzufügen. Die Azure-Plattform bietet auch eine große Menge an Ressourcen, um die automatische Skalierung des Datenzentrums anzupassen.

Entdecken Sie Ihre Liebe zur Analytik.

Business Intelligence, Big-Data-Analyse oder eine 360°-Ansicht Ihrer Kunden.
Was auch immer Sie benötigen, Looker steht Ihnen zur Seite. Sprechen Sie einfach mit unseren Datenexperten.

Demo anfordern