Daten in Zeiten von COVID-19

Daniel Mintz, Chief Data Evangelist bei Looker

21. April 2020

Wie Looker in Zeiten von COVID-19 an Daten herangeht

Seitdem sich COVID-19 in unserer Welt verbreitet hat, stehen Daten im Mittelpunkt. Bei einem sich so schnell ausbreitenden Virus ist es aber nach wie vor sehr schwer an zuverlässige Daten zu bekommen. Ärzte und das Pflegepersonal an vorderster Front mussten sich selbstverständlich darauf konzentrieren, Leben zu retten, und hatten somit keine Zeit für die Datenerhebung.

Aber viele andere sind eingesprungen, um bei der Datennutzung zu helfen, damit wir so gut wie möglich verstehen können, was genau passiert. Gesundheitsfachkräfte, Journalisten, Akademiker und sogar viele Gruppen mit Freiwilligen haben rund um die Uhr gearbeitet, um kritische Datensätze zu suchen, zu erfassen, zu bereinigen, zu verstehen und zu pflegen.

Während wir mit unseren Kunden, Partnern und Gemeinden zusammengearbeitet haben, die gerade lernen, mit dieser neuen Realität umzugehen, haben wir Daten-Anfragen in überwältigender Anzahl zu dieser neuen Situation erhalten. So verwenden beispielsweise E-Commerce-Unternehmen COVID-Daten, um mit der drastisch gestiegenen Nutzung umzugehen, Restaurantketten rüsten um und setzen Daten ein, um sich auf den Lieferservice zu konzentrieren, und Regierungsbehörden greifen bei der Planung auf die Daten zurück, um die Auswirkungen des Coronavirus auf ihre Bürger so gering wie möglich zu halten. Des Weiteren orientieren sich Unternehmen des gesamten Gesundheitswesens – Krankenhäuser, Labore und Versicherer – an den vorhandenden Daten, um sich entsprechend vorzubereiten und Leben retten zu können.

Wenn jedoch so viele Unternehmen Daten erfassen und diese Daten auf leicht unterschiedliche Weise präsentieren, ist der erforderliche Arbeitsaufwand zur Vereinheitlichung und Interpretation dieser Daten nicht zu unterschätzen. Selbst wenn man sich eine Routine erarbeitet hat, ist der Aufbau einer Daten-Pipeline zur Bereitstellung aktuellster Daten und der gleichzeitigen Suche nach sich ändernden Schemata oder Methoden eine große Herausforderung.

Unsere Kollegen vom Google Cloud Public Datasets-Programm haben ihre vorhandenen Tools zur Zentralisierung der Daten eingesetzt. Sie fügen laufend neue Datensätze hinzu und stellen Abfragen gegen diese Datensätze kostenlos auf Google BigQuery zur Verfügung.

Lookers Lösung für eine einfachen Datensatz-Integration: Daten-Blocks

Als wir uns also überlegten, wo Looker Hilfe leisten könnte, konzentrierten wir uns nicht nur darauf, Daten zugänglich zu machen, sondern sie auch leicht nutzbar zu machen. Das Problem einer unkomplizierten Integration öffentlicher Datensätze in bestehende Daten-Workflows war uns nicht neu und unsere Lösung waren Daten-Blocks.

Um unseren Kunden, Gesundheitsbehörden und allen anderen zu helfen, Daten zu COVID-19 verständlich interpretieren zu können, veröffentlichen wir heute einen COVID-19-Daten-Block. Der Block besteht aus LookML-Modellen und vorkonfigurierten Dashboards. Zudem stehen Links zu Daten des Johns Hopkins Center for Systems Science and Engineering (JHU CSSE), der New York Times, des COVID Tracking-Projekts, Definitive Healthcare, der Kaiser Family Foundation, und dem italienischen Dipartimento della Protezione Civile zur Verfügung, um weitere Erkenntnisse zu gewinnen.

Der Block ist kostenlos und kann sofort über den Marketplace auf jede Looker-Instanz geladen werden. Die Daten, die der Block nutzt, sind derzeit nur in BigQuery verfügbar und können auf jeder Looker-Instanz mit einer bestehenden BigQuery-Verbindung eingesehen werden. Wenn Sie nicht über eine BigQuery-Verbindung verfügen, können Sie die Daten kostenlos auf dieser von Looker gehosteten Instanz untersuchen oder Ihr eigenes kostenloses Google Cloud Platform-Konto erstellen. Wir planen auch, die Daten im Laufe dieser Woche für Amazon Redshift, Snowflake und andere Datenbanken zur Verfügung zu stellen.

Sobald zusätzliche Datenquellen verfügbar sind und die Welt mehr über diese neuartige Erkrankung weiß, werden wir den Block entsprechend der neuen Erkenntnisse aktualisieren. Da uns jedoch bewusst ist, dass viele Menschen bereits jetzt Entscheidungen darüber treffen müssen, wie sie mit dieser Situation umgehen sollen, haben wir uns dazu entschlossen, die im Moment verfügbaren Daten schon jetzt bereitzustellen.

Bleiben Sie gesund und lassen Sie uns wissen, ob es andere Datenquellen gibt, die Ihrer Meinung nach im Looker-Covid-Data-Block unter Google.com aufgenommen werden sollten.

PS: Wir haben uns dazu entschlossen, die Daten so übersichtlich wie möglich zu präsentieren. Da wir die von anderen Unternehmen bereit gestellten Daten zugänglich machen, ihre Richtigkeit jedoch nicht überprüfen können, werden der Block und die zugrundeliegenden Daten in der uns vorliegenden Form dargelegt.

Es gibt viele berechtigte und wichtige Fragen darüber, wie zuverlässig die verschiedenen Datenquellen sind, und wir sind der Meinung, dass diese Fragen am besten den Experten der Epidemiologie und anderer verwandter Bereiche überlassen werden sollten. Da es unterschiedliche Meinungen darüber gibt, wie die Daten zu dieser sich schnell ausbreitenden Pandemie verantwortungsvoll zu interpretieren sind, geben wir keine Garantie zur Richtigkeit der bereitgestellten Daten.

Wir vertrauen darauf, dass unsere Kunden wissen, welche Daten sie benötigen, und sie diese Daten mit dem richtigen Maß an Skepsis handhaben. Bitte lesen Sie hierzu auch die Hinweise aus jeder Datenquelle, da sie eine wichtige kontextuelle Einordnung darstellen.

Weiter Zurück

Für die neuesten Beiträge abonnieren