
Unstrukturiertes Datenwachstum stellt ein verstecktes Cloud-Sicherheits- und Compliance-Risiko dar
Es gibt eine oft zitierte Statistik, dass 90 % aller heute vorhandenen Daten in den letzten zwei Jahren erstellt wurden. Die Herkunft dieser Zahl ist unklar und umstritten und geht auf die Zeit vor fast 10 Jahren zurück. Selbst wenn sie damals zutraf, ist dieser Prozentsatz heute wahrscheinlich noch höher. Was jedoch nicht bestritten werden kann, ist, dass sich das exponentielle Wachstum der Informationen fortsetzt. IDC prognostiziert, dass die Gesamtsumme der weltweiten Daten bis 2025 um 175 Zettabyte steigen wird — gegenüber 33 Zettabyte im Jahr 2018.
Bei diesem allgemeinen Datenwachstum führt die zunehmende Menge unstrukturierter Daten zu Sicherheits- und Compliance-Risiken. Schätzungen zufolge sind bis zu 90 % von unternehmenseigenen Daten unstrukturiert und steigen jedes Jahr um 55-65 %. Dazu gehören Dokumente, Tabellenkalkulationen, Fotos, Videos, Audio, Webseiten, Textdateien, Social Media und Präsentationen, die sensible oder persönlich identifizierbare Informationen (PII) enthalten können, die schwer nachzuverfolgen und zu verwalten sind.
Beispielsweise können Benutzer Kennwörter für alle ihre Anwendungen in einer unverschlüsselten oder kennwortfreien Excel-Datei aufbewahren und diese dann in einem Ordner auf OneDrive speichern, weil sie der Meinung sind, dass es sicher ist. Oder jemand schickt ein Foto oder einen Scan seines Reisepasses, der viele personenbezogene Daten enthält, an die Personalabteilung für die Bewerbung um eine Stelle oder einen Visumantrag, die folglich auf OneDrive oder SharePoint gespeichert werden. Wir haben alle das schon gemacht ohne groß darüber nachzudenken.
Datenklassifizierung und Compliance-Risiken
Das Problem mit diesen unstrukturierten Daten ist, dass sie nicht in einer Datenbank gespeichert sind und kein vordefiniertes Datenmodell oder Schema haben. Während strukturierte Daten in einer Datenbank leichter klassifiziert und verwaltet werden können, ist es schwierig zu wissen, was der Inhalt eines Videos oder einer Tabelle ist und ob es Passwörter oder PII enthält.
Dies stellt ein Daten-Governance-Risiko dar – insbesondere in stark regulierten Branchen wie dem Gesundheitswesen, den Finanzdienstleistungen und der Regierung, die zur Einhaltung von Datenschutzgesetzen und -vorschriften wie dem US Health Insurance Portability and Accountability Act (HIPAA) und dem Sarbanes-Oxley Act (SOX) verpflichtet sind.
Es besteht auch ein Sicherheitsrisiko. Viele vorhandene Datenklassifizierungstools können Ihnen nicht sagen, ob beispielsweise eine Word-Datei mit einem Makrovirus infiziert ist. Sie müssen also nicht nur in der Lage sein, Ihre unstrukturierten Daten in Ihrer Cloud-Umgebung zu klassifizieren und alle Daten zu identifizieren, die personenbezogene oder sensible Daten enthalten, sondern Sie müssen auch in der Lage sein, diese Informationen auf Sicherheitsbedrohungen zu überprüfen.
Herausforderungen in puncto Cloud-Data-Governance
Ein weiterer Faktor, der bei unstrukturierten Daten zu Herausforderungen bei der Data Governance führt, ist die weit verbreitete Einführung der Cloud. Anstatt all diese Daten auf Laptops, PCs, Dateiservern und Network Attached Storage (NAS) zu speichern, werden sie jetzt in Cloud-Plattformen wie Office 365 oder Google Workspace gespeichert, da Unternehmen von der On-Premise-Infrastruktur Abstand nehmen. Viele Unternehmen konfigurieren sogar Laptops und Systeme so, dass Mitarbeiter Daten nur auf OneDrive speichern können.
Aber im Zuge dieser Cloud-Migration nehmen sich Unternehmen nicht die Zeit, ihre Daten zu sortieren. Es handelt sich nur um ein Verlagern von Daten. Es wird buchstäblich ein Haufen unstrukturierter Daten von einem Ort zum anderen verschoben. Dadurch wird das Hauptproblem rund um den Mangel an Sichtbarkeit aber nicht behoben.
Natürlich gibt es Datenklassifizierungstools, die seit vielen Jahren auf dem Markt sind. Aber sie haben nicht mit den Entwicklungen Schritt gehalten und wurden nicht für die Cloud entwickelt, daher gibt es Lücken in Funktionalität und Leistungsfähigkeit. Ein Tool berichtet möglicherweise über Ihre Daten, repariert sie jedoch nicht. Ein anderes repariert sie und organisiert sie strukturierter, funktioniert aber nur auf einer Plattform.
Viele dieser älteren Produkte sind auch nicht mit den neuesten Dateiformaten kompatibel und können keine optische Zeichenerkennung (OCR) durchführen. Wenn Sie beispielsweise ein Passfoto überprüfen und klassifizieren möchten, benötigen Sie OCR, um das Bild automatisch zu analysieren und Name, Passnummer, Adresse und andere PII in einem Textformat anstelle eines Bildformats zu erfassen.
Sie benötigen außerdem ein modernes Tool, das alle persönlichen oder sensiblen Informationen während der Klassifizierung schwärzen kann. Das Tool muss diese Informationen erkennen und für den Administrator markieren, sie jedoch unkenntlich machen, damit sie nicht angezeigt werden können.
Dieses Wachstum unstrukturierter Daten wird sich fortsetzen. Vor diesem Hintergrund müssen Unternehmen die Klassifizierung und Governance ihrer Cloud-Umgebungen in den Griff bekommen, um sensible Informationen zu identifizieren und zu schützen und kostspielige oder schädliche Sicherheits- und Compliance-Verstöße zu vermeiden.
Hinweis: Dieser Artikel wurde erstmals am 25. Februar 2021 in Business Matters veröffentlicht