Unstrukturiertes Datenwachstum stellt ein verstecktes Cloud-Sicherheits- und Compliance-Risiko dar

Druckfreundlich, PDF & E-Mail

Es gibt eine oft wiederholte Aussage, dass 90% aller heute existierenden Daten in den letzten zwei Jahren erstellt wurden. Die Herkunft dieser Zahl ist unklar und umstritten, wobei sie vor fast 10 Jahren zum ersten Mal genannt wurde. Selbst wenn sie damals zutraf, ist der Prozentsatz heute wahrscheinlich noch höher. Was jedoch nicht bestritten werden kann, ist, dass das exponentielle Wachstum von Informationen anhält. Das IDC sagt voraus, dass die Gesamtsumme der weltweiten Daten von 33 Zettabytes im Jahr 2018 bis 2025 auf einen Wert von 175 Zettabytes ansteigen wird.

Innerhalb dieses allgemeinen Datenwachstums schafft die zunehmende Menge an unstrukturierten Daten Sicherheits- und Compliance-Risiken. Es wird geschätzt, dass bis zu 90% der Daten von Unternehmen unstrukturiert sind – eine Quote, die zudem jedes Jahr um 55 bis 65% zunimmt. Dazu gehören Dokumente, Tabellenkalkulationen, Fotos, Videos, Audiodateien, Webseiten, Textdateien, soziale Medien und Folienpräsentationen, die sensible oder personenbezogene Informationen enthalten können, die sich nur schwer verfolgen und verwalten lassen.

Zum Beispiel könnten Nutzer ihre Passwörter für alle ihre Anwendungen in einer unverschlüsselten oder passwortlosen Excel-Datei aufbewahren und diese dann in einem Ordner auf OneDrive speichern, weil sie denken, dass dies sicher ist. Oder jemand macht für eine Job- oder Visumsbewerbung ein Foto oder einen Scan seines Reisepasses, der viele personenbezogene Daten enthält. Dies gibt er dann an die Personalabteilung weiter, die ihn daraufhin auf OneDrive oder SharePoint speichert. Wir alle haben diese Dinge schon getan. Es ist so einfach und geht so schnell, ohne wirklich darüber nachzudenken.

Die zunehmende Menge an unstrukturierten Daten schafft Sicherheits- und Compliance-Risiken. Schätzungen zufolge sind bis zu 90% der Daten von Unternehmen unstrukturiert – eine Quote, die zudem jedes Jahr um 55 bis 65% zunimmt. Twittern

Datenklassifizierung und Compliance-Risiken

Das Problem mit diesen unstrukturierten Daten ist, dass sie nicht in einer Datenbank existieren und kein vordefiniertes Datenmodell oder Schema haben. Während strukturierte Daten in einer Datenbank leichter klassifiziert und verwaltet werden können, ist es schwierig zu wissen, was der Inhalt eines Videos oder einer Tabellenkalkulation ist und ob sie Passwörter oder personenbezogene Daten enthält.

Dies stellt ein Data-Governance-Risiko dar – insbesondere in stark regulierten Branchen wie dem Gesundheitswesen, den Finanzdienstleistungen und der Regierung, die zur Einhaltung von Datenschutzgesetzen und -vorschriften wie dem US Health Insurance Portability and Accountability Act (HIPAA) und dem Sarbanes-Oxley Act (SOX) verpflichtet sind.

Zudem existiert ein Sicherheitsrisiko. Viele bestehende Datenklassifizierungs-Tools können Ihnen nicht sagen, ob beispielsweise eine Word-Datei mit einem Makrovirus infiziert ist. Sie müssen also nicht nur in der Lage sein, Ihre unstrukturierten Daten in Ihrer Cloud-Umgebung zu klassifizieren und alle Daten zu identifizieren, die personenbezogene oder sensible Daten enthalten. Sie müssen zudem in der Lage sein, diese Informationen auf Sicherheitsbedrohungen zu überprüfen.

Herausforderungen in puncto Cloud-Data-Governance

Ein weiterer Faktor, der Data Governance-Herausforderungen im Zusammenhang mit unstrukturierten Daten schafft, ist die weit verbreitete Einführung der Cloud. Anstatt all diese Daten auf Laptops, PCs, Dateiservern und Network Attached Storage (NAS) zu speichern, werden sie nun in Cloud-Plattformen wie Office 365 oder Google Workspace gespeichert, da sich Organisationen von Modellen mit Infrastruktur vor Ort verabschieden. Viele Unternehmen konfigurieren sogar Laptops und Systeme so, dass Mitarbeiter Daten nur auf OneDrive speichern können.

Aber im Zuge dieser Cloud-Migration nehmen sich die Unternehmen nicht die Zeit, ihre Daten zu sortieren. Sie gehen hier lediglich nach dem Prinzip „Lift and Shift“ vor und verschieben buchstäblich eine große Menge unstrukturierter Daten von einem Ort zum anderen. Dadurch wird das Problem nur verlagert, anstatt das Kernproblem der mangelnden Transparenz anzugehen.

Natürlich gibt es Datenklassifizierungs-Tools, die schon seit vielen Jahren auf dem Markt sind. Aber sie sind nicht mit der Zeit gegangen und wurden nicht für die Cloud entwickelt, sodass es Lücken in der Funktionalität und Leistungsfähigkeit gibt. Ein Tool erstellt vielleicht einen Bericht über Ihre Daten, aber es bereinigt sie nicht. Ein anderes bereinigt und organisiert sie in einer strukturierteren Weise, funktioniert aber nur auf einer Plattform.

Viele dieser älteren Produkte sind auch nicht mit den neuesten Dateiformaten kompatibel und können keine optische Zeichenerkennung (OCR) durchführen. Wenn Sie z. B. ein Passfoto prüfen und klassifizieren möchten, benötigen Sie OCR, um das Bild automatisch zu analysieren und den Namen, die Passnummer, Adresse und andere personenbezogene Informationen in ein Textformat statt in ein Bildformat zu übertragen.

Sie benötigen außerdem ein modernes Tool, das alle personenbezogenen oder sensiblen Informationen während der Klassifizierung unkenntlich machen kann. Das Tool muss diese Informationen erkennen und für den Administrator kennzeichnen, sie aber unkenntlich machen, damit sie nicht eingesehen werden können.

Dieses Wachstum unstrukturierter Daten wird sich fortsetzen. Vor diesem Hintergrund müssen Unternehmen die Klassifizierung und Governance ihrer Cloud-Umgebungen in den Griff bekommen, um sensible Informationen zu identifizieren und zu schützen und kostspielige oder schädliche Sicherheits- und Compliance-Verstöße zu vermeiden.

Hinweis: Dieser Artikel wurde zuerst am 25. Februar 2021 in Business Matters veröffentlicht

Nach oben scrollen
Twittern
Teilen
Teilen