Contact
QR code for the current URL

Story Box-ID: 1073711

JET-Software GmbH Edmund-Lang-Straße 16 64832 Babenhausen, Germany https://www.jet-software.com
Contact Mr Amadeus Thomas +49 6073 711403
Company logo of JET-Software GmbH

❌ Data Masking von Apache Parquet ❌ Personenbezogene PII oder andere sensible Daten in Parquet-Dateien finden und sicher maskieren ❗

Datenmaskierung nicht nur in Hadoop: Datenschutz von und in un/semi/strukturierten Dark Data Quellen - lokal und in der Cloud ❗

(PresseBox) (Babenhausen, )
Parquet-Dateiformat: Sensible Informationen suchen und schützen!

Apache Parquet ist ein spaltenförmiges, komprimiertes Dateiformat, das auf Leistung optimiert ist. Parquet-Dateien sind häufig bei Cloud-Speicheranbietern zu finden, da die Optimierungen des Dateiformats die Kosten in Cloud-Umgebungen im Vergleich zu CSV-Dateien senken.

Parquet ist ein komplexes Binärformat, das zwar für schnelle analytische Abfragen und geringen Speicherplatzbedarf ausgelegt ist, aber nicht leicht lesbar ist, was den Schutz sensibler Daten erschweren kann.

Die DarkShield Files API bietet jedoch die Möglichkeit, Parquet-Dateien nach sensiblen Daten zu durchsuchen und zu maskieren. Das Parquet-Dateiformat lässt viele Datentypen und verschachtelte Datenstrukturen zu; die DarkShield Files API ist in der Lage, gängige primitive Typen wie Strings, Integer, Bytes usw. sowie mehrere Verschachtelungsebenen zu durchsuchen und zu maskieren.

Die Implementierung der Unterstützung des Parquet-Dateiformats in der DarkShield Files API wurde mit Blick auf die Massenverwendung entwickelt. Viele Parkettdateien sind recht groß, aber wenn die Größe jeder Zeilengruppe auf eine vernünftige Größe begrenzt ist (empfohlen werden typischerweise nicht mehr als 128 MB), entspricht der maximal verwendete Speicherplatz eher der Größe der Zeilengruppe als der Größe der gesamten Datei.

Diese Demo finden Sie im Ordner "parquet demo" hier.

Die Demo enthält zwei Parkettdateien, von denen eine eine "flat" Parkettdatei ist, die ein einzelnes Feld für jede Spalte hat, während die andere Datei verschachtelte Felder in einer Spalte enthält.

Wenn Sie sich eine der Parkettdateien in einem Texteditor ansehen, können Sie das Format erkennen - einige Zeichenketten sind sichtbar, aber es gibt auch eine Menge binärer Kodierung.

Weltweite Referenzen: Seit über 40 Jahren nutzen unsere Kunden wie die NASA, American Airlines, Walt Disney, Comcast, Universal Music, Reuters, das Kraftfahrtbundesamt, das Bundeskriminalamt, die Bundesagentur für Arbeit, Rolex, Commerzbank, Lufthansa, Mercedes Benz, Osram,.. aktiv unsere Software für Big Data Wrangling und Schutz! Sie finden viele unserer weltweiten Referenzen hier und eine Auswahl deutscher Referenzen hier.

Partnerschaft mit IRI: Seit 1993 besteht unsere Kooperation mit IRI (Innovative Routines International Inc.) aus Florida, USA. Damit haben wir unser Portfolio um die Produkte CoSort, Voracity, DarkShield, FieldShield, RowGen, NextForm, FACT und CellShield erweitert. Nur die JET-Software GmbH besitzt die deutschen Vertriebsrechte für diese Produkte. Weitere Details zu unserem Partner IRI Inc. hier.

Website Promotion

Website Promotion
DB2 UDB-Leistungsengpässe + Sicherheitsbedenken in Produktion/Test bewältigen!

JET-Software GmbH

JET-Software entwickelt und vertreibt seit 1986 Software für die Datenverarbeitung für gängige Betriebssysteme wie BS2000/OSD, z/OS, z/VSE, UNIX & Derivate, Linux und Windows. Benötigte Portierungen werden bei Bedarf realisiert.

Wir unterstützen weltweit über 20.000 Installationen. Zu unseren langjährigen Referenzen zählen deutsche Bundes- und Landesbehörden, Sozial- und Privatversicherungen, Landes-, Privat- und Großbanken, nationale und internationale Dienstleister, der Mittelstand sowie Großunternehmen.

The publisher indicated in each case (see company info by clicking on image/title or company info in the right-hand column) is solely responsible for the stories above, the event or job offer shown and for the image and audio material displayed. As a rule, the publisher is also the author of the texts and the attached image, audio and information material. The use of information published here is generally free of charge for personal information and editorial processing. Please clarify any copyright issues with the stated publisher before further use. In case of publication, please send a specimen copy to service@pressebox.de.
Important note:

Systematic data storage as well as the use of even parts of this database are only permitted with the written consent of unn | UNITED NEWS NETWORK GmbH.

unn | UNITED NEWS NETWORK GmbH 2002–2024, All rights reserved

The publisher indicated in each case (see company info by clicking on image/title or company info in the right-hand column) is solely responsible for the stories above, the event or job offer shown and for the image and audio material displayed. As a rule, the publisher is also the author of the texts and the attached image, audio and information material. The use of information published here is generally free of charge for personal information and editorial processing. Please clarify any copyright issues with the stated publisher before further use. In case of publication, please send a specimen copy to service@pressebox.de.