„Die Analyse von Echtzeit-Daten stellte in der Vergangenheit eine große Herausforderung für Unternehmen dar, weil für das Zusammenführen von Stream-Verarbeitung in Echtzeit und Batch-Analyse eine komplexe Lambda-Architektur nötig war. Mit einer einzigen Storage-Engine, die beide Anforderungen abdeckt, erleichtert Kudu diese Architektur erheblich”, so Charles Zedlewski, Senior Vice President of Products bei Cloudera. „Anspruchsvolle Workloads, die zunehmend auch neue Machine-Learning-Modelle enthalten, können Cyber-Bedrohungen identifizieren, Wartungsprobleme vorhersagen und für alle Arten von Online-Berichten die Genauigkeit erhöhen.”
Kudu wurde von Grund auf neu entwickelt, um sich Innovationen der Hardware-Landschaft zunutze zu machen, beispielsweise immer günstigeren Flash- und Arbeitsspeicher. Als eigenständige Storage-Engine hat Kudu sich bereits für den geschäftskritischen Produktiveinsatz in Clustern mit Hunderten von Nodes und vielen Millionen Einsätzen pro Sekunde empfohlen. Kudu wurde speziell mit Blick auf Anwendungsbereiche gebaut, in denen schnelle Analyse-Scans im großen Maßstab benötigt werden, gleichzeitig unterstützt es rasend schnell anfallende Daten. Dies ist notwendig für den Umgang mit Zeitserien-Daten, für die Analyse von Maschinendaten, Online-Berichte oder die Anforderungen anderer analytischer oder operativer Workloads.
„Apache Kudu ist ein hervorragendes Beispiel dafür, wie sich die Apache-Hadoop-Plattform von einem eng umrissenen Set aus Apache-Projekten zu einer Mischung und Verschmelzung von Open-Source- und proprietären Technologie entwickelt hat, die im Wesentlichen eine Arbeitsumgebung für Big Data bilden”, so Tony Baer, Principal Analyst bei Ovum. „Kudu umgeht die Hürden komplexer Lambda-Architekturen und adressiert Anwendungsfelder mit sich schnell ändernden Daten, wo es enorm wichtig ist, die Datenbank schnell modifizieren und aktualisieren zu können.”
„Capgeminis Kunden werden bei der Nutzung von Big Data, Analytics und Data Science immer versierter. Damit ist auch der Bedarf an Echtzeit-Analyse-Workloads für Big und Fast Data, einschließlich IoT- und Streaming-Daten, zu einem immer zentraleren Thema geworden”, so Anne-Laure Thieullent, VP Global Big Data Solutions, Insights & Data bei Capgemini. „Die allgemeine Verfügbarkeit von Kudu ist ein großer Schritt nach vorn. Unsere Klienten sind damit in der Lage, noch wichtigere, erkenntnisorientierte Prozesse auf ihren Business-Analytics-Plattformen laufen zu lassen. Dies wird ihren Weg zur Digitalen Transformation beschleunigen.”
Weitere Verbesserungen in Cloudera 5.10
Zusätzlich zu Kudu erweitern Cloudera 5.10 (und der neu veröffentlichte Cloudera Director 2.3) weiterhin die Möglichkeiten für den Unternehmenseinsatz, etwa für Cloud-Deployments, und verbessern die Kosteneffizienz in diesen Umgebungen. Zu den Verbesserungen zählen:
- Geringere Betriebskosten für die Batch-Verarbeitung kurzzeitiger Workloads, verbunden mit besserer Performance von Apache Hive auf Amazon S3.
- Umfassendere Möglichkeiten für Auditing und Datenherkunft in der Cloud, mit Unterstützung von Single-Cluster für Cloudera Navigator auf Amazon S3.
- Schnellere Einrichtung erster Use-Case und lauffähiger Deployments über verschiedene Cloud-Umgebungen
Lesen Sie unsere Blogs: cloudera.com/engblog und vision.cloudera.com
Folgen Sie uns auf Twitter: twitter.com/clouderade
Besuchen Sie uns auf Facebook: facebook.com/cloudera
Treten Sie der Cloudera Community bei: cloudera.com/community
Public Footprint GmbH
Web: www.public-footprint.de