Contact
QR code for the current URL

Story Box-ID: 259490

IBM Deutschland GmbH IBM-Allee 1 71139 Ehningen, Germany http://www.de.ibm.com
Contact Ms Simone Endruweit +49 7031 164206
Company logo of IBM Deutschland GmbH
IBM Deutschland GmbH

Fraunhofer und IBM präsentieren intelligente Suchtechnologie Smart Semantics

Unternehmen der Zukunft profitieren von smarter Suche

(PresseBox) (Stuttgart, )
Das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS stellt seine intelligente Suchtechnologie "Smart Semantics" vor. Sie basiert auf UIMA, der von IBM initiierten und entwickelten Architektur zur Analyse unstrukturierter Daten. In Kürze werden modellbasierte Komponenten für die maschinelle Klassifizierung von Dokumenten sowie für die automatische Schlagwortgenerierung und Namenserkennung zur Verfügung stehen . Durch die Verknüpfung der Smart Semantics mit dem UIMA-Framework wollen das Fraunhofer IAIS und IBM die hocheffizienten Suchtechnologien auch kleinen und mittelständischen Unternehmen zugänglich machen.

Das Fraunhofer IAIS erforscht und entwickelt innovative Systeme, um Daten zu analysieren und Informationen zu erschließen. Als jüngstes Ergebnis dieser Arbeit bringt das Fraunhofer IAIS jetzt Smart Semantics auf den Markt. Dabei handelt es sich um intelligente Softwarekomponenten, die die Bedeutung aus unstrukturierten Daten wie z.B. Webseiten oder Dokumenten durch modellbasierte Inhaltsanalysen erkennen. Im Gegensatz zu stichwort- oder regelbasierten Verfahren, wie sie die bekannten Suchmaschinen im Internet nutzen, verwenden Smart Semantics lernende und mustererkennende Verfahren. Sie ersparen dem Nutzer somit aufwändiges Filtern seiner Suchergebnisse.

Smart Semantics sind vefügbar für UIMA. Das Fraunhofer IAIS entschied sich für die von IBM initierte Architektur aufgrund der Offenheit, der Integrationsfreundlichkeit, der kostengünstigen Testmöglichkeiten und der Zuverlässigkeit des Frameworks. Außerdem will das Institut die große Verbreitung von UIMA im Unternehmensumfeld nutzen, um seine Bausteine zur intelligenten Informationserschließung auch kleinen und mittelständischen Unternehmen verfügbar zu machen, die bisher die hohen Investitionskosten für semantische Technologien scheuten.

KMU profitieren von Smart Semantics

"Gerade kleine und mittelständische Unternehmen konnten in der Vergangenheit aus Zeit- und Kostengründen nicht oder nur unzureichend Informationen aus unstrukturierten Daten berücksichtigen", so Andreas Schäfer, Business Development Manager am Fraunhofer-Institut für intelligente Analyse und Informationssysteme IAIS. "Mit Smart Semantics für UIMA wollen wir diese Herausforderung mit einem starken Technologie-Partner wie IBM angehen. Für Unternehmen ergeben sich dadurch nicht nur attraktive Möglichkeiten für ein besseres Informationsmanagement - wir arbeiten bereits heute mit Firmen zusammen, die mit Hilfe dieses Angebots neue Dienste und Geschäftsmodelle entwickeln."

"Die Menge an unstrukturierten Informationen schwillt immer weiter an, mit herkömmlichen Suchmethoden wird es für Unternehmen in naher Zukunft unmöglich sein, aus dieser Kakophonie des Wissens, die für sie geschäftsentscheidenden Inhalte herauszufiltern", so Thomas Hampp-Bahnmüller, Senior Software Engineer, IBM Deutschland Research & Development. "Die Lösung hierzu liefern intelligente neue Suchtechniken wie diejenigen des Fraunhofer IAIS. Dass unsere Architektur dazu beiträgt, dass clevere Lösungen wie die Smart Semantics Verbreitung finden, ist eine großartige Bestätigung unserer Strategie, UIMA als offene Plattform der Community zur freien Verfügung zu stellen."

Offene Architektur mit Hebelwirkung

Die Smart Semantic Komponenten können als Plug-Ins auf UIMA basierenden Technologien wie der IBM Suchlösung IBM Omnifind eingebunden werden. UIMA steht für "Unstructured Information Management Architecture" und bezeichnet ein maßgeblich im deutschen IBM Forschungs- und Entwicklungszentrum Böblingen entwickeltes Framework. UIMA ist ein offener OASIS Standard und zudem als Open Source Implementierung auf Apache verfügbar. Damit können beispielsweise Anwendungen zur Verarbeitung unstrukturierter Informationen erstellt werden, insbesondere natürlicher Sprache (Natural Language Processing, NLP).

Effizientere Suchtechnologien

Verfügbar sind bereits drei Smart Semantic Komponenten: "Site-Classifier", "Named-Entity-Recognizer" sowie der "Keyword-Extractor". Der Site-Classifier erlaubt die maschinelle Klassifikation ganzer Dokumente wie z.B. Webseiten. Nach einer Trainingsphase sind auf diese Weise z.B. Projekt-, Mitarbeiter- oder Produktseiten automatisch als solche erkennbar und für die effizientere Suche nutzbar (z.B. "Zeige alle Seiten, die den Begriff X enthalten und als Produktseite klassifiziert wurden"). Gegenüber konventionellen Verfahren haben lernende Verfahren den Vorteil, dass auch unbekannte Dokumente mit alternativen Begrifflichkeiten aufgrund ihrer Ähnlichkeit zu einem gelernten Modell klassifizierbar sind. Da auf diese Weise die Pflege von Stichwort-Listen oder Heuristiken zur statischen Klassifikation entfällt, sparen Unternehmen umfangreichen Wartungsaufwand.

Der Named-Entity-Recognizer identifiziert benannte Entitäten wie Personen, Organisationen, Orte und ermöglicht dadurch die Filterung von Dokumenten nach bestimmten Entitäten (z.B. "Zeige alle Seiten, die X und zusätzlich Personennamen enthalten"). Im Gegensatz zu herkömmlichen Verfahren erkennt die Smart Semantic-Komponente Bedeutungsunterschiede gleichlautender Begriffe, wie etwa die den Unterschied zwischen "Vogel" als Tier und "Vogel" als Personenname, in dem der inhaltliche Kontext des Begriffs berücksichtigt wird.

Der Keyword-Extractor ist eine Komponente, die statistisch signifikante Wörter aus Dokumenten extrahiert und diese z.B. für Tagclouds, für Wortvorschläge bei Suchanfragen oder als Zusatzinformationen in der Suchergebnisdarstellung bereitstellt.

Unternehmen können die Smart Semantics ab Herbst 2009 über IBM erwerben, weitere Komponenten sind bereits in Planung.

Fraunhofer IAIS

Das Fraunhofer IAIS erforscht und entwickelt innovative Systeme, um Daten zu analysieren und Informationen zu erschließen. Es realisiert einerseits Anwendungslösungen aus den Bereichen Data Mining, Business Intelligence oder High Resolution Management zur Optimierung von Produkten, Dienstleistungen und Prozessen. Zum anderen entwickelt das Institut wir Systeme, die große Datenmengen (Data Warehouses) durch innovative mediale Präsentation erschließen helfen (Wissensextraktion, interaktive Exploration, Wissensmanagement, Medienanalyse und Visualisierung).
The publisher indicated in each case (see company info by clicking on image/title or company info in the right-hand column) is solely responsible for the stories above, the event or job offer shown and for the image and audio material displayed. As a rule, the publisher is also the author of the texts and the attached image, audio and information material. The use of information published here is generally free of charge for personal information and editorial processing. Please clarify any copyright issues with the stated publisher before further use. In case of publication, please send a specimen copy to service@pressebox.de.
Important note:

Systematic data storage as well as the use of even parts of this database are only permitted with the written consent of unn | UNITED NEWS NETWORK GmbH.

unn | UNITED NEWS NETWORK GmbH 2002–2024, All rights reserved

The publisher indicated in each case (see company info by clicking on image/title or company info in the right-hand column) is solely responsible for the stories above, the event or job offer shown and for the image and audio material displayed. As a rule, the publisher is also the author of the texts and the attached image, audio and information material. The use of information published here is generally free of charge for personal information and editorial processing. Please clarify any copyright issues with the stated publisher before further use. In case of publication, please send a specimen copy to service@pressebox.de.