Fuzzy-Datenanalyse Neuro-Fuzzy-Systeme Zur Homepage English page

Neuronale Netze und Fuzzy-Systeme

Unsicherheit und Vagheit
in wissensbasierten Systemen

Data Mining

In Zusammenarbeit mit der Data-Mining-Gruppe des Forschungszentrums Ulm der Daimler-Benz AG arbeiten wir an Methoden zur Extraktion von Wissen aus Datenbanken (knowledge discovery in data bases). Unser Hauptinteresse gilt zur Zeit dem Lernen in probabilistischen und possibilistischen Netzen, der Induktion von Entscheidungsbäumen und der Bestimmung von Assoziationsregeln.

Beim Lernen von Schlußfolgerungsnetzen besteht das Problem darin, eine Zerlegung einer mehrdimensionalen Wahrscheinlichkeits- oder Possibilitätsverteilung in Verteilungen auf niedrigdimensionalen Teilräumen zu finden, durch die die Gesamtverteilung möglichst gut angenähert wird. Dazu wurde der Softwareprototyp INES (Induction of NEtwork Structures) etnwickelt, der auf dem K2 Algorithmus von Cooper und Herskovits beruht.

Entscheidungsbäume sind eine verbreitete Form von Klassifikatoren, d.h. von Verfahren, die einen Fall oder ein Objekt aufgrund seiner Merkmale einer Klasse zuordnen. Bei der Induktion von Entscheidungsbäumen wird versucht, aus vorklassifizierten Datensätzen automatisch einen Entscheidungsbaum abzuleiten. In den bekannten Verfahren werden Maße für die Auswahl von Testmerkmalen meist aus der Wahrscheinlichkeits- oder Informationstheorie abgeleitet, es ist aber auch möglich, hier die Possibilitätstheorie heranzuziehen. Eine Erweiterung des bekannten Entscheidungsbaumlerners C4.5 um possibilistische Maße liegt bereits vor.

Das Bestimmen von Assoziationsregeln findet vor allem in der Bonddatenanalyse Verwendung. Durch Assoziationsregeln werden Verbundkäufe dargestellt, deren Kenntnis zur Umsatzsteigerung ausgenutzt werden kann. Das Problem besteht hier vor allem in der Auswahl möglichst aussagekräftiger Regeln, da die bekannten Verfahren sehr viele und zum großen Teil uninteressante Regeln liefern.

Data Fusion

In dieser von der EU im Rahmen des IT-Programms vom 1. Mai 1996 bis zum 31.10.1999 geförderten Arbeitsgruppe befassen wir uns mit dem Problem der Kombination eventuell widersprüchlicher und partiell inkonsistenter Informationen, wie sie von verschiedenen heterogenen Informationsquellen unterschiedlicher Zuverlässigkeit geliefert werden. In Situationen, in denen Information unvollständig und impräzise ist, erscheinen Standardmodelle der Data Fusion, die auf probabilistischen Modellen beruhen, als nicht immer ausreichend, um das Kombinationsproblem auf geeignet Weise darzustellen. Abhängig von der Art der verfügbaren Information ist es daher sinnvoll, auch andere Ansätze zu analysieren, wie sie sich zum Beispiel aus Shafer's Evidenztheorie (Belief-Funktionen), der Possibilitätstheorie und der Theorie der oberen und unteren Wahrscheinlichkeiten ergeben. Außerdem können eher qualitative Repräsentationsformen wie nicht-monotone Logiken untersucht werden.

Ziel der Arbeitsgruppe ist es, die Gemeinsamkeiten und Unterschiede der Probleme von Database Fusion, Expert Opinion Pooling und Sensor Fusion zu klären, um dann zu analysieren, wie die oben genannten Theorien zur Lösung dieser Probleme herangezogen werden können. Entsprechende Ergebnisse sollen schließlich dazu benutzt werden, um die theoretische Fundierung und praktische Anwendbarkeit diverser Konzepte der Data Fusion weiterzuentwickeln und um in konkrete industrielle Applikationen integriert zu werden.

Für weitere Informationen wenden Sie sich bitte an Prof. Dr. Rudolf Kruse oder Christian Borgelt.