UNI / FIN / IKS Arbeitsgruppe Computational Intelligence |
News-Archiv |
Seminar Clustering AlgorithmsSommersemester 2017 ÜbersichtAktuellesAllgemeinesAuf dieser Seite finden Sie verschiedene Informationen zum Seminar "Clustering Algorithms", das im Sommersemester 2017 von Pascal Held und Christian Braune an der Otto-von-Guericke-Universität Magdeburg gehalten wird. Diese Seite wird im Laufe des Semesters aktualisiert. Inhalte des SeminarsClustering, also das unüberwachte Kategorisieren von Daten, ist ein Prozess, der in vielen Bereichen der Informatik Anwendung findet- die reine Datenanalyse ist dabei nur der offensichlichste. Viele verschiedene Klassen von Clusteringalgorithmen existieren heutzutage, die alle mehr oder weniger gut auf verschiedenen Arten von Daten funktionieren. Das Verständnis, was ein Cluster eigentlich ist, unterscheidet sich dabei von einem zum anderen Verfahren teilweise ebenso deutlich wie die Menge und Art von Vorwissen über die Daten, die als Parameter an den jeweiligen Algorithmus übergeben werden müssen. In diesem Seminar sollen in der Gruppe verschiedene Clusteralgorithmen erarbeitet und beschrieben werden, sowie anhand von Beispielen Stärken und Schwächen der Algorithmen aufgezeigt werden. Dabei werden wir versuchen sowohl auf verschiedene Arten von Daten (statische, dynamische, ... ) einzugehen sowie verschiedene Klassen (prototypenbasiert, probabilistisch, dichtebasiert, hierarchisch, ...) von Clusteralgorithmen vorzustellen. VoraussetzungenGrundlagen der Informatik / Algorithmen und Datenstrukturen Kenntnisse in Vektorrechnung und Grundlagen der Stochastik sind sicherlich von Vorteil, aber nicht zwingend notwendig. TeilnehmerkreisBis zu 18 Studenten der Informatik und interessierte Studierende anderer Fachrichtungen. Alle Teilnehmer werden gebeten sich über den FIN Registration Service zu anzumelden. Sollte die Teilnehmergruppe bereits voll sein, bitte auf der Warteliste eintragen. SeminarleiterBei Fragen schreibt uns einfach eine Email:
Organisatorische Regelungen für den TeilnahmescheinJe nach Wunsch des Studenten gibt es für das Seminar entweder 3 CP (Bachelor/Master: als wissenschaftliches Seminar) bzw. 5 oder 6 CP (Bachelor: FIN-SMK oder Master: als wissenschaftliches Seminar) (mit jeweils angepassten Anforderungen). Anforderung 3 CP
Anforderung 5/6 CP
Beim ersten Termin werden die Themen (zu bearbeiten in 2er-Gruppen) vergeben. Wer sich zuerst angemeldet hat, darf zuerst ein Thema (s.u.) auswählen. Wer zum ersten Termin fehlt, geht evtl. leer aus, wenn sich ein Nachrücker den Platz schnappt. Termine und Räume
Weitere Termine/Vorträge:
Zusätzliche UnterlagenApi-ProgrammierprojektIhr könnt euer Programmierprojekt entweder als Python Funktion oder als ausführbares Konsolenprogramm implementieren. Python-Funktiondef einfaches_clustering(data, arg1, arg2, ...): foo() bar() dark_magic() return list_of_labels def tolles_clustering_mit_visualisierung(data, arg1, arg2, ...): foo() bar() dark_magic() return list_of_labels, list_of_image_filenames data ist dabei eine übergebene numpy-Matrix, wobei jede Spalte einem Attribut und jede Zeile einem Datenitem entspricht. Mit Wenn ihr eine Visualisierung anbieten wollt, könnt ihr diese in Grafikdateien (vorzugsweise PNG) in den temporären Ordner schreiben und die Pfade zu den Bildern als String-Liste mit zurückgeben. KommandozeilentoolAufruf:[euer Programmaufruf] [ARFF-File] [Arg1] [Arg2] ... Den gewünschten Programmaufruf könnt ihr uns mitteilen. Die Argumente brauchen wir natürlich auch, damit wir die Oberfläche entsprechen konfigurieren können. ARFF-Files sind CSV-Dateien mit ein paar Header Informationen. Eine Beispieldatei stellen wir gerne zur Verfügung. Da in der letzten Spalte die Ground-Truth-Label stehen, dürft ihr diese Spalte in eurem Algorithmus natürlich nicht benutzen. ;) erwartete Programmausgaben
Beispiel: 1 1 2 2 3 3 3 # Image: /tmp/foo/bar.png ThemenProgrammierprojekte:
Liste von "verbotenen" Algorithmen (im wesentlichen die, die zu den Terminen besprochen werden):
Bisherige Gruppen/Themen:
Fun Stuff
Verweise auf andere Webseiten
|