Computational-Intelligence

Old News

Information available in German only.

Seminar Classification Algorithms

Wintersemester 2016/2017

Übersicht

Allgemeines

Auf dieser Seite finden Sie verschiedene Informationen zum Seminar "Classification Algorithms", das im Wintersemester 2016/2017 von Christian Braune und Pascal Held an der Otto-von-Guericke-Universität Magdeburg gehalten wird. Diese Seite wird im Laufe des Semesters aktualisiert.

Inhalte des Seminars

Klassifikation ist ein Teilbereich der intelligenten Datenanalyse, bei dem das Ziel ist, anhand von Trainingsbeispielen ein Modell zu erlernen. Solch ein Modell soll dann in der Lage sein, neue und unbekannte Objekte korrekt in die bekannten Klassen einzuordnen. Hierfür existieren viele verschiedene Verfahren, die Strukturinformationen aus den vorhandenen Daten unterschiedlich ausnutzen, um zu einem Ergebnis zu kommen.

In diesem Seminar sollen in der Gruppe verschiedene Klassifikationsalgorithmen erarbeitet und beschrieben werden, sowie anhand von Beispielen Stärken und Schwächen der Algorithmen aufgezeigt werden. Dabei werden wir versuchen sowohl auf verschiedene Arten von Daten (statische, dynamische, ... ) einzugehen sowie verschiedene Klassen (überwacht, teilüberwacht, ...) von Klassifikationsgorithmen vorzustellen.

Voraussetzungen

Grundlagen der Informatik / Algorithmen und Datenstrukturen Kenntnisse in Vektorrechnung und Grundlagen der Stochastik sind sicherlich von Vorteil, aber nicht zwingend notwendig.

Teilnehmerkreis

Etwa 15-20 Studenten der Informatik und interessierte Studierende anderer Fachrichtungen.

Alle Teilnehmer werden gebeten sich über den FIN Registration Service zu anzumelden.

Organisatorische Regelungen für den Teilnahmeschein

Die Veranstaltung kann als wissenschaftliches Seminar im Bachelor (3 CP) oder Master (6 CP) angerechnet werden. Außerdem ist eine Anrechnung als FIN-SMK (5 CP) möglich. Für 3 CP wird eine regelmäßige Teilname an den Seminarterminen sowie aktive Mitarbeit während des Seminars und das halten eines Vortrags zu einem der unten genannten Themen erwartet (Die Mitarbeit wird bewertet. Das Seminar ist recht lese-intensiv!). Für 5 oder 6 CP ist zusätzlich ein Programmierprojekt (plus Vorstellung) nötig.

Termine und Räume


WochentagZeitRaumBeginnDozent
SeminarDienstag13:00-15:00G29-33611.10.2016Christian Braune / Pascal Held
zurück zum Seitenanfang

Weitere Termine/Vorträge:

ThemaTerminVortragende 
Einführung11.10.2016Christian Braune, Pascal Held 
k-NN, Distanzmaße18.10.2016Christian Braune, Pascal Held 
Feature Selection25.10.2016Simon Parlow, Christian Buss 
Decision Trees01.11.2016Jonathan Kloss, Alexander-Maurice Schmidt 
Bayes Classifier08.11.2016Oskar Kirmis, Florian Koch 
LDA / QDA15.11.2016Tetiana Lavynska, Jan-Ole Perschewski 
LLM / SVM22.11.2016Mitch Köhler, Michelle Bieber 
Label Propagation29.12.2016Philipp Bergt, Martin Wieczorek 
S3VM06.12.2016Florian Bethe. Arne Herdick 
Active Learning13.12.2016David Schulte, Annika Niemann 
Ensemble Methods03.01.2017Angelika Ophagen, Paul Stang 
Finale10.01.2017  
Projektvorstellung 117.01.2017  
Projektvorstellung 224.01.2017  
zurück zum Seitenanfang

Zusätzliche Unterlagen

Api-Programmierprojekt

Ihr könnt euer Programmierprojekt entweder als Python Funktion oder als ausführbares Konsolenprogramm implementieren.

Python-Funktion
def einfaches_klassifizieren_training(data, label, arg1, arg2, ...):
    foo()
    bar()
    dark_magic()
    generiere_modell()
    return modell()

def einfaches_klassifizieren(modell, daten, arg1, arg2, ...):
    label = model.predict(daten)
    return label()

data ist dabei eine übergebene numpy-Matrix, wobei jede Spalte einem Attribut und jede Zeile einem Datum entspricht. Mit data[0,0] kann darauf zugegriffen werden. Alle weiteren Parameter könnt ihr beliebig wählen und uns dann entsprechend mitteilen, so dass wir die zugehörigen Eingaben im System hinterlegen können.

Wenn ihr eine Visualisierung anbieten wollt, könnt ihr diese in Grafikdateien (vorzugsweise PNG) in den temporären Ordner schreiben und die Pfade zu den Bildern als String-Liste mit zurückgeben.

Kommandozeilentool
Aufruf:
[euer Programmaufruf] [ARFF-File] [Arg1] [Arg2] ...

Den gewünschten Programmaufruf könnt ihr uns mitteilen. Die Argumente brauchen wir natürlich auch, damit wir die Oberfläche entsprechen konfigurieren können.

ARFF-Files sind CSV-Dateien mit ein paar Header Informationen. Eine Beispieldatei stellen wir gerne zur Verfügung.

Da in der letzten Spalte die Ground-Truth-Label stehen, dürft ihr diese Spalte in eurem Algorithmus natürlich nicht benutzen. ;)

erwartete Programmausgaben
  • Liste der Labelzuordnung (ein Label, dann neue Zeile, dann nächstes Label ...)
  • eventuell erzeugte Bilder mit: # Image: [Pfad]

Beispiel:

1
1
2
2
3
3
3
# Image: /tmp/foo/bar.png

Themen

zurück zum Seitenanfang

Verweise auf andere Webseiten

zurück zum Seitenanfang
en lang icon de lang icon Printable View - Recent Changes
Page last modified on November 15, 2016, at 12:40 PM by braune