AAnhang

A.1Iris-Daten

Einer der Standard-Testdatensätze im Data Mining ist der sogenannte Iris-Datensatz. Diese Daten gehören zu den Beispieldatensätzen von WEKA. Edgar Anderson10 sammelte Daten für folgende Schwertlilienarten:

  • Iris Setosa,
  • Iris Virginica,
  • Iris Versicolor.

Der Iris-Datensatz besteht aus jeweils 50 Beobachtungen dieser drei Arten von Schwertlilien, von denen jeweils vier Attribute der Blüten erfasst wurden, und zwar jeweils die Länge und die Breite des Sepalum (Kelchblatt) und des Petalum (Kronblatt). Die Daten bestehen also aus den Attributen:

  1. sepal length in cm
  2. sepal width in cm
  3. petal length in cm
  4. petal width in cm
  5. class Iris Setosa, Iris Versicolor, Iris Virginica

Die Daten liegen im sogenannten arff-Format vor, welches ...

Get Data Mining, 2nd Edition now with the O’Reilly learning platform.

O’Reilly members experience books, live events, courses curated by job role, and more from O’Reilly and nearly 200 top publishers.