Kategorien
Daten

Datenverdichtung

Um aus den Daten Wissen erzeugen zu können, müssen diese verdichtet werden. Das bedeutet, wir möchten uns nicht mehr mit Einzelfällen beschäftigen, sondern abstraktere und damit allgemeingültigere Aussagen machen. Es geht also nicht mehr darum, sagen zu können in diesem Garten hat es 441 Gänseblümchen (Datum), in dem daneben hat es 398 Gänseblümchen (Datum) etc. Jetzt geht es darum zu sagen, in den Gärten wachsen zwischen 0 und 1235 Gänseblümchen oder durchschnittlich wachsen in einem Garten 361 Gänseblümchen. Das sind Informationen. Solche Informationen werden mithilfe statistischer Methoden gewonnen. Wie in dem hier gezeigten Beispiel die Spanne und das arithmetische Mittel. Die Statistik erlaubt es auch verschiede Größen in Beziehung zu setzen. Also könnte man z. B. herausfinden, ob die Zahl der Gänseblümchen im Garten mit der Steigung im Garten zusammenhängt. Hier ergeben sich für Knowledge Science Bezüge zur Statistik und zu Data Science und ein Knowledgescientist sollte entscheiden können, welche Verfahren und Techniken anzuwenden sind, um eine Fragestellung beantworten zu können.

Im Vergleich zum Statistiker und Datascientist ist es für Knowledgescientist wichtig, aus seinem Fachwissen der Bezugsdisziplin die richtigen Fragen aufwerfen zu können, denn Fragen, die nicht gestellt werden, können auch noch so viele Daten nicht beantworten. Das eines der vielen Probleme in der BigData-Diskussion. Es geht aber auch um andere Fragestellungen, nämlich der Auswahl der richtigen Methode und der richtigen Interpretation der Ergebnisse. In den meisten Fällen bietet zum Beispiel die Statistik mehrere Möglichkeiten an, die Daten zu verdichten. Bei der Methodenauswahl steht die Knowledge Science vor einem Dilemma. Auf der einen Seite gibt es sehr ausgeklügelte Methoden, die in der Lage sind, Daten möglichst effektiv zu verdichten, auf der anderen Seite müssen die Ergebnisse aber auch vermittelbar bleiben. Menschen, die mit der Materie nicht so vertraut sind, sollten eine Chance haben zu verstehen, wie das Wissen entstanden ist. Und eben das wird schwieriger, wenn die Verfahren komplexer werden.