Kategorien
Daten

Datenverdichtung

Um aus den Daten Wissen erzeugen zu können, müssen diese verdichtet werden. Das bedeutet, wir möchten uns nicht mehr mit Einzelfällen beschäftigen, sondern abstraktere und damit allgemeingültigere Aussagen machen. Es geht also nicht mehr darum, sagen zu können in diesem Garten hat es 441 Gänseblümchen (Datum), in dem daneben hat es 398 Gänseblümchen (Datum) etc. Jetzt geht es darum zu sagen, in den Gärten wachsen zwischen 0 und 1235 Gänseblümchen oder durchschnittlich wachsen in einem Garten 361 Gänseblümchen. Das sind Informationen. Solche Informationen werden mithilfe statistischer Methoden gewonnen. Wie in dem hier gezeigten Beispiel die Spanne und das arithmetische Mittel. Die Statistik erlaubt es auch verschiede Größen in Beziehung zu setzen. Also könnte man z. B. herausfinden, ob die Zahl der Gänseblümchen im Garten mit der Steigung im Garten zusammenhängt. Hier ergeben sich für Knowledge Science Bezüge zur Statistik und zu Data Science und ein Knowledgescientist sollte entscheiden können, welche Verfahren und Techniken anzuwenden sind, um eine Fragestellung beantworten zu können. Im Vergleich zum Statistiker und Datascientist ist es für Knowledgescientist wichtig, aus seinem Fachwissen der Bezugsdisziplin die richtigen Fragen aufwerfen zu können.