Zum Thema

:Brutus :stabbed :Caesar → Zeitabhängige Daten

Oder Reifizieren vs. RDF-Star. Oder Davidsonsche Ereignissemantik beim Modellieren.

Ich glaube obiges Beispiel mit Caesar habe ich aus John Sowas „Knowledge Representation“, dass ich leider verliehen und nie zurückbekommen habe, darum fehlt die genau Seitenangabe.

John Sowa beschreibt dort soweit ich mich erinnere, dass die in vielen Einführungen in die formale Logik benutzte naive Darstellung von z.B. Brutus Mord an Caesar als stabbed(Brutus, Caesar) wenig nützlich ist. Eine Frage wie „Wann hat Brutus Caesar erstochen?“ lässt sich hiermit nicht beantworten. Für solche zusätzlichen Informationen müssen wir den Vorgang als ein eigenes Individuum, als ein Ereignis darstellen, nur so können zusätzliche Informationen dargestellt werden. 

Diese Art, ein Ereignis als eigenes Individuum darzustellen wurde in den 60ern vor allem von Donald Davidson bekannt gemacht. Er postuliert, dass jedes Aktionsverb eine Handlung, ein Ereignis darstellt, und dieses Ereignis entsprechend dargestellt werden muß. In der Sprachverarbeitung (NLP) wird das als Reifizieren bezeichnet.

Das verwirrenderweise „reification“ genannte Syntaxschnipsel von RDF, dass es erlaubt, ein Triple als „Ding“, als Ziel eines Attributes zu behandeln ist für mich keine Reifizierung in obigem Sinne. Und die oft getätigte Aussage, dass Reifizierung in RDF eine schlechte Idee sei, bezieht sich auf diese Syntax, nicht auf die Idee der Reifizierung  bzw. die zugrundeliegende Ereignissemantik.

Um einfacher über die RDF-Reifizierungssyntax zu schreiben nutze ich hier die in der Entwicklung befindliche Syntax RDF-Star, die Anfangs auf eine reine Vereinfachung der RDF-Reifizierung ausgelegt war, wenn sie auch jetzt leicht erweitert wird.

Trotzdem, die einfache Form von RDF-Star erlaubt eine Aussage über ein Triple, ganz wie in der klassischen Reifizierung, nur eleganter zu schreiben: <<:Brutus :stabbed :Caesar>> :ptim "-0044-03-15T00:00:00"^^xsd:dateTime.

Dies könnte eine Möglichkeit sein, das naive Model mit mehr Informationen auszustatten, doch meiner Meinung nach vermischt es Modellierung und Metamodellierung.

„Der Mord“ an Caesar ist ein Teil der zu modellierenden Welt (Uiniverse of Discourse, UoD), was man schon daran sieht, dass wir im normalen Sprachgebrauch so darüber sprechen. Ganz ähnlich wie wir über „meine Freundschaft mit X“ und „meinen Termin mit Kunden X“ sprechen.

Und genau so sollte solch ein Geschehen auch modelliert werden, als eigenes Individuum in der Modellsprache, sei es formale Logik oder RDF.

RDF-Reifizierung oder RDF-Star spielt meiner Meinung nach eine wichtige Rolle bei Meta-Informationen über ein Triple. Sowohl für die Herkunft als auch für den Moment der Eingabe (Transaction Time), und den Editor einer Information kann RDF-Star eine gute Syntax liefern, ohne die Modellierung des UoD zu belasten.

Mehr Triple durch direkte Modellierung der Reifizierung?

Ein Gegenargument dagegen, ein solches Geschehen in RDF als Individuum darzustellen, ist „wir brauchen dann viel mehr Triple“, was zu einer schlechteren Performance führen kann.

Und für die einfache Darstellung stimmt das auch: wir brauchen mindestens zwei statt einem Triple also 100% mehr Triple. Das ist sehr viel und eine daraus möglicherweise erwachsende Performanceverschlechterung ein Grund, diese an sich korrekte Modellierung zu unterlassen, 

Aber sobald wir mehr Informationen über das Geschehen brauchen, wird der Unterschied zwischen beiden Lösungen immer geringer. Habe ich vier Zusatzinformationen so steht der Unterschied nur noch bei fünf zu sechs Tripeln in der Darstellung, was kaum noch einen entscheidenden Einfluss auf die Performance haben wird.

Dafür kann ich mit korrekter Modellierung den ganzen Vorgang darstellen, denn schließlich ist es keineswegs so, dass nur Brutus auf Caesar eingestochen hat. Es gab schließlich mindestens 20 Caesarmördern, was in dem simplen :Brutus :stabbed :Caesar schlicht nicht darstellbar ist, auch nicht mit RDF-Star.

Gefahren durch Reifizierung

Verben durch Nomen zu ersetzen, wird z.B. im Coaching auch als Nominalisierung bezeichnet, und eher mißtrauisch betrachtet. Wenn jemand sagt, er "hat" Angst, dann verbirgt diese Aussage das Verb und den Agenten: er ängstigt sich. Und die Angewohnheit, dieses sich-ängstigen als Ding zu bezeichnen, es zu reifizieren, kann es schwieriger machen mit dem sich fürchten aufzuhören, denn es gibt ja dieses schlimme "Ding" namens Angst, dass "man" nicht loswird.

Ein etwas anderes gelagerter Fall ist ein "Verdächtiger", der ja eher ein "Verdächtigter" ist, d.h. in dieser Reifikation des "Verdächtigen" wird die Eigenschaft der Person zugeordnet, die verdächtigt wird, statt der Person, die ihn verdächtigt. So kann "ein Verdacht" an jemand unschuldigem kleben bleiben, weil der - fälschlich - Verdächtigende in der Sprache ausgeblendet wird.

Ein Freund hat mich darauf gebracht, eine Reifizierung als einen Verwaltungsakt zu sehen: ein "Umzug" mag als Ding behandelt werden, als Reifikation von "Herr Maier zieht heute um", aber diesen "Umzug" mit der Realität zu verwechseln kann zu falschen Erwartungen führen. Ich bin selber schon über einen Zeitraum von einem halben Jahr "umgezogen", und Post an eine von meinen Adressen wäre unter Umständen einen Monat lang nicht gelesen worden, und ein Datenbankeintrag "Umzug von X am Y nach Z" kann zu einer falschen Adressierung führen.

Trotzdem halte ich die Ereignissemantik für eine nützliche Art, Vorgänge zu modellieren. Solange man sich im Klaren darüber bleibt (!), dass man immer noch Teile der Realität ausblendet. Verben zu Dingen machen heißt auch, alle Veränderungen zwischen diesen Dingen auszublenden. Ein wenig wie die schlechte Angewohnheit, diskrete, stundenweise erhobene Messpunkte mit einer Linie zu verbinden, und damit zu suggerieren, man wüsste, was in der Zeit dazwischen gemessen worden wäre. Ein Performancemessung jede Minute sagt mir nichts verbirgt unter Umständen die wichtigen Speicherengpässe zwischen diesen Messzeitpunkten.

Literatur

Wir verwenden Cookies auf unser Webseite um die Benutzererfahrung zu verbessern.

Es werden keine Dienste zur Analyse Ihres Verhaltens genutzt, wir tracken sie nicht.