Skip to content

Das Drama der Relevanz, oder: Warum Offline-Kriterien nicht auf Online-Enzyklopädien angewandt werden sollten

20. Januar 2010

Der andauernden Löschdiskussion zwischen Inkludisten und Exkludisten fügt die Informationsarchitektin Regine Heidorn die Perspektive der Wissenschaft hinzu. In computergestützt arbeitenden Forschungsprojekten gestalten sich Relevanzkriterien ihrer Erfahrung nach anders: Dort zählt weniger die Qualität einzelner Artikel als die Gesamtheit der zur Verfügung stehenden Daten. Ich freue mich über den ersten Gastbeitrag auf digiom!


Von Regine Heidorn | Die Löschdiskussion der deutschsprachigen Wikipedia – in den letzten Monaten ein im Netz heiss diskutiertes Thema. Ganz neu ist das Phänomen auch nicht, es gab öfter Beschwerden über vermeintlich zu unrecht gelöschte Einträge. Der gesammelte Unmut spaltet sich in zwei Lager: Inkludisten und Exkludisten. Erstere vertreten den Standpunkt, da genügend Serverplatz zur Verfügung stünde, könnten unfertige oder noch nicht genug recherchierte Einträge erhalten bleiben. Auch als Aufforderung, die Einträge zu verbessern und damit als Anreiz zur Mitarbeit bei Wikipedia. Die Exkludisten dagegen argumentieren, bestehende Einträge müssten auch gepflegt und aktualisiert werden, das wäre nicht für jeden Eintrag möglich, die Nutzergemeinde sei zu klein. Daher sei es besser, Einträge, die nicht genügend ausgearbeitet seien oder den Relevanzkriterien von Wikipedia nicht gerecht werden, gleich zu löschen.

Ein wesentlicher Punkt wurde in der bisherigen Wikipedia-Diskussion, die sich in der deutschsprachigen Community zwischen Inkludisten und Exkludisten im Kreis dreht, kaum beachtet: Die Kriterien für Relevanz einer Online-Enzyklopädie sollten sich auch an der Online-Nutzung derselben ausrichten und mit deren Veränderungen und Ansprüchen wachsen. An dieser Stelle kann man vermuten, dass die Relevanzkriterien von Offline-Enzyklopädien aus und an den Nutzungsansprüchen erwuchsen. Und sicher u. a. von der Verfügbarkeit der Ressource Papier sowie erforderlichen Aktualisierungszyklen abhängen.

Diese banale Feststellung erhält Gewicht, wenn der Begriff „Online-Nutzung“ erweitert wird auf die wissenschaftliche Online-Nutzung, genau so, wie Offline-Enzyklopädien wissenschaftlich genutzt werden. Allerdings unterscheiden sich die Methoden wissenschaftlicher Online-Nutzung von denen der wissenschafltichen Offline-Nutzung und genau hier ist der Ansatzpunkt, der im Folgenden anhand eines Beispiels beleuchtet werden soll.

So war das mal: alle zwei Monate ein Band vom Brockhaus, alle gleich dick, alle zusammen im Gegenwert eines Gebrauchtwagens

So war das mal: alle zwei Monate ein Band vom Brockhaus, alle gleich dick, alle zusammen im Gegenwert eines Gebrauchtwagens

Soweit mir die Diskussion bekannt ist, geht es bei den konträren Standpunkten der In- und Exkludisten allein um Kriterien der Relevanz, nicht um tatsächliche Ressourcen-Probleme. Auch dem hartgesottenen Inkludisten ist klar, dass es unsinnige Beiträge gibt. Die Exkludisten dagegen argumentieren nicht mit einem Löschzwang aufgrund mangelnden Serverplatzes. Die künstliche Verknappung relevanten Wissens für Offline-Enzyklopädien, so arbiträr sie vom Gedanken des unbegrenzbaren Wissenshorizonts, wie ihn Popper formuliert hat, erscheinen mag, hatte in der Knappheit der Seiten zumindest eine materiell begründbare Grenze. Die Frage ist nun, inwieweit die Relevanzkriterien einer Offline-Enzyklopädie für eine Online-Ausgabe übernommen werden können. Und inwiefern die wesentlich erweiterte Verfügbarkeit der Ressource Serverplatz die Kriterien für relevante Inhalte beeinflusst.

Sofern es darum geht, als neues digitales Medium ein etabliertes analoges Medium zu verdrängen oder dieses in seinen Leistungen zu übertreffen, erscheint es nur konsequent, sich direkt am analogen Vorbild zu orientieren und den Beweis der Überlegenheit durch Übernahme der vorhandenen Relevanzkriterien anzutreten. Genau darum drehte sich die Wikipedia-Diskussion in den Anfängen. Diesem Stadium ist Wikipedia lange entwachsen und kämpft nun mit anderen Problemen: so zum Beispiel – stellvertretend für die Herausforderungen der alltäglichen Nutzung – mit der Widersprüchlichkeit der Kriterien (Vorsicht, Polemik).

Ein Blick auf die wissenschaftliche Nutzung zeigt ein anderes Bild: Ende 2009 fand am Deutschen Archäologischen Institut in Kooperation mit dem Exzellenzcluster Topoi ein Workshop zum semantischen Daten-Modell CIDOC-CRM statt. Aus dem Workshop möchte ich ein Projekt herausgreifen, um zu zeigen, in welchen Bereichen eine wissenschaftliche Nutzung von nutzergenerierten Inhalten im Internet stattfindet.

Einzug digitaler Methoden in die wissenschaftliche Methodologie

From Questions to Answers – Travelling from Perseus to Arachne and Anywhere“ (PDF, 3.8 MB) – bei diesem Projekt geht es um einen „einfachen Anwendungsfall“. Ein Historiker arbeitet an der Entwicklung des alten Pergamon. Um die Bedeutung der Befunde interpretieren zu können, folgt eine Recherche zu allen Nennungen von Pergamon in den unterschiedlichsten Quellen (Literatur, Funde, sonstige Artefakte, Museen etc.). Die Frage ist, wie maschinen-verwertbare Daten zu diesem Zweck vorgehalten werden können. Dafür kann unter anderem die archäologische Objektdatenbank Arachne verwendet werden. Um möglichst viele Quellen mit Nennungen unterschiedlichster Aspekte einzubeziehen, wurde in diesem Beispiel auch eine semantische Abfrage an Wikipedia einbezogen, in dem Fall über DBpedia, eine Plattform die ihrerseits strukturierte Daten aus Wikipedia ertrahiert und semantisch aufbereitet wieder zur Verfügung stellt.

Von der Nutzung solcher digitaler Methoden versprechen sich Wissenschaftler genauere und umfassendere Ergebnisse, als sie bisher möglich waren. Dieses Versprechen begründet sich in der Möglichkeit größerer Unabhängigkeit von Ressourcen (Reisen zu Archiven, begrenzte Bearbeitungszeit zwingt zur Eingrenzung der Forschungsfragen auf relevante Kriterien). Ähnlich dem Schritt von der Offline- zur Online-Enzyklopädie wird es nun möglich, virtuell mehr und umfangreichere Datenbanken und Archive als Forschungsgrundlage anzuzapfen. Sofern die Datengrundlage semantisch gründlich aufbereitet wurde, sind wesentlich komplexere Forschungsfragen über Datenbank-Queries in kürzerer Zeit möglich. Zusätzlich können mehrere Disziplinen über neutrale Beschreibungen miteinander verknüpft werden. Hier lösen sich die Grenzen von interdisziplinärer Forschung über transdisziplinäre zu disziplinneutraler Forschung auf.

Zurück zu den Anforderungen an Relevanzkriterien einer Online-Enzyklopädie: Eine digitale Enzyklopädie wird relevant bleiben, sofern sie sich den digitalen Nutzungsbedürfnissen anpasst. Für die in den Beispielen dargestellte Nutzung spielt es z. B. keine Rolle, ob die Befunde in einem exzellenten Artikel verfasst sind: sogar unfertige Artikel, die als Solche nicht gerade menschenlesbar sind, werden relevant, weil sie im semantischen Gerüst der Wikipedia maschinenlesbar ausgewertet werden können. Die Relevanzkriterien einer Online-Enzyklopädie sollten der Funktion als Wissensspeicher, auch für interdisziplinär verbundene Fragmente von Wissen, gerecht werden. Die Nutzung von Wikipedia in diesem Rahmen würde es der digitalen Enzyklopädie ermöglichen, das zu leisten, was auch der Brockhaus im analogen Bereich geleistet hat: eine Verbindung von Wissenschaft und Alltag herzustellen.

Und zwar nicht mehr einseitig kanonisiert durch eine geschlossene Redaktions- oder Admingruppe, sondern zu gegenseitigem Nutzen. Nicht nur könnte die Qualität von Wikipedia-Einträgen allgemein gehoben werden, indem Wissenschaftler mehr beitragen, weil sie gut auf die vorhandene semantische Struktur aufsetzen können. Es könnten auch andere fachlich Interessierte weltweit ihre Daten beitragen. Und wenn das nicht Wikipedia ist, dann wird eine andere Plattform diese offene Stelle besetzen.


Regine Heidorn ist seit April 2008 als Informations-Architektin für das Berliner Exzellenzcluster Topoi tätig. Nach philologischen, ethnologischen und kulturwissenschaftlichen Studien in Hessen und Norddeutschland, Radkurierfahrerei in Bremen und einer Ausbildung im Multimedia-Bereich in Berlin ist sie seit 2006 selbständig. Schwerpunkte: Informationsarchitektur, Webprogrammierung und digitale Geisteswissenschaften.
Website | Twitter


EDIT (JH): Die Bilder habe ich soeben ausgetauscht, beim Logo kann man laut Empfehlung von Zemanta auf Fair Use plädieren – DE-Wikipedians sehen das nicht so und habe meinen Blog auf ihre Watchlist gesetzt:

# Webseite mit Wikipedia-Inhalt: [129]
# Text oder Bildnutzung? Datei
# Quelle in der Wikipedia: Datei:Brockhenge.jpg Datei:Wikipedia-logo-de.png
# eingetragen von: Ersteintrag durch –smial 11:22, 23. Jan. 2010 (CET)
# mutmaßlicher Mangel: Direkteinbindung eines Fotos und des Wikipedia-Logos aus commons, keine Lizenznennung, keine Nennung des Fotografen, keine direkte Lizenverlinkung

Der Fotograf wurde genannt und verlinkt (jetzt nach der Änderung natürlich nicht mehr), allerdings hätte man dazu den Artikel bis zu Ende lesen müssen, um darauf zu stoßen. No Problem, kriegt halt die alte Offline-Konkurrenz die Credits.


Versiongeschichte des Beitrags:
version 0.1 15.1.10, 17.43 Ersterstellung RH
version 0.2 15.1.10, 20.36 Formulierung, Verständlichkeit, Erwähnung Popper, evtl. Beispiele JH
version 0.3 15.1.10, 21.10 Einarbeitung Kommentare JH, Entscheidung gegen Beispiele, Streichen eines Beispiels RH, JH
version 0.4 15.1.10, 21.21 Neuer 1. Absatz mit kurzer Erklärung der Löschdiskussion RH
version 0.4.1 15.1.10, 22.03 Überschrift: Das Drama der Relevanz, oder: Warum Offline-Kriterien nicht auf Online-Enzyklopädien angewandt werden dürfen JH
version 0.4.2 15.1.10, 22.14 Überschrift „sollten“ statt „dürfen“ RH
version 0.5 15.1.10, 22.27 Entscheidung, daß es so stimmt JH, RH
version 1.0 15.1.10, 22.40 Peer-Review passed
version 1.1 16.1.10, 11.11 Ergänzung eines maschinenlesbaren Abstracts JH
version 1.2 16.1.10, 11.30 Ergänzung einer Erklärung von DBpedia JH
version 1.3 20.1.10, 11.04 Ergänzung „Wissensspeicher für Fragmente von Wissen“ Don Dahlmann, Zwischenüberschrift JH, RH
version 1.4 20.1.10, 15.06 Ergänzung Verlinkung DD, Löschdiskussion User Magadan

Reblog this post [with Zemanta]
13 Kommentare leave one →
  1. 21. Januar 2010 12:34 pm

    Ein sehr interessanter Artikel. Folgende Aussagen finde ich besonders wichtig:

    Die Kriterien für Relevanz einer Online-Enzyklopädie sollten sich auch an der Online-Nutzung derselben ausrichten und mit deren Veränderungen und Ansprüchen wachsen.

    Die Relevanzkriterien einer Online-Enzyklopädie sollten der Funktion als Wissensspeicher, auch für interdisziplinär verbundene Fragmente von Wissen, gerecht werden.

    Die Nutzung von Wikipedia […] eine Verbindung von Wissenschaft und Alltag herzustellen.

  2. fatmike182 permalink
    21. Januar 2010 12:58 pm

    Soweit mir bekannt ist werden Beiträge ohnehin nahezu nie gelöscht — sie werden einfach für den User nicht sichtbar gemacht, wenn überhaupt auf andere Datenbanken ausgelagert. Auch aufgrund der relativ geringen Datenmenge kann es sich um kein Ressourcenproblem handeln.
    Dieses Ressourcenproblem hatte aber auch Brockhaus nicht – mit Leichtigkeit hätte ein weiterer Band eingeführt werden können…

    Worum gehts bei der Relevanzdebatte:
    – Administriebarkeit (Administratoren sind bei solchen Großprojekten unerlässlich, nur weil Trolle mehr Freizeit haben als Leute, die sinnvolle Artikel schreiben, soll sich die Trolldemokratie gegen faktunterstütztes Wissen nicht durchsetzen — in dem Fall muss ein Schlussstrich gezogen werden)
    – Selbstdarstellertum (da fängt dann auch die Kontroverse an, welche Blogger sind relevant, welche nicht — ich habe aber Verständnis dafür, dass nicht jeder aufgelistet wird. Man muss sich bewusst machen, dass das chaostheoretische Ausmaße hat. Von 100ten Bloggern würde man bei mehrere Millionen Bloggern landen; administrativ nicht bewältigbar. Auf der anderen Seite: 4.-Ligisten der deutschen Bundesliga haben da auch nichts verloren. Weiter geht das ganze über PR-Texte, die auf den Firmenwebsites 1:1 so abgelesen werden können. Das löst weiters die Folgedebatte aus, dass uninteressante Inhalte ohnehin nicht nachgeschaut werden, die aber mit dem Google-Ranking von Wiki, Einsparen einer Firmenwebsite, multiredundater Verwendung von Firmennamen international abgeblockt werden kann.
    – je mehr relevant ist, desto weniger relevant ist es (Wikipedia ist nicht teh net, es soll Ansprüche geben & es soll eine Ehre sein von der Wikipedia erfasst zu werden. Wie der Schlüssel von Offline-Medien auf Online-Medien umgerechnet werden soll gilt es zu diskutieren)

    Spannend zu dem Thema war die Diskussion im Metalab über Wikipedia & Löschdebatten mit einigen österreichischen (oder zumindest deutschsprachigen ;-)) Admins

    2 Tools die zur Überprüfung der Relevanz glaub ich auch von den Admins unter anderem verwendet werden kann ich ans Herz legen:
    Page hits, Portal hits http://wikistics.falsikon.de/latest/wikipedia/de/ (Menü rechts oben)
    Article traffic http://stats.grok.se/

  3. 21. Januar 2010 4:25 pm

    Danke🙂
    Noch eine Ergänzung: bei einer Erläuterung zu mobiler augmented reality (ortsbezogene Informationsebenen auf mobilen Geräten) fiel mir auf, daß viele dieser Anwendungen auf Wikipedia zugreifen. Prominenter Vertreter ist z. B. http://layar.com.
    Die Unterschiede in der Online-Nutzung zeigen sich nicht nur im wissenschaftlichen Bereich.

  4. 21. Januar 2010 7:14 pm

    mit Leichtigkeit hätte ein weiterer Band eingeführt werden können…

    Jein, solche Bände entstanden in jahrlanger Arbeit, und wenn der letzte rauskam, war der erste veraltet. Dann sollen die ja immer so schön von A bis Z durchlaufen – was, wenn es aber besonders viel Neues für M. und nix für A-B gab?

  5. 22. Januar 2010 10:23 pm

    @fatmike182
    Sicher sind auch diese Relevanzkriterien notwendig. Schwierig finde ich es allerdings, mit Page Hits oder Traffic Relevanz zu begründen. Rein wissenschaftlich können diese Maße nicht bemüht werden, da sie lediglich Beliebtheit spiegeln, nicht jedoch Stichhaltigkeit.

    Es geht am Ende darum, eine Alternative zum Löschen zu finden. Z. B. wäre es möglich, unvollständige Artikel in einen eigenen Namensraum zu legen, quasi als eine Vorstufe. Diese Daten stünden dann noch anderen Nutzungen zur Verfügung und wären in diesem Rahmen als noch nicht nachgewiesen gekennzeichnet, ein wichtiger Hinweis.

    Der Anspruch, Relevanzkriterien ohne Rücksicht auf unterschiedliche Nutzungsarten festzulegen, gepaart mit einer Administratoren-Hegemonie zerfasert die Potentiale von Wikipedia. Potentiale, die sich als Spitze des Eisbergs noch unscharf erahnen lassen. Möchte die scientific community diese Potentiale nutzen, sollte sie sich positionieren.

  6. fatmike182 permalink
    23. Januar 2010 1:18 pm

    @ digiom
    Das war früher so, heute nicht mehr, oder? Ob jetzt eine 12-bändige Brockhaus-Reihe um 100 Seiten dicker ist oder so würde meiner Ansicht nach keinen Unterschied machen.

    @ Regine Heidorn
    Die Verwendung von Page Hits halte ich auch für ein schlechtes Kriterium; da sonst kein widersprüchliches Argument vorhanden ist (Speicherplatz, hm…).
    Verglichen mit der deutschsprachigen Wikipedia hat es sich in der englischsprachigen, liberaleren Version gut genug etabliert die von dir verlangten Lables zu setzen. Von den [citation needed]-Tags über die großen Warnüberschriften hinweisend auf Unvollständigkeit. Verteidigend (aber aus einer wissenschaftlich anderen Richtung kommend) muss ich aber auch sagen, dass die großen Löschdebatten bei de.wikipedia eher Personen, Vereine, Firmen udgl betrafen, nicht aber Technologien. &, dass Wikipedia nicht zum Xing für D-Prominente & Wannabes wird befürworte ich sehrwohl (aber das ist bei der englischen Version ja eh auch nicht so)

  7. 23. Januar 2010 7:33 pm

    @fatmike182
    Stimme Dir zu: besser als über Personen, Vereine u. Ä. kann man sich in der deutschsprachigen Wikipedia über sämtliche Lokomotiv-Baureihen informieren🙂

    XING ist XING, Wikipedia ist Wikipedia. Gerade im Bereich Personen-Einträge zeigt sich die Auflösung der Kanonisierung und Redaktion besonders: es ist nicht mehr zu vermitteln, worin die besondere Leistung eines Menschen besteht, wenn es nicht mehr darum geht, in welchen Institutionen er sich bewegt. Und auch nicht mehr klar ist, welche Leistungen zu würdigen sein sollen. Ein weiteres gutes Beispiel für die Notwendigkeit der Anpassung (nicht Aufhebung!) der Relevanzkriterien an Online-Nutzung und an nutzergenerierte Inhalte (als Gegenteil zum redaktionell erstellten oder kanonisierten Inhalt).

    Die völlige Ablehnung von Online-Quellen als Beweis für persönliche Relevanz halte ich dabei für fatal, weil sich viele Biographien mittlerweile online manifestieren. Und wo, wenn nicht in einer Online-Enzyklopädie, sollen diese Personen auftauchen?

  8. 23. Januar 2010 8:28 pm

    @fatmike132 ad „mal eben 100 seiten mehr“ -> wieso, weil papier deiner vermutung nach 2010 (billiger/verfügbarer/…?) ist als z.b. 1960?

    schau selbst nach bei http://www.brockhaus.de/enzyklopaedie/30baende/index.php, nach wie vor wird „band-um-band“ ausgeliefert, nach wie vor ist das volumen der bände relativ ident („ca. 816 seiten“).

Trackbacks

  1. #ArticleFriday 22/01 « vorblog
  2. Lese-Empfehlungen der KW3 - Netzlogbuch
  3. Wikipedia und das Drama der Relevanz | Blogpiloten.de - das Beste aus Blogs, Videos, Musik und Web 2.0
  4. » EarthTreck, das globale Bürger-Wissenschaftsnetzwerk – wie Crowdsourcing der Wissenschaft neue Perspektiven eröffnet - Feed Magazin
  5. Wie man einen Blog verleiht « digiom. studienblog über das leben in und mit digitalen onlinemedien

Schreibe einen Kommentar

Trage deine Daten unten ein oder klicke ein Icon um dich einzuloggen:

WordPress.com-Logo

Du kommentierst mit Deinem WordPress.com-Konto. Abmelden / Ändern )

Twitter-Bild

Du kommentierst mit Deinem Twitter-Konto. Abmelden / Ändern )

Facebook-Foto

Du kommentierst mit Deinem Facebook-Konto. Abmelden / Ändern )

Google+ Foto

Du kommentierst mit Deinem Google+-Konto. Abmelden / Ändern )

Verbinde mit %s

%d Bloggern gefällt das: