LERA - Locate, Explore, Retrace and Apprehend complex text variants
LERA ist eine interaktive, webbasierte Arbeitsumgebung zur Untersuchung von Gemeinsamkeiten und Unterschieden zwischen mehreren Fassungen eines Textes (Textvergleich und Kollationierung). Die Texte werden dazu von LERA in Passagen unterteilt und synoptisch gegenübergestellt. Unterschiede werden farbig hervorgehoben und in einem gemeinsamen Variantenapparat aufgeschlüsselt, sodass sie leicht lokalisiert werden können. Das Werkzeug bietet mit der Übersichtsleiste CATview, interaktiven Wortwolken und cleverer Suchefunktionalität verschiedene Ansätze zum effizienten Erkunden der Textunterschiede. So werden das Nachvollziehen und schließlich das Verstehen der Intention des Autors bei der Änderung effektiv unterstüzt. LERA wurde für das Kollationieren als Grundlage für die Erstellung historisch-kritischer Ausgaben und Editionen entwickelt. Eine Rezension von 2020 finden Sie im RIDE Journal, Ausgabe 11.
|
Institut für Informatik
Martin-Luther-Universität Halle-Wittenberg
|
Ein Update zu den Wortwolken
Mit der Aktualisierung im November 2022 wurde die neuste Version der stabilen Wortwolken hinzugefügt. Diese halten die Positionen der Worte räumlich stabil, auch wenn sich die Datengrundlage ändert. Mit Hilfe der damit verknüpften und beweglichen Auswahlbox in der Übersichtsleiste CATview lässt sich so die inhaltliche Entwicklung eines Werkes über dessen Länge und die verschiedenen Textfassungen hinweg leichter nachvollziehen.
Demo
Kernpunkte
Lesefreundliche Gegenüberstellung:
LERA generiert eine synoptische Gegenüberstellung von größeren Textsegmenten wie Sätzen, Zeilen oder Absätzen in einer lesefreundlichen Gesamtansicht. Dazu werden die Texte von der Arbeitsumgebung automatisch segmentiert und einander entsprechend ihrer Ähnlichkeit algorithmisch zugeordnet. Diese Alignierung der Segmente bildet die Grundlage des Textvergleichs.
Hervorhebung von Textvarianten:
Die Arbeitsumgebung berechnet die Unterschiede zwischen einander zugeordneten Segmenten und markiert diese farbig: Einfügungen werden grün, Ersetzungen blau und Löschungen rot gekennzeichnet. Die korrespondierenden Textpassagen in den übrigen Fassungen werden zudem grau hinterlegt. Mit Hilfe verschiedener Filter- und Farbeinstellungen kann der Textvergleich den eigenen Vorstellungen angepasst werden, zum Beispiel können auf Wunsch Änderungen der Interpunktion ausgeblendet werden.
Übersichtlicher Variantenapparat:
LERA erzeugt für die verglichenen Textsegmente einen ausführlichen und gut lesbaren Variantenapparat. Die Textvarianten werden dabei untereinander angezeigt, so dass auch im Apparat ein direkter Vergleich der Lemmata möglich wird. Verschiedene Einstellungen erlauben unterschiedlich detaillierte Apparate, die jederzeit neu automatisch generiert werden und als Basis einer historisch-kritischen Ausgabe oder Edition dienen können.
Integrierte Übersichts- und Navigationsleiste:
Die Übersichtsleiste CATview erleichtert die Navigation in umfangreichen Editionen. Sie stellt die Textsegmente entsprechend ihrer Zuordnung anschaulich als Rechtecke dar. Mit stärker werdender Intensität der Färbung wird dabei auf größere Überarbeitung hingewiesen. Ein Klick auf ein Rechteck verschiebt die synoptische Darstellung zum entsprechenden Segment. Die aktuelle Scrollposition wird zugleich durch eine orangefarbene Markierung angezeigt.
Interaktive Wortwolken:
Als zusätzliches Hilfsmittel zum Untersuchen der Textunterschiede bietet die Arbeitsumgebung interaktive Wortwolken an, die – je nach Einstellung – relevante Worte für jede Textfassung aufzeigen. Möglich sind die Auswahl der Worte, beispielsweise eine Beschränkung auf einzelne Wortarten oder auf Wörter ab einer bestimmten Länge, die Änderung des Bewertungsmaßes (Tf-idf-Maß oder die Häufigkeit) sowie die Anpassung der Darstellungsart.
Exploration des Inhalts:
In Verbindung mit CATview's Auswahlwerkzeug kann der Textbereich begrenzt werden, der zur Zusammenstellung der Worte für die Wortwolken betrachtet wird. Das Verschieben dieser Auswahlbox liefert einen Eindruck über den inhaltlichen Aufbau aller Textfassungen.
Wirkungsvolle Visualisierung von Suchergebnissen:
Die Arbeitsumgebung besitzt eine umfangreiche Suchfunktion, die eine Normalisierung des Suchbegriffs beinhaltet. Ein Klick auf einen Eintrag der Wortwolken, löst ebenfalls solch eine Suche aus. Die Suchtreffer werden im Text markiert und können durchgegangen werden. Darüber hinaus werden alle Suchtreffer in CATview angezeigt, was einen Überblick über die Verteilung von Themen im gesamten Text bzw. in den einzelnen Fassungen erlaubt.
Speichern und Teilen:
LERA bietet verschiedene Download-Funktionen zum Speichern und Weitergeben der Edition an. So kann die komplette bzw. auf Suchtreffer beschränkte Synopse oder eine einzelne Gegenüberstellung von Segmenten heruntergeladen werden. Die getroffenen Farb- und Filtereinstellungen werden dabei übernommen. Als Dateiformate stehen .pdf .tex und .html zur Verfügung.
Beispieltexte
Histoire des deux Indes
Die Histoire philosophique et politique des établissements et du commerce des Européens dans les deux Indes von Abbé Raynal (1713-1796) ist eines der gesamteuropäisch einflussreichsten Erfolgs- und Skandalbücher des europäischen 18. Jahrhunderts. Ihr Inhalt ist die kritische Geschichte der europäischen Kolonialexpansion in ‚beiden’ Indien, d.h. sowohl im ‚östlichen’ Indien (Asien), als vor allem auch im ‚westlichen’ Indien (Karibik und Lateinamerika). Nach der Erstfassung von 1770, die in Frankreich sofort verboten wurde, erschienen drei weitere umfangreich überarbeitete Fassungen der Histoire (1774, 1780 und postum 1820).
Demo
Keter Shem Ṭov
Der hebräische Traktat Keter Shem Ṭov ("Krone des guten Namens"), der im 13. Jahrhundert verfasst wurde, ist einer der wichtigsten Einführungstexte in die esoterischen Lehren der Kabbala und wird von etwa 100 Handschriften bezeugt. Das Beispiel zeigt einen Auszug für fünf Textzeugen. Sie stammen aus einem laufenden Forschungsprojekt (siehe https://kabbalaheditions.org), das mit Hilfe von LERA eine kritische Edition dieses Werkes erarbeitet.
Demo
Rumpelstilzchen
Das auf einem Volksmärchen basierende Rumpelstilzchen ist in den Kinder- und Hausmärchen der Brüder Grimm (KHM 55) enthalten.
Im Beispiel werden die sieben zwischen 1812 und 1857 erschienenen Fassungen des Märchens in Teilsätze segmentiert und miteinander verglichen.
Demo