DFG-Zwischenbericht vom 11. Mai 2001 zum Projekt HDHS

»Mitteleuropäische Kulturtradition: Möglichkeiten ihrer digitalen Erschließung im Internet. HDHS (Heidelberger Hypertextserver)«

(DFG-Sachbeihilfe Nr.III N 4-55495(1) Heidelberg BIB46 Hdadw 01-01; Beginn 1. Februar 2001)

1. Personelle Situation und Ausstattung

Die vorgesehenen Mitarbeiterstellen wurden wie folgt besetzt:
2 halbe BAT IIa-Stellen mit dem Germanisten Peter STRÖBEL (seit 1. Februar 2001), der Germanistin Katja LEYHAUSEN (seit 1. März 2001), 1 BAT IIa-Stelle mit dem Historiker Dr.phil.des. Gerrit SCHENK (seit 1. April 2001), die BAT V b/IVa-Stelle mit der Diplombibliothekarin Susanne BRECHT (seit 1. Februar 2001). Die für einen EDV-Experten vorgesehene halbe BAT IIa-Stelle wird ab dem 1. Juni 2001 besetzt werden; damit ist noch eine BAT IIa-Stelle offen.
Entsprechend der personellen Situation wurden 3 Notebooks angeschafft. Die Mitarbeiter können derzeit Räumlichkeiten nutzen, die der Mitantragsteller Prof. Dr. Oskar REICHMANN (Frühneuhochdeutsches Wörterbuch: FWB) bereitstellte. Das Deutsche Rechtswörterbuch (DRW) stellte die notwendigste Ausrüstung (Büromaterial, Handapparat mit Nachschlagewerken etc.) zur Verfügung.

2. Arbeitsverlauf und Zeithorizont

2.1. Datenmodellierung: Konzeption, Probleme, Umsetzung

Entsprechend der im Antrag formulierten Konzeption ging es zunächst darum, für die Erschließung der Quellen Klassifikationskriterien zu erstellen und am Quellenbestand von DRW und FWB zu erproben. Um die eingesetzten Kräfte möglichst effizient zu bündeln, wurden dafür zunächst nur solche Quellen zugrunde gelegt, die sowohl zum Bestand des DRW als auch des FWB gehören. Da zu diesem Corpus sehr unterschiedliche Quellengattungen (von Rechtstexten über literarische bis hin zu wirtschaftsgeschichtlichen Texten) gehören, war darauf zu achten, die Anzahl der Klassifikatoren überschaubar zu halten und dennoch der Spezifik der jeweiligen Quelle gerecht zu werden.
Im Verlauf der ersten 3 Monate wurde sehr schnell deutlich, dass bei dieser Datenmodellierung nur bedingt von einer konkreten Einheit »Quelle« ausgegangen werden kann. Besonders deutlich wird dies am Beispiel literarischer Quellen: Das »Nibelungenlied« wird z.B. in den einschlägigen Fachlexika einerseits als – abstrakt gedachtes – ›Textem‹ verstanden, das gleichsam als »Idee« der Forscher, Editoren, Rezipienten etc. existiert und möglicherweise in den Köpfen des Mittelalters eine wie auch immer geartete Form der Existenz hatte. Andererseits liegen zahlreiche, im Wortlaut jeweils mehr oder weniger unterschiedliche Handschriften und handschriftliche Fragmente des »Nibelungenliedes« vor, nämlich die einzelnen – konkret existenten – ›Textrealisationen‹. Zwischen ›Texten‹ und ›Realisationen‹ kann man theoretisch noch sogen. Fassungen annehmen, was hier aber nicht weiter verfolgt werden soll. Wissenschaftliche Editionen stellen also ihrerseits ›Texteme‹ des »Nibelungenliedes« dar, die auf der kritischen wissenschaftlichen Auswertung der einzelnen Handschriften (›Textrealisationen‹) beruhen. Klassifikationskriterien wie z.B. Entstehungsraum und -zeit, die dem ›Textem‹ Nibelungenlied zugeschrieben werden können, gelten nicht notwendig zugleich auch für alle ›Textrealisationen‹. Erschwerend kommt hinzu, dass die zahlreichen wissenschaftlichen Editionen des Nibelungenliedes auf einer manchmal recht unterschiedlichen handschriftlichen Basis beruhen. Dieses Problem begegnet in unterschiedlicher Intensität auch bei anderen Quellengattungen. Wissenschaftlich vollends problematisch wird eine pauschale Klassifizierung von Quellen, die auf der zusammenstellenden Arbeit moderner Editoren beruhen, man denke etwa an die umfangreiche Sammlung von jeweils verschiedenartigen Weistümern durch Jacob Grimm oder von evangelischen Kirchenordnungen durch Emil Sehling, wohingegen die zusammenstellende Tätigkeit zeitgenössischer Autoren, beispielsweise bei Rechtsbüchern, ohne größere Probleme als Kompilation, Redaktion u.a. klassifiziert werden kann.
Bei der Lösung dieser Probleme war dreierlei zu berücksichtigen: Erstens mußte die Klassifikation der Quellen im Sinne der HDHS-Konzeption eindeutig und präzise bleiben. Zweitens war darauf zu achten, dass bei der Quellenklassifikation während der ersten Projektphase die erforderliche Recherchetiefe in einem vertretbaren Verhältnis zum Zeitbudget des HDHS-Projekts bleibt. Drittens sollte jedoch die Möglichkeit einer Vertiefung und Ausweitung der Recherche während einer späteren Phase des Projektes bereits jetzt in der Struktur der Datenmodellierung angelegt werden. Daher wurde im Datenverwaltungssystem FAUST eine einheitliche HDHS-Dokumentation mit fünf unterschiedlichen Objektarten eingerichtet, für die jeweils spezifische Datenmasken angelegt, erprobt und weiterentwickelt wurden:

1. Objektart ›Text‹: Klassifikation der Quellen (›Texteme‹) nach spezifischen Kriterien, Verknüpfung mit den anderen Objektarten und eventuell vorhandenen Ressourcen im WWW.
2. Objektart ›Manuskript/Druck‹: Klassifikation der Quellen (›Textrealisationen‹) nach spezifischen Kriterien, Verknüpfung mit den anderen Objektarten und eventuell vorhandenen  Ressourcen im WWW. Zunächst sollen nur Leithandschriften in einer einfachen Beschreibung erfaßt werden, die Recherchebreite und -tiefe kann jedoch später vertieft werden. Die Kriterien der Beschreibung orientieren sich am DFG-Konzept der Handschriftenerschließung durch Informationssysteme. Noch ungeklärt ist der Umgang mit Bildern. Angestrebt werden Lösungen, die sich an der Bilddatenbank »Marburger Index« ( oder an den Datenbanken des »Instituts für Realienkunde des Mittelalters und der Frühen Neuzeit, Krems a.d. Donau« ( orientieren.
3. Objektart ›Textsammlung‹: Erschließung wissenschaftlicher Textsammlungen durch knappe Klassifikation und Verknüpfung mit den übrigen Objektarten. Die Datenmodellierung hierfür erlaubt bei Bedarf eine geschachtelte Segmentierung mit Vererbung nach dem parent-child-Muster in objektorientierten Datenmodellierungen.
4. Objektart ›Raum‹: Diese Objektart befindet sich noch im Aufbau. Möglich erscheint eine Anbindung an die rechtssprachgeographischen Arbeiten Eberhard von Künßbergs.
5. Objektart ›Person/Personenkreis‹: Klassifikation der Personen/Personenkreise nach spezifischen Kriterien, Verknüpfung mit den anderen Objektarten und eventuell vorhandenen Ressourcen im WWW.

Alle Objektarten wurden mit den bereits vorhandenen DRW-Daten verknüpft. Für die Erfassungsmasken der Objektarten (Punkte 1–3, 5) wurden Beschreibungen erstellt, die einerseits die Struktur des entstehenden Informationssystems dokumentieren sollen, andererseits der internen Normierung bei der Eingabe der Daten dienen. Die theoretische Unterscheidung von ›Textem‹ und ›Textrealisation‹ bei der Datenmodellierung bietet insgesamt nicht nur einen pragmatischen Ausweg aus dem geschilderten Dilemma bei der wissenschaftlich tragfähigen Klassifikation von Quellen und ihrer konkreten Erfassung in Masken des Datenverwaltungssystems FAUST, sondern stellt auch einen ganz beträchtlichen – und unverhofften – wissenschaftlichen Mehrwert des Projektes für die Kulturwissenschaften dar.

2.2. Perspektiven und Zeitplan

Die Datenmodellierung und Maskenerstellung befindet sich überwiegend im Stand der Erprobung am konkreten (Quellen-)Material, die Objektart ›Text‹ erweist sich dabei bereits als stabil. Die Objektarten ›Handschrift/Druck‹, ›Raum‹ und ›Textsammlung‹ bedürfen jedoch noch der Weiterentwicklung. Die Anlage einer eigenen Objektart für Bildquellen (illuminierte Handschriften etc.), ihre Einbindung in die Objektart ›Handschrift/Druck‹ oder gegebenenfalls auch die Vernachlässigung dieser schwierigen Quellenart  muß noch erwogen werden. Der Abschluss dieser ersten Projektphase (Monate 1–6) wird für Ende Juli projektiert, wobei nach der Stabilisierung der Masken eine Revision des gesamten Datenbestandes nach den dann dauerhaft festgelegten, notfalls aber noch modifizierbaren Kriterien erforderlich sein wird.
Parallel dazu müssen Konzepte für die Integration der vorhandenen Digitalisate und der Ressourcen der Wörterbücher entwickelt werden, die in der zweiten Projektphase umgesetzt und erprobt werden sollen. Erst im Anschluss daran kann HDHS systematisch »gefüllt« und im WWW verfügbar gemacht werden (3. Phase). Derzeit (Stand 30. April 2001) werden je Arbeitstag der bisher eingestellten Mitarbeiter (also ohne die Arbeit des Projektleiters zu berücksichtigen) rund 12 Objekte neu angelegt, die jedoch keinesfalls als vollständig erschlossen gelten können. Daher sind Aussagen zum voraussichtlichen Fortschreiten der Arbeit zum derzeitigen Zeitpunkt weder sinnvoll noch möglich. Es ist jedenfalls schon jetzt deutlich, dass diese im Rahmen von HDHS zu erfolgende Arbeit durch die Datenerfassung ergänzt werden kann, welche die im DRW arbeitenden Lexikographen und Lexikographinnen leisten, so dass hierdurch ein Beschleunigungseffekt entstehen könnte.

2.3. Präsentation und Kooperation

Das HDHS-Projekt zielt langfristig auf eine möglichst große Akzeptanz durch die – nicht nur wissenschaftlichen – Nutzer und ist umgekehrt auf eine möglichst umfassende Kooperation mit Personen und Institutionen angewiesen. Entsprechend nutzerfreundlich müssen die HDHS-Recherchemöglichkeiten und ihre Präsentation im WWW gestaltet werden. Die Bedürfnisse und Vorstellungen der potentiellen Nutzer und die bereits existierenden oder geplanten Angebote vergleichbarer Art von dritter Seite müssen also schon während der Planungsphase des Projekts sinnvoll eingebunden werden. Dazu dient die zunächst passive, später auch aktive Teilnahme an Fachtagungen, Konferenzen etc.
Die Projektmitarbeiterin Katja Leyhausen vertrat HDHS auf der Tagung »Raumlose Orte – geschichtslose Zeit. Das Internet und die Geschichtswissenschaften« am 30./31. März in Basel. Am 17. Mai wird HDHS in dem Hauptseminar »Quellenorientierte Datenverarbeitung in den Historisch-Kulturwissenschaftlichen Disziplinen« (Prof. Dr. Manfred THALLER, Universität Köln) den Seminarteilnehmern vorgestellt. In diesem Hauptseminar werden Möglichkeiten untersucht und ausprobiert, das DRW (und damit HDHS) z.B. mit anderen unabhängigen geisteswissenschaftlichen Ressourcen in WWW zu vernetzen und eine XML-basierte Netz-Präsentation zu erstellen. Am 18. Juni wird HDHS im Rahmen des EDV-Kolloquiums des »Kompetenzzentrums für elektronische Erschliessungs- und Publikationsverfahren in den Geisteswissenschaften an der Universität Trier« (Prof. Dr. Kurt GÄRTNER) vorgestellt, außerdem ist eine Vorstellung auf dem Deutschen Germanistentag 2001 in Erlangen innerhalb der Sektion 5,II »Computereinsatz in Forschung, Lehre, Unterricht« (vgl.  angekündigt worden. Schließlich ist eine Teilnahme an der 4. Tagung der Arbeitsgemeinschaft Frühe Neuzeit  »Kommunikation und Medien in der Frühen Neuzeit« (Augsburg, 13.–15. September) vorgesehen (vgl. http://www.phil.uni-augsburg.de/phil2/Faecher/GESCHICH/KuM_1.htm).

3. Fazit

Das Projekt HDHS befindet sich mitten in seiner ersten Phase, in der durch eine geschickte Datenmodellierung die Weichen für die weiteren Phasen gestellt werden müssen. Die im Antrag formulierte Konzeption hat sich bisher als tragfähig erwiesen. Wissenschaftlich produktive  Probleme warf die Frage einer geeigneten Klassifikation der Quellen auf, die durch eine spezifische Strukturierung der Dokumentation in bislang fünf Objektarten realisiert werden konnte. Diese größere Komplexität der Datenmodellierung ließ sich mit FAUST gut umsetzen.

Gerrit SCHENK


2002-01-03