Wie dieses Dorfbuch entstand

Zu Beginn waren da die etwas mehr als 700 Seiten meines Großvaters, die er mit Schreibmaschine zu Papier brachte (Die Seiten habe ich erst jetzt gezählt - damals hätte mich das vermutlich nur vor der Arbeit abgeschreckt).

Zunächst stellte sich die Frage: Mit welchem Programm sollte ich diesen umfangreichen Text erfassen? Es sind viele Tabellen sowie einige Photos und Diagramme enthalten. Mein Ziel war zunächst sein Werk zu einem Buch zusammenzufassen und um Photos zu bereichern. Außerdem wollte ich einen umfangreichen Index zum raschen Auffinden von Textstellen hinzufügen.

Die naheliegendste Wahl wäre vermutlich 'Microsoft Winword' gewesen. Seit ich aber vor einiger Zeit im Zusammenhang einer etwa 70 Seiten umfassenden Dokumentation mit vielen Abbildungen kläglich gescheitert und viel Zeit verloren habe, verwende ich dieses Produkt nur mehr, wenn ich kompatibel zum 'Rest der Welt' sein muss. Ich brachte nach 2 Tagen des Lesens der Online-Hilfe und herumärgerns mit dem Assistenten kein professionelles Layout zustande. Obendrein hatte ich schreckliche Probleme nachdem ich mehr als etwa 50 Bilder eingefügt hatte.

Da ich beruflich viel mit UNIX und privat fast ausschließlich mit Linux arbeite, fiel die Entscheidung auf LYX. LYX ist ein grafisches Frontend für das Textsatzsystem LATEX - beides freie Programme, die keinen Groschen (oder in Euro-Zeiten keinen Cent) Lizenz kosten. Jetzt nachträglich muss ich sagen - die Entscheidung war richtig. Ich hatte nie annähernd die Probleme, die jedem Winword-Anwender vertraut sind: urplötzlich wird das Dokument durch irgendeine Aktion, die sich nicht mehr eruieren lässt riesengroß, die Formatierung funktioniert nicht mehr so wie eben noch, Fehler schleichen sich ein sodass das Dokument nicht mehr brauchbar und nur zu retten ist, indem Stück für Stück in ein neues Dokument kopiert wird, ...

Der größte Vorteil von LYX ist aber der, dass ich ohne etwas von Schriftsatz zu verstehen einen professionell aussehenden Druck zustandebrachte. Innerhalb von nur 2 Stunden wusste ich ausreichend viel, dass ich in der Lage war mit der Erfassung des Textes zu beginnen, ohne später wieder alles grundlegend neu zu formatieren oder gar neu zu erfassen wenn ich bemerkte, dass es anders doch besser wäre. Lediglich das Erstellen der komplizierten Tabellen kostete mich etwas mehr Zeit, als ich vielleicht mit Winword benötigt hätte. Dafür konnte ich sehr viel Zeit sparen, wenn die Daten schon in elektrischer Form vorhanden waren (wie zum Beispiel bei den meteorologischen Daten). Die Tabelle ließ ich durch ein selbstgeschriebenes Perl-Skript automatisch erstellen, was mich sonst viel Tipparbeit gekostet hätte. So etwas ist nur mit vertretbarem Aufwand möglich, wenn die vom Programm erzeugten Dateien Textformat haben.

Ein weiterer Vorteil von LYX ist die Möglichkeit eine PDF-Datei (mit Hilfe des Shell-Skriptes 'lyx2pdf' und dem Programm 'pdflatex') zu erstellen. PDF-Dateien können unter (fast?) jedem Betriebssystem ohne teuren Lizenzen gelesen werden. Und nicht zuletzt ermöglichte mir das LATEX-Format von LYX die Umsetzung in das im Internet übliche HTML-Format (mit 'latex2html'). Für die Erstellung des HTML-Formates musste ich allerdings einige Änderungen im Dokument vornehmen. Das Konvertierungsprogramm lief auf Fehler, wenn ich Bilder und Tabellen als 'Float' einfügte. Das Einfügen von Bildern und Tabellen als 'Float' ist sonst sehr angenehm, da sich LATEXselbst darum kümmert an welcher Stelle die Abbildung bzw. die Tabelle dargestellt wird. Das ermöglicht einen besseren Schriftsatz. Manche Listen wurden im HTML-Format als Graphik dargestellt, was sehr unschön aussah und zudem längere Ladezeiten verursachte. Diese ersetzte ich durch 'verträgliche' Auflistungen. Zudem musste ich für HTML die komplizierten Tabellen durch einen einfacheren Aufbau ersetzen. Trotz diesen Schwierigkeiten war ich in der Lage innerhalb weniger Stunden das 438 Seiten umfassende Dokument in ein doch recht brauchbares HTML-Format zu verwandeln. Und das vorwiegend automatisiert!

Wie schon gesagt, benötigt das ausgedruckte Buch mit allen derzeit (Oktober 2001) vorhandenen Abbildungen 438 Seiten. Der reine Text (ohne Bilder oder Information für Formatierung) umfasst ca. 975000 Zeichen bzw. 131000 Wörter. Für das Abschreiben des Textes habe ich hochgerechnet etwas über 250 Stunden benötigt. Ich habe nur etwa 1 Anschlag pro Sekunde gerechnet, obwohl selbst ich normalerweise mehr schaffe. Ich musste mir aber immer wieder Gedanken über Fußnoten, Literaturverweise, Abbildungen und Tabellen machen bzw. nachgrübeln, was mit den händisch hinzugefügten Bemerkungen gemeint sein könnte. Außerdem kostete mich auch das Korrekturlesen einige Zeit. Die Rechtschreibhilfe 'ispell' unterstütze mich dabei nur wenig, da das Dokument sehr viele Wörter enthält, die nicht im Wörterbuch enthalten sind. Ich versuchte es auch mit der Rechtschreibhilfe von Winword indem ich das Dokument als Textdatei exportierte. Dessen Hilfe war aber auch nicht wesentlich besser.

Hinzu kam noch die Zeit für die Aufbereitung der Diagramme und Bilder. Der Zeitaufwand für die Diagramme war minimal. Da die Daten in elektrischer Form vorlagen, konnte ich sie einfach mit 'gnuplot' graphisch darstellen und in dem für den Druck üblichen Postscript-Format exportieren. Gnuplot ist ebenfalls ein freies Programm, womit sehr rasch einfache Diagramme erstellt werden können.

Für die statistische Aufbereitung der meteorologischen Messdaten verwendete ich das Programm 'RStatist'. Rstatist ist sehr mächtig und ich kann mangels statistischem Wissen nur einen winzigen Teil davon nützen.

Der Stammbaum der Ritter von Eben entstand mit Hilfe von 'Xfig'.

Aufwändiger war die Aufbereitung der Bilder. Alte Photos von meinem Großvater musste ich mittels Flachbettscanner digitalisieren, meine eigenen Dias oder Negative konnte ich auf meinem Dia-Scanner in bereits sehr guter Qualität einlesen. Speziell die alten Photos, welche manchmal zerknittert und verschmutzt waren oder schlechten Kontrast hatten, musste ich nachbearbeiten. Zum Beispiel hatte das Photo der Glocken der Inzinger Kirche einen starken Knick, den ich mühsam entfernen musste. Dafür verwendete ich das ebenfalls freie Programm 'Gimp'. Sobald ich mit der Bildqualität zufrieden war, skalierte ich alle Bilder auf einheitliche Größe. Diesen Arbeitsschritt konnte ich mit Hilfe des Programmes 'convert' von ImageMagick automatisieren, sodass mich das nur wenige Minuten für alle Bilder in den unterschiedlichen Qualitäten (für den Druck und das PDF-Format habe ich bessere Qualität als für HTML gewählt) kostete. Auch die Konvertierung vom Postscript-Format in jpg- bzw. png-Format für die Internet-Variante geschah automatisiert mit 'convert'.

Zusammenfassend muss ich nun feststellen, dass ich ein so großes Projekt wieder nur unter Linux mit den bewährten Mitteln durchführen würde. Ich habe dabei vieles gelernt, vor allem aber stieg die Effizienz durch die einmaligen Möglichkeiten der Automatisierung, die UNIX (in meinem Fall Linux) bietet. Zweifellos gibt es am Markt Programme, die viele der benötigten Funktionen schon beinhalten. Da ich mich aber nicht gerne mit dem Erlernen der Bedienung von Programmen beschäftige, sondern möglichst rasch eine Lösung haben möchte, verwende ich meist lieber einfache Programme mit weniger Funktionsumfang. Solche Programme beherrsche ich rasch und für den jeweiligen Zweck eingesetzt komme ich so rascher ans Ziel. Das Vereinende zwischen den vielen Teilen ist UNIX. Das Arbeiten ist vielleicht nicht so bunt und Maus-orientiert wie unter Winword, aber der Zeitgewinn wiegt das bei weitem auf.

Ich möchte an dieser Stelle das Produkt 'Microsoft Winword' bzw. dessen Nachfolger nicht schlechter machen, als es ohnehin schon ist. Das könnte mich erstens in rechtliche Schwierigkeiten bringen und zudem verwende ich es ja auch. Allerdings nur um irgendwelche raschen Briefe oder Faxe zu schreiben, oder wenn es darum geht vorbereitete Dokumente, welche Firmenstandard sind, zu verwenden. Ich möchte auch niemanden zum Wechsel von Winword zu LYX überreden. Wer glücklich ist, dem sei's gegönnt. Wer sich aber schon öfters einmal um Alternativen umgesehen hat, für den ist's vielleicht das Richtige. Übrigens, wer Winword liebt, dem aber die Lizenzen zu teuer sind, der kann für nicht kommerzielle Nutzung StarOffice verwenden. StarOffice ist ein deutsches Produkt, welches von SUN Microsystems übernommen wurde und (weitgehend) kompatibel zu Microsoft Office ist. Die Kompatibilität ist wirklich gut. Ich hatte bisher nur mit manchen PowerPoint-Dokumenten und mit Word- oder Excel-Dokumenten, welche viele Makros verwenden, Probleme. Zumindest ist es so kompatibel, dass ich auch damit dieselben Probleme wie mit dem 'Original' habe. Ich finde, es ist vielleicht nicht besser (obwohl mir Bekannte sagen, dass sie bei großen Dokumenten wie Diplomarbeiten lieber StarOffice verwenden), aber auch nicht schlechter.

http://www.pisch.at/Ernst/Wissen/Dorfbuch/Dorfbuch.html