Anhand eines zwar erfundenen, aber den Normen der digitalen Edition entsprechenden Beispieldokuments, sollen an dieser Stelle die wesentlichen Merkmale des Ausgangsformats erläutert werden:
Zunächst einmal lässt sich erkennen, dass der 'body' des Dokuments auf der höchsten Gliederungsebene in sogenannte 'textAreas' unterteilt wird. Jede textArea entspricht dabei einem beschriebenen Bereich auf der Manuskriptseite. Im vorliegenden Fall bildet "textArea number='1'" den Haupttext des Dokuments, während "textArea number ='2'" eine Marginalie, also eine Ergänzung durch den Autor, umfasst. Die Anknüpfung dieser Marginalie erfolgt in der Kodierung mit Hilfe des Tags 'marginLink'.
Darüber hinaus wird anhand des vorliegenden Dokuments sehr deutlich, dass die Kodierung der Transkriptionen vor allem mit Blick auf die digitale Darstellung enstanden ist: So werden z.B. Stellen, an denen der Autor im Manuskript Textteile gestrichen und durch andere ersetzt hat, in 'textblocks' zusammengefasst, innerhalb derer die verschiedenen 'text'-Elemente mit ihren 'layer'-Attributen die Chronologie der Änderungen repräsentieren. Den höchsten 'layer'-Wert erhält die jeweils letztgültige Version des Textes im Manuskript.
Im vorliegenden Beispieldokument findet sich eine solche Textersetzung in den Zeilen 14/15. Hier wurde in dem ursprünglichen Satz "Dies ist ein sehr langweiliges Dokument ..." das Wort "langweilig" nachträglich durch "lehrreich" ersetzt. Diese Änderung umfasst lediglich zwei Ebenen, die transkribierten Manuskripte von Leibniz enthalten jedoch Stellen mit bis zu 10 Änderungsebenen. Einfache nachträgliche Streichungen und Einfügungen des Autors schließlich werden mit Hilfe des 'insertion'- und 'deletion'-Tags ausgezeichnet.
Das 'comment'-Element enthält Anmerkungen der Editoren, wie etwa bibliografische Verweise o. Ä.