2008
• Linguistically Annotated Corpora: 
Quality Assurance, Reusablity and Sustainability. 
Heike Zinsmeister, Erhard Hinrichs, Sandra Kübler, Andreas Witt. 
In: Anke Lüdeling and Merja Kytö (eds.) Corpus Linguistics. 
An International Handbook. Mouton de Gruyter, Berlin. (to appear) 
 
• Multi-Dimensional Markup: 
N-way relations as a generalisation over 
possible relations between annotation layers. 
Harald Lüngen, Andreas Witt 
In: Proceedings of Digital Humanities 2008, 
June 25–29, Oulu, Finland, 2008. In press. 
 
• The German Hamlets: An Advanced Text Technological Application. 
Benjamin Birkenhage, Andreas Witt 
In: Proceedings of Digital Humanities 2008, 
June 25–29, Oulu, Finland, 2008. In press. 
 
• Sustainability of Annotated Resources in Linguistics. 
Georg Rehm, Andreas Witt, Erhard Hinrichs, Marga Reis 
In: Proceedings of Digital Humanities 2008, 
June 25–29, Oulu, Finland, 2008. In press. 
 
• The Metadata-Database of a Next Generation 
Sustainability Web-Platform for Language Resources. 
Georg Rehm Andreas Witt, Timm Lehmberg, Johannes Dellert, 
Kilian Evang, Magdalena Leshtanska, Matthias Stark. 
In: Proceedings of LREC 2008, 
May 28–30, Marrakech, Morocco, 2008. In press. 
 
2007
• Masking Treebanks for the Free Distribution 
of Linguistic Resources and Other Applications. 
Georg Rehm, Andreas Witt, Heike Zinsmeister, Johannes Dellert. 
In: Proceedings of the Sixth International Workshop 
on Treebanks and Linguistic Theories (TLT 2007). 
December 7–8, Bergen, Norway, 2007, pp. 127–138. 
 
• Mapping Multi-Rooted Trees from a Sustainable 
Exchange Format to TEI Feature Structures. 
Andreas Witt, Georg Rehm, Timm Lehmberg, Erhard Hinrichs. 
In: TEI@20: 20 Years of Supporting the Digital Humanities. 
The 20th Anniversary TEI Consortium Members' Meeting. 
10/31 – 11/3, University of Maryland, College Park, USA, 2007 
 
• "On the Lossless Transformation of Single-File, 
Multi-Layer Annotations into Multi-Rooted Trees." 
Andreas Witt, Oliver Schonefeld, 
Georg Rehm, Jonathan Khoo and Kilian Evang. 
In Proceedings of Extreme Markup Languages 2007® 
 
• Datenstrukturen für linguistische Ressourcen und ihre Anwendungen 
Data Structures for Linguistic Resources and Applications. 
Georg Rehm, Andreas Witt, Lothar Lemnitzer (eds.,2007) 
Proceedings of the Biennial GLDV Conference 2007. 
Tübingen: Narr, 2007 (in press) 
 
• Rechtsfragen bei der Nutzung und Weitergabe linguistischer Daten. 
In: Datenstrukturen für linguistische Ressourcen und ihre Anwendungen 
Data Structures for Linguistic Resources and Applications. 
Proceedings of the Biennial GLDV Conference 2007, 
Georg Rehm, Andreas Witt, Lothar Lemnitzer (eds.), 
Timm Lehmberg, Christian Chiarcos, Georg Rehm, Andreas Witt 
Tübingen: Narr, 2007 
 
• Corpus Masking: Legally Bypassing Licensing 
Restrictions for the Free Distribution of Text Collections. 
Georg Rehm, Andreas Witt, Heike Zinsmeister, Johannes Dellert 
In: Proceedings of Digital Humanities 2007, 
University of Illinois, Urbana-Champaign, USA 
 
• Collecting Legally Relevant Metadata by Means 
of a Decision-Tree-Based Questionnaire System. 
Timm Lehmberg, Christian Chiarcos, Erhard Hinrichs, 
Georg Rehm, Andreas Witt 
In: Proceedings of Digital Humanities 2007, 
University of Illinois, Urbana-Champaign, USA 
 
2006




• Texttechnologie an der Universität Bielefeld. 
Jahrbuchs für Computerphilologie (7). 
Andreas Witt und Nils Diewald 
Paderborn : Mentis-Verlag 
  • Multidimensional markup and heterogeneous linguistic resources. 
Demo auf dem EACL-Workshop 
"Multi-dimensional Markup in Natural Language Processing" 
Maik Stührenberg, Andreas Witt, Daniela Goecke, 
Dieter Metzing und Oliver Schonefeld 
 
 
• Exploiting logical document structure for anaphora resolution. 
Daniela Goecke and Andreas Witt 
In: Proceedings of the 5th International Conference on 
Language Resources and Evaluation (LREC-2006), Genoa, Italy 
 
• Sustainability of Linguistic Resources. 
Stefanie Dipper, Erhard Hinrichs, Thomas Schmidt, Andreas Wagner, 
Andreas Witt. In: Erhard Hinrichs, Nancy Ide, Martha Palmer 
and James Pustejovsky (eds.): 
Proceedings of the LREC 2006 Workshop on Merging 
and Layering Linguistic Information, Genoa, Italy. 
 
• Avoiding Data Graveyards: From Heterogeneous Data Collected in 
Multiple Research Projects to Sustainable Linguistic Resources. 
Thomas Schmidt, Christian Chiarcos, Timm Lehmberg, 
Georg Rehm, Andreas Witt, Erhard Hinrichs  
In: E-MELD Workshop Workshop on Digital 
Language Documentation: Tools and Standards - 
The State of the Art. East Lansing, Michigan, 2006 
 
• Proceedings of the Workshop on Multilingual Language Resources 
and Interoperability. Association for Computational Linguistics. 
Andreas Witt, Gilles Sérasset, Susan Armstrong, Jim Breen, 
Ulrich Heid and Felix Sasaki (Hrsg.). 
Sydney, Australia. 
 
• Towards validation of concurrent markup. 
Oliver Schonefeld and Andreas Witt 
In Proceedings of Extreme Markup Languages, 
Montréal, Canada, 2006. 
 
• Modelling Linguistic Data Structures. 
Kai Wörner, Andreas Witt, Georg Rehm, Stefanie Dipper 
In: Extreme Markup Languages, 
Montréal, Canada, 2006 
 
2005

• Multiple hierarchies: new aspects of an old solution. 
Re-published in: Dipper, Stefanie, Michael Götze and 
Manfred Stede (eds.) (2005) Heterogeneity in Focus: 
Creating and Using Linguistic Databases Volume 2 of 
Interdisciplinary Studies on In formation Structure (ISIS), 
Working Papers of the SFB 632, Andreas Witt. 
Universitätsverlag Potsdam, Germany 
 
• Unification of XML Documents with Concurrent Markup. 
Andreas Witt, Harald Lüngen, Felix Sasaki and Daniela Goecke. 
In: Literary and Linguistic Computing, Vol. 20, No. 1, p. 103 - 116 
 
• GOLD and Discourse: Domain- and Community–Specific Extensions. 
Daniela Goecke, Harald Lüngen, Felix Sasaki, 
Andreas Witt and Scott Farrar. 
In: Proceedings of the E-MELD Workshop on 
Morphosyntactic Annotation and Terminology: 
Linguistic Ontologies and Data Categories for 
Language Resources. Cambridge, Massachusetts. 
 
• Texttechnologie in der Universitären Lehre. 
Andreas Witt & Dieter Metzing. 
In: ALLCACH2005, Joint Conference of 
the ALLC and ACH, Victoria, BC, 2005. 
 
• Making CONCUR work. 
Mirco Hilbert, Oliver Schonefeld and Andreas Witt. 
In: Proceedings of Extreme Markup Languages. 
Montreal, 2005. 
 
• Schema Languages & Internationalization Issues: A survey 
Felix Sasaki, Christian Lieske, & Andreas Witt. 
In: Proceedings of Extreme Markup Languages. Montreal, 2005. 
 
• Verknüpfung heterogener texttechnologischer Ressourcen. 
Daniela Goecke, Dieter Metzing und Andreas Witt. 
GI Jahrestagung (2) 2005. pp. 94-98. 
 
• Hamlet goes XML: 
CrossAnnotationLinking and Personal learning experiences. 
Benjamin Birkenhake, Stefanie Panke, & Andreas Witt.  
In F. de Vries, G. Attwell, R. Elferink & A. Tödt (Eds.), 
Open Source for Education in Europe, Research and Practice 
(pp. 179-188). Heerlen, NL: Open University of the Netherlands. 
 
2004

• Multiple hierarchies: new aspects of an old solution. 
Andreas Witt in: Proc. of Extreme Markup Languages. Montreal. 
 
 
 
 
 
 
• Concept-based queries: 
Combining and reusing linguistic corpus formats and query languages. 
Felix Sasaki, Andreas Witt, Dafydd Gibbon und Thorsten Trippel. 
In: Proc. of the 4th Intern. Conf. on Lang. Resources and Evaluation 
(LREC-2004), Lissabon, p. 655 - 659. 
 
 
 
 
 
• Linguistische Korpora. Felix und Andreas Witt, 
In: Lothar Lemnitzer und Henning Lobin (Hg.): 
Texttechnologie. Grundlagen und Anwendungen. 
Tübingen: Stauffenburg. S. 195 - 216 
 
 
 
 
 
 
 
• Linguistische Informationsmodellierung mit XML, 
Andreas Witt. 
In: Alexander Mehler und Henning Lobin (Hrsg.): 
Automatische Textanalyse: Systeme und Methoden zur 
Annotation und Analyse natürlichsprachlicher Texte. 
Wiesbaden: VS Verlag. S. 39 - 54 
 
 
 
 
 
 
 
• A contribution to the development of language-specific 
and general annotation schemes and resources. Felix Sasaki und 
Andreas Witt. Co-reference in Japanese task-oriented dialogues 
In: Proceedings of the 4th International Conference on 
Language Resources and Evaluation (LREC-2004), Lissabon. p. 259 - 262 
 
 
 
 
• Unification of XML Documents with Concurrent Markup. 
Andreas Witt, Harald Lüngen, Felix Sasaki und Daniela Goecke 
In: ALLCACH2004, Joint Conference of the ALLC and ACH, Göteburg, 2004. 
 
 
 
• LREC 2004 und ALLC/ACH2004. Tagungsbericht. Andreas Witt 
In: KI - Zeitschrift Künstliche Intelligenz. Heft 4/04. 
 
 
 
 
 
 
• Interrelating Treebanks with Language-Specific Descriptions 
of Information Structure. 
Daniel Storbeck, Sanghee Kwon, Felix Sasaki, Andraes Witt. 
Third Workshop on Treebanks and Linguistic Theories (TLT 2004), 
Tübingen, 2004. 
 
 
 
 
 
• Proceedings of the Workshop on XML-based richly annotated corpora. 
Andreas Witt, Ulrich Heid, Henry S. Thompson, Jean Carletta 
und Peter Wittenburg (Hrsg.). 
Lissabon, 2004. 
 
2003
 
 
 
 
 
• Methods for the semantic analysis of document markup. 
Petra Bayerl, Harald Lüngen, Daniela Goecke, Andreas Witt und Daniel Naber: 
In: Roisin, Cécile, Ethan Munson und Christine Vanoirbeek (Hg.): 
Proceedings of the ACM Symposium on Document Engineering (DocEng 2003). 
20. - 22. November 2003, INRIA Rhône-Alpes 
 
 
 
 
 
 
 
• Query von Multiebenen-annotierten XML-Dokumenten mit Prolog. 
Daniela Goecke, Daniel Naber und Andreas Witt: 
In: Uta Seewald-Heeg (Hrsg.): 
Sprachtechnologie für die multilinguale Kommunikation - 
Textproduktion, Recherche, Übersetzung, Lokalisierung 
Sankt Augustin: Gardez! Verlag 
 
 
 
 
 
 
• XML in der Praxis: Dokument parsen, validieren und verarbeiten. 
Werner Köhler, Andreas Witt, Felix Sasaki, 
Jan-Torsten Milde und Jens Pönninghaus (2003). 
In: W. Köhler und H. Wittenbrink. XML. 
TEIA Lehrbuch Verlag GmbH, Berlin, 2003. S. 249 - 295. 
 
 
 
 
 
• Beispiel einer komplexen DTD: DocBook. 
Andreas Witt und Jens Pönninghaus (2003). 
In: W. Köhler und H. Wittenbrink. XML. 
TEIA Lehrbuch Verlag GmbH, Berlin, 2003. S. 296 - 334. 
 
 
 
 
 
 
 
• Declarations of Relations, Differences and Transformations 
between Theory-specific Treebanks: A New Methodology. 
Felix Sasaki, Andreas Witt und Dieter Metzing, 
In: Nivre, Joakim (Hg.): Proceedings of the The 
Second Workshop on Treebanks and Linguistic Theories 
(TLT 2003) 14. und 15. November 2003, Växjö universitet. 
 
2002

 
• Multiple Informationsstrukturierung mit Auszeichnungssprachen. 
XML-basierte Methoden und deren Nutzen für die Sprachtechnologie. 
Andreas Witt, Dissertation. 
 
 
 
 
 
• Co-reference annotation and resources: a multilingual corpus of 
typologically diverse languages Proceedings of the 3ndInternational 
Conference on Language Resources and Evaluation (LREC-2002), 
Felix Sasaki, Claudia Wegener, Andreas Witt, Dieter Metzing 
und Jens Pönninghaus, Las Palmas. 
 
 
 
• Meaning and interpretation of concurrent markup. Andreas Witt 
In: ALLCACH2002, Joint Conference of the ALLC and ACH, Tübingen, 2002. 
 
 
 
 
 
• Towards declarative descriptions of transformations: 
An approach based on topic maps. 
Eva Lenz, Angelika Storrer und Andreas Witt, 
In: ALLCACH2002, Joint Conference of the ALLC and ACH, Tübingen, 2002. 
 
 
 
 
• Grundlagen für den Computereinsatz in der Linguistik: 
Attribute, Werte, Unifikation. Andreas Witt, 
In: Horst M. Müller Arbeitsbuch Linguistik. UTB. 
 
2000



• Enhancing speech corpus resources with multiple lexical tag layers, 
Andreas Witt, Harald Lüngen und Dafydd Gibbon. 
In: Proceedings of the 2nd International Conference 
on Language Resources and Evaluation (LREC-2000), Athen. 
 



• Präsentation, Transformation und Analyse: Verarbeitung 
XML-basierter japanischer Dialoge, Felix Sasaki und Andreas Witt 
In: Henning Lobin (Hg.) Tagungsband der GLDV-Tagung 2001. 
 
• Lexikonexpansion: Vom XML-annotiertem Stammformenlexikon 
zum Vollformenlexikon, Jens Pönninghaus und Andreas Witt, 
In: Henning Lobin (Hg.) Tagungsband der GLDV-Tagung 2001. 
 
1999



• SGML und Linguistik, Andreas Witt. 
In: Lobin (Hrsg.), Text im digitalen Medium. 
Linguistische Aspekte von Textdesign, Texttechnologie und  
Hypertext Engineering. Wiesbaden: Westdeutscher Verlag, 1999. 
 



• DSSSL zur Verarbeitung linguistischer Korpora, Andreas Witt. 
In: Jost Gippert (Hrsg.) Multilinguale Corpora: 
Codierung, Strukturierung, Analyse., Enigma Corporation. Prag, 1999. 
 



• Semantic and Thematic Navigation in Electronic Encyclopedias, 
Henning Lobin und Andreas Witt. 
In: Smith, John (ed.): Third ICCC IFIP Conference on Electronic Publishing: 
Redefining the Information Chain - New Ways & Voices. ICCC, 1999. 
 
1998
 
• TEI-based XML-Applications: Transcriptions, Andreas Witt. 
In: ALLCACH98, Joint Conf. of the ALLC and ACH, Debrecen, 1998. 
 
1997


• Standardisierung orthographischer Transkriptionen: 
Ein SGML/TEI-basierter Vorschlag für VERBMOBIL, 
Andreas Witt, Harald Lüngen und Dafydd Gibbon, VERBMOBIL-Memo 117. 
 



• Fröhliche Ökumene: die Grammatiktheorie in Bielefeld. 
In: Linguistik - Die Bielefelder Sicht, 
Werner Kummer und Andreas Witt. 
 
1996

 
• Sprachverarbeitung mit getypten Attribut-Wert-Matrizen. 
Dependenzgrammatik und Konzeptuelle Semantik, Andreas Witt 
Magisterarbeit an der Universität Bielefeld. 
 
1994

 
• Der Nutzen von HPSG-Satzrepräsentationen für die Bestimmung von  
Antezedenten   der Nullpronomina, VERBMOBIL-Memo 20, 
Andreas Witt und Thomas Senf. 
 


• Formalisierung von Kontext und sprachlichem Wissen mit Prioritisierter 
Circumscription, VERBMOBIL-Memo 55, Andreas Witt und Thomas Senf.