Linguistik
Refine
Year of publication
- 2006 (7) (remove)
Document Type
- Book (7) (remove)
Language
- German (4)
- English (2)
- Portuguese (1)
Has Fulltext
- yes (7)
Is part of the Bibliography
- no (7)
Keywords
- Computerlinguistik (1)
- Grammatik (1)
- Japanisch (1)
- Kommunikation (1)
- Marendje (1)
- Marenje (1)
- Maschinelle Übersetzung (1)
- Mosambik (1)
- Mozambique (1)
- Moçambique (1)
Institute
- Extern (2)
Prefácio (...) O Objectivo A finalidade deste livrinho é de publicar dados de uma língua minoritária para contribuir ao património cultural da nação moçambicana, de que Imarenje faz parte. O próximo passo será a implem-entação de mais correcções e modificações necessárias, seja nos detalhes ortográficos, seja na escolha de exemplos e frases. Neste sentido faço um apelo a todos que se interessam pelo desenvolvi-mento das línguas nacionais, em particular aos falantes de Imarenje: Façam comentários, contribuam para que futuras edições deste livrinho possam ser mais ricas! Oliver Kröger Editor da série Monografias Linguísticas Moçambicanas Nampula, Outubro de 2006
Wenn man heute neue lexikografische Projekte plant, ist es unerlässlich, sowohl den Computer als Arbeitswerkzeug, als auch das elektronische Medium als Publikationsmedium in die Konzeption einzubeziehen. Dabei ist es oft erwünscht, die einmal erarbeiteten lexikografischen Daten mehrfach zu verwerten, sei es als gedruckte und elektronische Version eines Wörterbuchs, sei es einmal als eine lange und kurze Ausführung eines lexikografischen Produkts oder als eine ausschließlich elektronische, aber benutzeradaptiv unterschiedliche Darstellung der gleichen lexikografischen Daten. (Vgl. u.a. Schryver 2003, Storrer 2001, Engelberg/Lemnitzer 2001, S. 220ff.) Solche Wünsche sind mit den heutigen Möglichkeiten des Computereinsatzes zu erfüllen, doch müssen die lexikografischen Prozesse entsprechend geplant werden. Vor allem die Frage der Strukturierung und Aufbereitung der lexikografischen Daten muss sorgfältig überlegt sein, denn hierbei wird der Grundstein dafür gelegt, wie flexibel auf die Daten zugegriffen werden kann und wie unterschiedlich darstellbar sie sind. Für einen inhaltlich wie gestalterisch möglichst flexiblen Umgang mit lexikografischen Daten ist daher eine bestimmte Form der Datenmodellierung und -auszeichnung erforderlich. Das Stichwort, das in diesem Zusammenhang immer wieder fällt, ist das der medienneutralen Datenhaltung. Doch wie müssen lexikografische Daten ausgezeichnet werden, damit diese Kodierung losgelöst von den Eigenschaften einer bestimmten Präsentation ist? Welche Richtlinien können hier projektübergreifend angewandt werden? Die moderne Wörterbuchforschung gibt darauf noch keine hinreichenden Antworten. Vor allem fehlen klare, theoretisch fundierte und intersubjektiv nachvollziehbare Richtlinien für die maßgeschneiderte Modellierung lexikografischer Daten. Denn oft ist es in lexikografischen Projekten nicht möglich, eine Standard-Modellierung wie die TEI2 oder leXeML3 anzuwenden, da diese kein ausreichend granulares und maßgeschneidertes Modellierungsinventar bieten, um die lexikografischen Daten später sehr flexibel darstellen zu können und verschiedenartige Zugriffsstrukturen zu bieten. Doch auch bei der Entwicklung einer maßgeschneiderten Modellierung ist es wichtig, einen klaren Leitfaden für die Datenmodellierung zu haben, um nicht bei jedem Phänomen neu entscheiden zu müssen, wie die Modellierung aussehen soll. Ziel dieses Aufsatzes ist es daher, ein Konzept vorzustellen, welche Eigenschaften lexikografischer Daten Gegenstand für eine Modellierung einer lexikografischen Datenbasis sein sollen, wie eine solche Modellierung aussehen kann und schließlich auch, welche Folgen diese Art der Modellierung für die lexikografische Praxis hat. Ein wichtiger Teil dieses Konzepts der Inhaltsstrukturen ist dabei auch die Entwicklung und Ausgestaltung einer eigenen Terminologie; auch in Abgrenzung zu Wiegands Konzept der Mikrostrukturen (vgl. Abschnitt 5).
Dieser Beitrag beleuchtet lexikalische Ausdrücke näher, die in einer Lesart durch eine synonyme Relation verbunden sind. Im Vordergrund steht die korpusgestützte Untersuchung paradigmatischer Kontextanpassung dieser Relationspaare. Es wird gezeigt, wie diese Sinnrelation insbesondere innerhalb einer Lesart kontextuell variieren kann oder spezifiziert wird und wie anhand von Korpusdaten diese variierenden Strukturen lexikologisch erfasst und lexikografisch beschrieben werden können. Diese Beobachtungen entstanden auf der Basis der Wörterbucharbeit im Projekt elexiko und stellen erste Ergebnisse hinsichtlich variabler paradigmatischer Strukturen dar, die auf der Basis eines umfangreichen Korpus, des für lexikografische Zwecke zusammengestellten elexiko-Korpus, gewonnen wurden. Es wird dargestellt, wie Korpusbeobachtungen hinsichtlich synonymer Variabilität im Projekt elexiko lexikografisch umgesetzt werden. Dabei soll verdeutlicht werden, wie man ein Synonymwörterbuch gebrauchsorientierter gestalten kann, wie sich neu gewonnene Korpuserkenntnisse lexikografisch einarbeiten lassen und wie dabei gleichzeitig nach angemessenen Präsentationsformen gesucht werden muss.
Der traditionsreiche Kultur-, Kontakt- und Integrationsraum Schlesien stellt eine Region im Überlappungs- und Durchdringungsbereich von Kulturen, Religionen, Sprachen und Nationen dar, wo sich im historischen Verlauf eine spezielle Sensibilität für Probleme und Chancen kultureller und sprachlicher Pluralität sowie für die Geschichtlichkeit und Dynamik multikultureller Zusammenhänge entwickeln konnte. Daher verkörpert er ein besonders wertvolles Erinnerungsgut (vgl. zur Thematik Engel/Honsza 2001 und Lasatowicz 2004). Solche Regionen werden nun mit Blick auf ihre Ressourcen des multikulturellen Gedächtnisses im Zuge von gesamteuropäischen Prozessen – auch im Sinne einer neuen „mentalen Welt“ – zunehmend aufgewertet. Die kulturelle und sprachliche Situation, einschließlich der Sprach gebrauchsstrukturen, ist in derartigen multi-ethnischen Arealen im Spannungsfeld von mehreren Sprachen, Kulturen und Identitäten naturgemäß äußerst vielschichtig. Entsprechend dieser komplexen sprachkommunikativen Realität in Mehrsprachigkeits-Kulturen setzt ihre wissenschaftlich adäquate Erfassung, Beschreibung und Explizierung ein mehrperspektivisches multi-, inter- und transdisziplinäres Herangehen voraus. Denn die Bearbeitung der entsprechend weiten Fragestellungen erfordert einen relevanten Betrachtungsrahmen und eine angepasste Methodologie, die sowohl dem komplexen Gegenstand als auch den Erkenntnisinteressen der Praxis gerecht werden. Müssen doch die Linguisten mit der mannigfaltigen sprachkommunikativen Realität mindestens (a) systemorientiert, (b) soziologisch und (c) „technologisch“ umgehen und sie entsprechend reflektieren können. Da aber die Gesamtthematik – wie sie auch im Titel der Tagung zum Ausdruck kommt – einen etwas sperrigen Gegenstand bildet, konzentriert sich der vorliegende Beitrag lediglich auf einen besonders wichtigen Aspekt. Mithin lautet die erkenntnisleitende Forschungsfrage: Wie kann man inter- bzw. transkulturelle,4 bi- bzw. multilinguale Kommunikationsräume im Kontakt der Kulturen mit den für sie charakteristischen zweisprachigen Diskursmodi (die oft durch verschiedene Ausprägungen von Hybridität gekennzeichnet sind) in disziplinärer Hinsicht sinnvoll analysieren? Also in welchem generellen Verstehensrahmen bzw. unter welchem "Blickwinkel", im Kompetenzbereich welcher linguistischen Teildisziplin, mit welcher Methodologie lassen sich die im Blickpunkt stehenden sprachkommunikativen Konstellationen, bilingualen Sprechhandlungen und entsprechenden Kontakt-, Interaktions-, Überblendungs- und Konvergenzphänomene sachangemessen untersuchen und heuristisch interpretieren? Solche Fragen erlangen m.E. angesichts der aktuellen Fachentwicklung der Sprachwissenschaft zunehmend Relevanz. War doch im Rahmen der kartesischen Sicht noch eine Einheit von Rationalität und Wissenschaft gegeben, ist spätestens seit Thomas Kuhn (1996) klar geworden, dass man es heute mit einem Nach- und Nebeneinander verschiedener (z.T. sogar inkommensurabler) „Paradigmen“ (Kuhn 1996), „Denkstile“ (vgl. Fleck 2002), „disziplinärer Matrizes“ (Kuhn 1977, 392 f.) oder Wissenschaftskulturen als diskursive Terrains zu tun hat.
In this text, we describe the development of a broad coverage grammar for Japanese that has been built for and used in different application contexts. The grammar is based on work done in the Verbmobil project (Siegel 2000) on machine translation of spoken dialogues in the domain of travel planning. The second application for JACY was the automatic email response task. Grammar development was described in Oepen et al. (2002a). Third, it was applied to the task of understanding material on mobile phones available on the internet, while embedded in the project DeepThought (Callmeier et al. 2004, Uszkoreit et al. 2004). Currently, it is being used for treebanking and ontology extraction from dictionary definition sentences by the Japanese company NTT (Bond et al. 2004).