Refine
Year of publication
Document Type
- Conference Proceeding (23)
- Book (8)
- Part of a Book (6)
- Article (3)
- Working Paper (3)
- Report (2)
- Diploma Thesis (1)
- Preprint (1)
- Review (1)
Has Fulltext
- yes (48)
Is part of the Bibliography
- no (48)
Keywords
- Computerlinguistik (48) (remove)
Institute
- Extern (32)
- Informatik (7)
- Gesellschaftswissenschaften (1)
- Universitätsbibliothek (1)
Data Mining
(2016)
In öffentlichen Debatten ist bereits viel spekuliert worden, auf welche Weise soziale Netzwerke die Zukunft ihrer Mitglieder vorhersehen und planen können. Diese Frage kann jedoch ohne Rekurs auf die Dominanz der angewandten Mathematik und der Medieninformatik nicht ausreichend beantwortet werden. Denn beide Praxis- und Wissensfelder haben mit ihren stochastischen Analysetechniken von Nutzeraktivitäten die digitale Vorhersagekultur der Sozialen Medien im Web 2.0 erst ermöglicht, die es früher in diesem Ausmaß und Machtanspruch noch nicht gegeben hat.
Der vorliegende Beitrag […] begründet […] die Relevanz des Kulturbegriffs in Fragen der Digitalisierung philologisch und geht erstens davon aus, daß kulturelle Kompetenz sich von philologischer Kompetenz nicht unterscheidet. Daraus läßt sich ein privilegiertes Mitspracherecht der Philologie in kulturellen Fragen ableiten. Dieses Mitspracherecht betrifft zweitens gerade Projekte der Digitalisierung, weil sie in einem engen Verhältnis zu einem der Kernbereiche der Philologie stehen: zur Edition. Die Diskussion um die "Google Buchsuche" hat bislang genau diesen Zusammenhang zwischen Kultur, Philologie und Digitalisierung vernachlässigt. Seine Berücksichtigung kann zu einer tiefenschärferen Bewertung des Unternehmens in kultureller Perspektive beitragen und zugleich den notorischen Rekurs auf den Kulturbegriff in der Google-Debatte erklären helfen.
Sprachtechnologie für übersetzungsgerechtes Schreiben am Beispiel Deutsch, Englisch, Japanisch
(2009)
Wir [...] haben uns zur Aufgabe gesetzt, Wege zu finden, wie linguistisch basierte Software den Prozess des Schreibens technischer Dokumentation unterstützen kann. Dabei haben wir einerseits die Schwierigkeiten im Blick, die japanische und deutsche Autoren (und andere Nicht-Muttersprachler des Englischen) beim Schreiben englischer Texte haben. Besonders japanische Autoren haben mit Schwierigkeiten zu kämpfen, weil sie hochkomplexe Ideen in einer Sprache ausdrücken müssen, die von Informationsstandpunkt her sehr unterschiedlich zu ihrer Muttersprache ist. Andererseits untersuchen wir technische Dokumentation, die von Autoren in ihrer Muttersprache geschrieben wird. Obwohl hier die fremdsprachliche Komponente entfällt, ist doch auch erhebliches Verbesserungspotential vorhanden. Das Ziel ist hier, Dokumente verständlich, konsistent und übersetzungsgerecht zu schreiben. Der fundamentale Ansatz in der Entwicklung linguistisch-basierter Software ist, dass gute linguistische Software auf Datenmaterial basiert und sich an den konkreten Zielen der besseren Dokumentation orientiert.
Die Entwicklung eines individuellen Standards „vom grünen Tisch“ führt selten zu zufriedenstellenden Ergebnissen. Bei der automatischen Prüfung stellt man schnell fest, dass die „ausgedachten“ Regeln einer systematischen Anwendung nicht standhalten. Bei der Implementierung solcher Richtlinien stellt man fest, dass sie oft zu wenig konkret formuliert sind, wie z.B. „formulieren Sie Handlungsanweisungen knapp und präzise“. Wie jedoch kann ein Standard entwickelt werden, der zu einem Unternehmen, seiner Branche und Zielgruppen passt und für die automatische Prüfung implementiert werden kann? Sprachtechnologie hilft effizient bei der Entwicklung individueller Richtlinien. Durch Datenanalyse, Satzcluster und Parametrisierung entsteht ein textspezifischer individueller Standard. Ist damit aber der Gegensatz von Kreativität und Standardisierung aufgehoben?
Multicomponent Tree Adjoining Grammars (MCTAG) is a formalism that has been shown to be useful for many natural language applications. The definition of MCTAG however is problematic since it refers to the process of the derivation itself: a simultaneity constraint must be respected concerning the way the members of the elementary tree sets are added. This way of characterizing MCTAG does not allow to abstract away from the concrete order of derivation. In this paper, we propose an alternative definition of MCTAG that characterizes the trees in the tree language of an MCTAG via the properties of the derivation trees (in the underlying TAG) the MCTAG licences. This definition gives a better understanding of the formalism, it allows a more systematic comparison of different types of MCTAG, and, furthermore, it can be exploited for parsing.
This demo abstract describes the SmartWeb Ontology-based Information Extraction System (SOBIE). A key feature of SOBIE is that all information is extracted and stored with respect to the SmartWeb ontology. In this way, other components of the systems, which use the same ontology, can access this information in a straightforward way. We will show how information extracted by SOBIE is visualized within its original context, thus enhancing the browsing experience of the end user.
In this paper we describe SOBA, a sub-component of the SmartWeb multi-modal dialog system. SOBA is a component for ontologybased information extraction from soccer web pages for automatic population of a knowledge base that can be used for domainspecific question answering. SOBA realizes a tight connection between the ontology, knowledge base and the information extraction component. The originality of SOBA is in the fact that it extracts information from heterogeneous sources such as tabular structures, text and image captions in a semantically integrated way. In particular, it stores extracted information in a knowledge base, and in turn uses the knowledge base to interpret and link newly extracted information with respect to already existing entities.