The search result changed since you submitted your search request. Documents might be displayed in a different sort order.
  • search hit 12 of 1485
Back to Result List

Dialog generation using language models

  • Large language models have become widely available to the general public, especially due to ChatGPT's release. Consequently, the AI community has invested much effort into recreating language models of the same caliber as ChatGPT, since the latter is still a technical blackbox. This thesis aims to contribute to that cause by proposing R.O.B.E.R.T., a Robotic Operating Buddy for Efficiency, Research and Teaching. In doing so, it presents a first implementation of a lightweight environment which produces tailor-made, instruction-following language models with a heavy focus on conversational capabilities that instruct themselves into a given domain-context. Within this environment, the generation of datasets, the fine-tuning process and finally the inference of a unique R.O.B.E.R.T. instance are all carried out as part of an automated pipeline.
  • Große Sprachmodelle sind inzwischen für die breite Öffentlichkeit zugänglich, insbesondere durch die Veröffentlichung von ChatGPT. Infolgedessen hat die KI-Gemeinschaft viel Mühe in die Erstellung von Sprachmodellen gleichen Kalibers wie ChatGPT investiert, da Letzteres immer noch eine technische Blackbox ist. Die vorliegende Thesis möchte einen Beitrag dazu leisten, indem sie R.O.B.E.R.T., einen Robotic OpeRating Buddy foR Efficiency, ReseaRch and Teaching vorstellt. Dabei präsentiert sie die erste Implementierung einer leichtgewichtigen Umgebung, die maßgeschneiderte, anweisungsgetreue Sprachmodelle mit einem starken Fokus auf Konversationsfähigkeit erzeugt, die sich selbst in einen gegebenen Domänenkontext einarbeiten. Innerhalb dieser Umgebung werden die Generierung von Datensätzen, der Feinabstimmungsprozess und schließlich die Inferenz einer einzigartigen R.O.B.E.R.T.-Instanz als Teil einer automatisierten Pipeline durchgeführt.

Download full text files

Export metadata

Metadaten
Author:Kevin Bönisch
URN:urn:nbn:de:hebis:30:3-791652
Place of publication:Frankfurt am Main
Document Type:Bachelor Thesis
Language:English
Date of Publication (online):2023/11/08
Year of first Publication:2023
Publishing Institution:Universitätsbibliothek Johann Christian Senckenberg
Granting Institution:Johann Wolfgang Goethe-Universität
Date of final exam:2023/07/27
Release Date:2023/11/08
Tag:Chatbot; Dialog Generation; Large Language Models; Self-Instruct
Page Number:28
Note:
The GitHub Repo to the thesis: https://github.com/texttechnologylab/ROBERT
HeBIS-PPN:51301652X
Institutes:Informatik und Mathematik / Informatik
Dewey Decimal Classification:0 Informatik, Informationswissenschaft, allgemeine Werke / 00 Informatik, Wissen, Systeme / 004 Datenverarbeitung; Informatik
4 Sprache / 40 Sprache / 400 Sprache
Sammlungen:Universitätspublikationen
Licence (German):License LogoCreative Commons - CC BY-NC-SA - Namensnennung - Nicht kommerziell - Weitergabe unter gleichen Bedingungen 4.0 International