Audiodateien einbinden und transkribieren
In einen Chat können Sie auf verschiedene Arten und Weisen Informationen aus externen Quellen einbeziehen. Zum einen gibt es die Möglichkeit, Wissensdatenbanken zu verwenden. Zum anderen besteht die Option, Webseiten oder Dokumente zu nutzen. Dieses Vorgehen wird bereits in einem separaten Handbuch-Eintrag beschrieben.
In diesem Artikel möchten wir speziell auf den Anwendungsfall eingehen, Audiodateien hochzuladen, transkribieren zu lassen und zu nutzen.
Audiodateien auswählen und hochladen

Möchten Sie eine Audiodatei dem Gesprächsverlauf hinzufügen, klicken Sie im ersten Schritt im Chat auf das Büroklammer-Symbol (1). Es öffnet sich ein Menü, in dem Sie anschließend „Dateien, Bilder oder Audio hochladen“ (1a) auswählen.
Beachten Sie, dass die Funktion, Audiodateien zu verwenden, zunächst durch Ihren Administrator freigeschaltet werden muss. Ist dies nicht der Fall, sehen Sie an dieser Stelle lediglich die Schaltfläche „Dateien oder Bilder hochladen“, anstatt „Dateien, Bilder oder Audio hochladen“. Wenden Sie sich in diesem Fall an Ihren Administrator.
Fahren Sie nach dem Klick auf „Dateien, Bilder oder Audio hochladen“ mit der Auswahl einer Datei von Ihrem Computer oder Mobilgerät fort und bestätigen Sie diese.

Im zweiten Schritt listet nele.ai die eingebundenen Elemente im Chat-Input (2). Geben Sie abschließend Ihren Prompt ein und klicken Sie auf Abschicken (3).
Es können bis zu 5 unterschiedliche Elemente pro Nachricht hinzugefügt werden, also beispielsweise zwei Bilder, eine Webseite und zwei Audio-Dateien.
Beachten Sie, dass sich eingebundene Elemente auf das Tokenvolumen Ihres Chats auswirken. Es ist entscheidend zu wissen, dass die Kapazität eines Chats durch die sogenannten Tokens begrenzt ist. 1.000 Token entsprechen grob ca. 750 Wörtern. Verschiedene KI-Modelle von nele.ai können eine unterschiedliche Anzahl von Token handhaben, was direkten Einfluss auf die Länge der Inhalte hat, die das Modell in einem Durchgang verarbeiten kann. Das bedeutet, dass auch eingebundene Webseiten, Audiodateien und/oder Dokumente dieses Tokenvolumen langsam füllen und - wenn Sie einen großen Umfang haben - ausreizen können. Mehr zu KI-Modellen und deren Tokenvolumen pro Chat können Sie in unserem Handbucheintrag über KI-Modelle nachlesen.
Datei-Informationen und Funktionen

Eingebundene Elemente, wie in diesem Fall die Audio-Datei, werden in Ihrem Chatverlauf angezeigt und können von dort aus auch nachträglich angepasst oder gelöscht werden (klicken Sie dazu auf das Stift-Symbol, wenn Sie mit der Maus über eine Chat-Nachricht fahren).
Bei Audio-Dateien können Sie über das Info-Icon (1) am hochgeladenen Element weitere Informationen einsehen.

Dazu zählen neben Dateiname und Wortanzahl das ausführliche Transkript des Inhalts (2). Dieses können Sie entweder in den Zwischenspeicher Ihres Gerätes kopieren (3) oder als txt-Datei herunterladen (4).
Unterstützte Audioformate
Derzeit werden folgende Audio-Formate von nele.ai unterstützt:
aac
flac
mp3
mp4
mpeg
mpga
m4a
ogg
wav
webm