Infos für Administratoren
Admin-BereichSSO mit SAML 2.0
Wissenswertes
AllgemeinKI-Modelle

Wissenswertes zum Thema KI-Modelle

Anbieter- und Modellvielfalt in nele.ai

nele.ai ist eine Plattform, die eine breite Palette generativer Sprachmodelle von verschiedenen Anbietern zur Verfügung stellt. Zu den derzeit verfügbaren Partnern zählen renommierte Unternehmen wie OpenAI, Microsoft Azure, Anthropic und Mistral. Darüber hinaus bietet nele.ai Modelle wie Llama 3 8B, Llama 370B, Mistral 7B und Mixtral 8x7B, die auf eigenen Servern betrieben werden können.

Durch die Partnerschaften stellt nele.ai stets die neuesten KI-Modelle dieser Anbieter bereit und gewährleistet dabei die Einhaltung hoher Sicherheits- und Datenschutzstandards.

Europäische Serverstandorte als Alternative zu den USA

Besonders wichtig ist, dass leistungsstarke KI-Modelle auch auf europäischen Servern angeboten werden. Dies ermöglicht es Organisationen, die Daten innerhalb Europas halten müssen, diese Modelle uneingeschränkt zu nutzen. Aus diesem Grund bietet nele.ai nahezu alle KI-Modelle auch auf europäischen Servern an.

KI-Modelle und Tokengrößen im Chat-Kontext

Die angebotenen KI-Modelle variieren in ihren Token-Größen innerhalb ihres Chat-Kontexts (siehe dazu auch unser Blogbeitrag zum Unterschied zwischen Wissensdatenbank (RAG) vs. Chat Kontext), typischerweise mit Größen wie 16k, 128k oder 200k. Es ist wichtig zu verstehen, was ein Token ist: Die kleinsten Einheiten, aus denen KI-Modelle bestehen. Diese Einheiten können Buchstaben, Silben, Abkürzungen oder ganze Wörter sein. Token sind vergleichbar mit Puzzleteilen, die zu Antworten zusammengesetzt werden.

Der Chat-Kontext begrenzt die Anzahl der Tokens, die in einem Chat verarbeitet werden können. Als Faustregel entsprechen 750 englische Wörter etwa 1.000 Token, während im Deutschen 1.000 Token ca. 350 Wörtern entsprechen.

Verrechnung durch unser flexibles und transparentes Preismodell

Die Kosten für KI-Modelle bei nele.ai variieren je nach verwendetem Modell und der Anzahl der Token bzw. Wörter. Bei Sprachmodellen erfolgt die Abrechnung pro Token, während bei Bildmodellen der Preis beispielsweise von der gewünschten Bildauflösung abhängt. nele.ai hat ein flexibles und transparentes Preismodell auf Basis von Credits eingeführt.

Der besondere Vorteil von nele.ai besteht darin, dass statt fixen Monatsgebühren pro Nutzer eine nutzungsbasierte Abrechnung angeboten wird. Dies erlaubt es, dass jeder Mitarbeitende einer Organisation grundsätzlich Zugang erhält, ohne pauschale Kosten zu verursachen. Mit dem Wissen, dass der Bedarf an generativer KI von Mitarbeitenden variiert, garantiert dieses Modell faire und angemessene Kosten.

Ein wichtiger Faktor in diesem Modell ist der KI-Volumen-Verbrauchsfaktor, der das Verhältnis der Kosten zum Credit-Verbrauch beschreibt. Zum Beispiel hat das GPT-3.5-Modell einen Faktor von etwa 0,06, verglichen mit dem Referenzmodell Opus mit einem Faktor von 1. Modelle wie GPT-4o liegen bei einem Faktor von 0,33, Claude 3.5 Sonnet bei 0,25 und Haiku bei 0,02.

Diese Struktur ermöglicht eine effektive Kostenoptimierung und eine bessere Ressourcennutzung.

Zusätzlich erleichtert die Administrationsoberfläche (manage.nele.ai) von nele.ai die Verwaltung der verfügbaren KI-Modelle und die damit verbundenen Kosten. Administratoren können festlegen, welche KI-Modelle für ihr Team verfügbar sind, und einzelne Nutzer hinsichtlich des KI-Volumens einschränken.