25.6.2024

Mit Vision zum Erfolg

Wir freuen uns, die Vision-Funktion in der nele.ai Version 1.7.0 vorzustellen. Dieses Feature ermöglicht es den fortschrittlichen KI-Modellen von OpenAI und Microsoft Azure, GPT-4o und GPT-4 Turbo, sowie allen verfügbaren Claude3-Modellen, Text basierend auf der Erkennung von Bildinhalten zu generieren. Neugierig geworden? Lassen Sie uns gemeinsam erkunden, was diese Funktion für Sie bereithält.

Verfügbarkeit und Nutzung der Vision-Funktion

Mit der neuen nele.ai-Version (1.7.0) ist die Vision-Funktion nutzbar. Sie können Bilddateien in unterstützten Formaten direkt in Ihre Chatverläufe mit den oben genannten KI-Modellen hochladen. Die Modelle erstellen dann auf Aufforderung eine Beschreibung der Bilder. Das spart Zeit und ermöglicht eine Vielzahl neuer Einsatzmöglichkeiten, um Ihre Arbeitsabläufe zu optimieren.

Wichtig zu wissen

Da Vision erst seit kurzer Zeit öffentlich verfügbar ist, möchten wir die Erwartungen an das System auf einem realistischen Niveau halten. Aus diesem Grund haben wir einige Punkte zusammengestellt, was Nutzer von der aktuellen Version von Vision erwarten können und was nicht:

Was Benutzer erwarten können

Bildbeschreibung: Wenn ein Benutzer ein Bild hochlädt, kann das System eine Beschreibung des Bildes liefern. Dies ist nützlich, um den Inhalt eines Bildes zu verstehen oder um Kontext für eine Diskussion zu bieten.

Objekterkennung: Vision kann bestimmte Objekte innerhalb eines Bildes erkennen, benennen und in Gruppen/Kategorien einordnen.

Szenenerkennung: Das System kann die allgemeine Szene oder den Kontext eines Bildes beschreiben, wie zum Beispiel "ein Strand bei Sonnenuntergang" oder "eine belebte Stadtstraße".

Was Benutzer (noch) nicht erwarten sollten

Perfekte Genauigkeit: Obwohl das System den Inhalt von Bildern in der Regel gut beschreibt, ist es nicht vollkommen fehlerfrei. Es kann gelegentlich Inhalte falsch erkennen/interpretieren oder scheinbar unwichtige Details übersehen.

Persönliche Identifikation: Aus Datenschutzgründen ist das System nicht in der Lage, spezifische Personen auf einem Bild zu identifizieren.

Integration in Wissensdatenbanken: Bilder können aktuell noch nicht in Wissensdatenbanken hochgeladen werden.

Auslesen von Bildern innerhalb von Dokumenten oder PDFs: Bilder können im Standard nur als Einzeldatei erkannt werden. Bilder innerhalb von Dokumenten können nicht erkannt werden, da in Dokumenten nur Textinhalte interpretiert werden.

Bitte beachten Sie, dass Vision keine Bilder anzeigen oder auf Bilder verweisen kann. Vision ist neben DALL-E eine weitere eigenständige Anwendung, die unabhängig von den Textmodellen wie ChatGPT oder Claude3 betrieben wird. Vision kann lediglich Beschreibungen und Interpretationen basierend auf den Informationen liefern, die das Vision-System zur Verfügung stellt.

Anwendungsbeispiele

Nachfolgend finden Sie einige inspirierende Anwendungsbeispiele in Verbindung mit Vision, die Ihre eigene Kreativität anregen und als Grundlage dienen sollen. Für komplexere Anwendungszwecke ist die Einbindung der nele.ai-API in Ihre eigenen Systeme erforderlich, um Mengenverarbeitungen und eine automatisierte Integration in andere Applikationen zu ermöglichen und somit extrem schnelle und produktive Arbeitsprozesse zu realisieren.

Dokumentenmanagement und Archivierung

Automatische Beschriftung von Bildern: Fügen Sie automatisch beschreibende Texte zu Bildern in Ihren Dokumenten oder Archiven hinzu, um die Organisation und Suche zu erleichtern.

Beschriftung von Bildinhalten: Sollten Sie während der Erstellung eines Textdokuments oder einer Präsentation spontan eine Bildbeschreibung benötigen, kann diese über die Vision-Funktion mit einem einfachen Befehl direkt erstellt werden.

Prompt-Beispiel

Du bist eine professionelle Archivierungssoftware. Dein Ziel ist es eine kurze Bildbeschreibung für das angefügte Bild zu erstellen, um dieses archivieren zu können. Nutze das Folgende Format: [Passender Bild-Name – Kurze Beschreibung des dargestellten Inhalts] [17.06.2024]

E-Commerce und Einzelhandel

Produktbeschreibung: Sparen Sie wertvolle Zeit durch die automatisierte Erstellung von Produktbeschreibungen für Ihren Online-Shop basierend auf Produktbildern.

Kategorisierung von Produkten: Erleichtern Sie die Navigation für Ihre Kunden, indem Sie Produkte automatisch den passenden Kategorien zuordnen lassen.

nele.ai mit einem eingebundenen Foto von zwei Menschen in einem Elektronikfachgeschäft.

Prompt-Beispiel

Du bist eine professioneller Content Manager für Online-Shops. Dein Ziel ist es, den dargestellten Inhalt des angefügten Bildes einer der folgenden Kategorien zuzuordnen. Stelle in deiner Antwort nur den Namen der passenden Kategorie dar, ohne weitere Anmerkungen oder Kommentare. Kategorien: Elektronik, Mode, Spielwaren, Lebensmittel

Bilderkennung in sozialen Medien

Marken- und Logoverfolgung: Erkennen und beschreiben Sie Markenlogos in Bildern, die in sozialen Medien geteilt werden, um die Sichtbarkeit Ihrer Marke zu analysieren.

Inhaltsmoderation: Unterstützen Sie die Moderation Ihrer Community durch automatisches Erkennen und Beschreiben von Bildinhalten.

Zwei Bilder mit einem Raben, auf einem ist zusätzlich ein Logo zu sehen und auf dem anderen nicht.

Prompt-Beispiel

Prompt 1: Du bist ein professionelles Bildanalyse-Tool. Dein Ziel ist es, ein vorgegebenes Logo in Bilder zu identifizieren. Merke dir zu diesem Zweck das beigefügte Logo und bestätige mir dies.
Prompt 2: Analysiere nun das hier beigefügte Bild und teile mir mit, ob das Logo aus dem vorherigen Schritt in diesem Bild dargestellt ist. Antworte nur mit „Ja“ oder „Nein“, ohne weitere Anmerkungen oder Kommentare.

Marketing und Werbung

Content-Analyse: Verbessern Sie Ihre Werbekampagnen, indem Sie die visuellen Inhalte analysieren und deren Effektivität steigern.

Personalisierung: Erstellen Sie automatisch personalisierte Marketingbotschaften, die auf den analysierten Bildinhalten basieren.

Prompt-Beispiel

Du bist eine professioneller Marketing-Experte. Dein Ziel ist es, einen personalisierten Marketingtext zu dem beigefügten Plakat für die vorgegebene Zielgruppe zu erstellen. Der Text sollte kurz und prägnant sein, damit er auf dem Plakat ergänzt werden kann. Die anzusprechende Zielgruppe ist: Junge Erwachsene und Berufseinsteiger.

Immobilien und Bauwesen

Immobilienanzeigen: Erstellen Sie detaillierte Beschreibungen für Immobilienfotos in Ihren Anzeigenportalen und steigern Sie so die Attraktivität Ihrer Angebote.

Baufortschritt: Dokumentieren und beschreiben Sie den Baufortschritt durch regelmäßige Fotoaufnahmen, um eine bessere Projektübersicht zu erhalten.

Prompt-Beispiel

Prompt 1: Du bist ein professioneller Baugutachter. Deine Aufgabe ist es, den Baufortschritt anhand der angefügten Fotos zu dokumentieren. Nutze das Folgende Format: [Passender Titel zum aktuellen Zustand des Gebäudes – Kurze Beschreibung des aktuellen Baufortschritts im Vergleich zu der vorherigen Version] [10.06.2024]
Prompt 2: Anbei ist ein Foto mit dem aktuellen Baufortschritt. Nutze heute folgendes Datum: [17.06.2024]

Die Vision-Funktion von nele.ai revolutioniert die Art und Weise, wie wir mit visuellen Inhalten arbeiten. Sind Sie bereit, dieses leistungsstarke Tool auszuprobieren? Lassen Sie sich von der Effizienz und Vielseitigkeit der Bildinhalts-Erkennung begeistern und erleben Sie selbst, wie sie Ihre Prozesse optimieren kann. Probieren Sie es noch heute aus!

Letzte Beiträge