Recraft, das KI-Labor hinter dem viralen Red Panda-Modell, ist möglicherweise eine der leistungsstärksten Plattformen für die generative Bilderstellung, die ich je verwendet habe. Neben der fotorealistischen Bild- und sogar Vektorgrafikgenerierung verfügt es über einen beeindruckenden Editor, der auf den zugrunde liegenden Modellen basiert.
Kurz vor der Offenbarung, dass Red Panda war tatsächlich Recraft v3 Ich hatte die Gelegenheit, mit Anna Veronika Dorogush, Gründerin und CEO von Recraft, zu sprechen, um einen Einblick in das zu bekommen, was die Plattform von anderen unterscheidet. einschließlich MidjourneyIdeogramm und sogar Canva.
Recraft wurde von Anfang an als KI-Designtool und nicht als Bildgenerator entwickelt. Dazu gehört die Möglichkeit, konsistente Stile zu erstellen, Bilder zu bearbeiten und Inpainting durchzuführen, um sicherzustellen, dass Sie genau das erhalten, was Sie von der Ausgabe erwartet haben. Sein Text macht es auch außergewöhnlich. Es wird in unsere Liste aufgenommen beste KI-Bildmodelle.
Dorogush sagte mir: „Du musst etwas Einzigartiges bauen. Es reicht nicht aus, qualitativ hochwertige Bilder zu produzieren, man muss etwas schaffen, das die Aufmerksamkeit der Menschen fesselt.“
Was können Sie mit Recraft machen?
Mit Recraft können Bilder, gerenderter Text, Vektorgrafiken und alle Formen generativer KI-Kunst erstellt werden. Seine wahre Stärke liegt im Editor, der unabhängig von den Modellen ist. Ich konnte sehr schnell ein Poster erstellen und bestimmte Elemente bearbeiten, um sie besser an meine Bedürfnisse anzupassen.
Den Editor, auch bekannt als „Infinite Canvas“, gibt es schon seit einiger Zeit, aber erst das beeindruckende neue Recraft v3 (auch bekannt als „Red Panda“) erregte größere Aufmerksamkeit auf das Startup.
Seine Fähigkeit, Text präzise wiederzugeben, Anweisungen zu befolgen und fotorealistische Bilder zu erstellen, hilft Recraft, sich in einem sehr überfüllten Markt abzuheben. Recraft hatte sich dank der Canvas-Funktion und der Bearbeitungsfunktion bereits als leistungsstarke Designplattform etabliert.
Allerdings entwickelt inzwischen auch jede andere große KI-Plattform Editoren, darunter auch Ideogram und Midjourneyund Editoren wie Canva und Illustrator fügen KI hinzu – das neue Modell trägt also dazu bei, die Nase vorn zu haben.
Text ist der Schlüssel zur Verbesserung des KI-Designs
Dorogush erzählte mir, dass monatelange Arbeit in das neue Modell gesteckt wurde, einschließlich der Entwicklung einer anderen Technik zum Trainieren von Daten, um eine genauere Ausgabe, insbesondere von Text, zu gewährleisten.
„Wir haben zwei große Fortschritte gemacht“, sagte sie zu Tom's Guide. „Das eine ist die Fähigkeit, lange Texte zu generieren“, und das andere ist die Ästhetik. Die Ausgabe sieht besser aus, die Stile sind konsistenter und der Realismus ist eine deutliche Verbesserung gegenüber früheren Generationen.
All dies führte dazu, dass „Red Panda“ die Bestenliste der KI-Bildgeneratoren anführte. Dabei bewerten Menschen die Ausgabe von zwei unbenannten Modellen aus derselben Eingabeaufforderung. Recraft v3 ist beigetreten Mitten in der ReiseIdeogramm und Flux oben im Diagramm.
Generell verbessern sich alle Modelle in puncto Ästhetik und Realismus, doch nur sehr wenige schaffen es, lange oder mehrere Textblöcke präzise wiederzugeben. Diese Fähigkeit ist erforderlich, wenn Sie sich als Designplattform und nicht nur als Bildgenerator präsentieren.
Recraft hat es mit v3 geknackt. Dorogush erklärte: „Wir verwenden eine andere Technik, und soweit ich weiß, sind wir derzeit die Einzigen, die diese Technik anwenden. Anstatt das Modell so zu trainieren, dass Sie nur das Bild und die Schriftart haben, geben wir auch die Position des Textes ein.“
„Wir sagen zuerst die Positionen des Textes voraus und geben sie dann als Eingaben in das Modell ein. Das Modell verfügt dann über viel mehr Informationen darüber, wie Text gezeichnet wird, und es ist für das Modell einfacher, dies zu tun.“ Dies erleichtert auch spätere Inpainting-Änderungen.
Was kommt als nächstes für Recraft?
Entfesseln Sie Ihren inneren Surrealisten! Mit der Inpainting-Funktion von Recraft können kleine Änderungen zu großen künstlerischen Statements führen. Wählen Sie einfach das Lasso aus, umreißen Sie den Bereich, geben Sie die Eingabeaufforderung ein und klicken Sie auf „Neu gestalten“. Magritte wäre stolz. Beginnen Sie mit der Erstellung: https://t.co/t6beRXHrlG#RecraftAI #red_panda pic.twitter.com/XZvuOUgGGy7. November 2024
Recraft muss die Charakterkonsistenz verbessern. Alle KI-Bildmodelle müssen an der Zeichenkonsistenz arbeiten, und einige bewältigen dies durch Feinabstimmung oder Bildreferenzen. Dies ist jedoch noch wichtiger, wenn Sie ein Unternehmen sind, das Designern sein Produkt vorschlägt.
Stellen Sie sich vor, Sie möchten ein Bild für eine Kampagne erstellen, in der ein Model zu sehen ist. Sie erstellen das Bild des Modells – Ihren Charakter – und es sieht großartig aus, aber jedes weitere Bild desselben Modells sieht wie eine etwas andere Person aus. Das ist die aktuelle Situation ohne Arbeit an der Charakterkonsistenz und wird für professionelle Designumgebungen nicht funktionieren.
„An der Charakterkonsistenz wird noch gearbeitet“, erklärte Dorogush und fügte hinzu, dass sie sich „sehr bewusst ist, dass dies ein großes Problem ist“. Es geht jedoch über die Lösung für das Modell hinaus, da es auch alles im Bild umfasst, einschließlich des Produkts, das im Mittelpunkt der Kampagne stehen könnte.
Eine kurzfristige Lösung könnte Inpainting und Outpainting sein. Dies ist eine Möglichkeit, ein vorhandenes KI-Bild (oder ein beliebiges Bild) mithilfe künstlicher Intelligenz zu bearbeiten. Sie könnten beispielsweise ein Poster mit Platz für ein Telefon erstellen und den Bildschirm nach der Erstellung mithilfe von Inpainting anpassen. Dies ist auch nützlich, um Text nach der Generierung zu bearbeiten, da selbst die besten Modelle Fehler machen oder nicht gleich beim ersten Mal die exakte Schriftart richtig hinbekommen.
„In den nächsten Monaten wird es eine Reihe von Verbesserungen geben“, sagte Dorogush. Dazu gehört auch die Bearbeitungsfunktion. „Im Moment können Sie beispielsweise ein Bild mit Text erstellen oder Text darin positionieren.“ Mit Inpainting können Sie jedoch ein Textfeld positionieren und in diesem Bereich genau den Text generieren, den Sie möchten.“
Weitere Updates folgen in Kürze, einschließlich einer verbesserten Außenbemalung. „Das ist für Produktionsszenarien sehr wichtig“, sagte sie. „Sie können das Bild horizontal oder vertikal erweitern, um das Bild in verschiedenen Formaten für unterschiedliche Muster zu erhalten“, ohne den Hauptfokuspunkt zu ändern.
Letzte Gedanken
Recraft ist das Neueste in einer wachsenden Reihe von KI-„Produkten“. Wir gehen davon über, dass es nur noch um das Modell und was es potenziell erreichen könnte, hin zur Schaffung eines realen Produkts mit einem tatsächlichen Satz an Anwendungsfällen und Tools.
Midjourney und Ideogram gehen mit Editor und Canvas in diese Richtung. Sogar ChatGPT verfügt jetzt über eine Leinwand für die Text- und Codebearbeitung und Claude hat seine Projekte und Artefakte. Dies ist die Richtung, in die KI-Tools gehen werden, und je besser das zugrunde liegende Modell – wie wir bei Red Panda gesehen haben – desto besser können die darauf basierenden Produkte funktionieren.