Kandinsky es la red neuronal de Sber para la generación de imágenes. Es capaz de crear imágenes a partir de consultas de texto, así como de presentar variaciones de imágenes ya creadas y combinar estilos de distintos fotogramas.
El sistema detecta consultas en diferentes idiomas, incluido el ruso. La última versión del servicio es actualmente Kandinsky 2.2. La red neuronal tiene en cuenta parámetros adicionales a la hora de generar resultados, como el fondo y el estilo.
Como ya se ha dicho, Kandinsky no sólo es capaz de producir imágenes a la carta, sino también de darles forma mezclando distintos conceptos o estilos. La red neuronal de Sbera admite varios modos de funcionamiento. En el estándar, genera un resultado a partir del promt de texto introducido. Al combinar fotogramas, analiza los dos y compone uno nuevo a partir de ellos.
También puedes "alimentar" el sistema con un cuadro o una foto ya hechos, añadiendo las características necesarias. En este caso, Kandinsky creará una nueva imagen, teniendo en cuenta el ejemplo visual y el Promt al mismo tiempo.
Además, el servicio admite el modo outpainting. Esta función permite añadir nuevos detalles al marco acabado que antes no existían. Otro modo es la transferencia de estilos. Con su ayuda puedes utilizar algunos detalles de la imagen original en la imagen generada.
La red neuronal está disponible a través de varios servicios en distintos formatos. Por ejemplo, Kandinsky puede probarse en el sitio web Fusion Brain. Allí se pueden generar imágenes mediante comandos de texto y utilizar la herramienta de garabatos.
El bot oficial de Kandinsky también está disponible en Telegram. Con su ayuda puedes crear imágenes basadas en texto, mezclar dos imágenes diferentes, transferir estilo y formar variaciones de marcos ya preparados.
Además, el sitio web de ruDALL-E dispone de un formulario para crear imágenes con ajustes básicos. La red neuronal Kandinsky también está integrada en el asistente de voz Salyut de Sber. Aquí es necesario ejecutar la habilidad "Activar al artista" para generar imágenes. Además, el servicio puede utilizarse a través del bot VKontakte y en la web oficial de Sber.
El bot de Telegram sólo tiene que especificar el modo de funcionamiento con el botón correspondiente y, a continuación, introducir el texto de la consulta o subir las imágenes necesarias. El servicio es gratuito y produce resultados con bastante rapidez. Es raro que se produzcan fallos y errores, a no ser que haya un gran número de comandos simultáneos de los usuarios.
La herramienta de edición y ampliación de marcos de Kandinsky sólo está disponible en el sitio de Fusion Brain. Además, dispone de una amplia área de imagen, un cuadro de texto promt y un menú desplegable con docenas de estilos para que puedas trabajar con ellos. Puede elegir entre una lista de ejemplos populares que van desde el ciberpunk hasta los dibujos animados soviéticos.
No es necesario marcar el estilo en los ajustes, puede especificarse en una consulta de texto. Incluso puede escribir una variante que aún no figure en la lista básica. En este caso, debe dejar la opción "Sin estilo" en el menú.
Para las imágenes, puedes seleccionar una de las relaciones de aspecto y resoluciones disponibles. La red neuronal produce fotogramas de 1 152 × 768 píxeles, 1 024 × 1 024 píxeles, 680 × 1 024 píxeles y viceversa, 576 × 1 024 píxeles y viceversa.
Dorisovka permite crear cuadros a partir de pequeñas ideas. Basta con seleccionar una parte del cuadro acabado y un área vacía, y a continuación introducir un comando de texto, mediante el cual Kandinsky determinará exactamente cómo ampliar el cuadro especificado añadiéndole detalles o extensiones de objetos.
Cuando trabaje en proyectos con gráficos, podrá generar rápidamente nuevas ideas con la ayuda de la red neuronal Sbera. La herramienta Borrar de Fusion Brain es útil para este fin. Basta con borrar una parte del cuadro terminado y, a continuación, añadir nuevos elementos al espacio desocupado mediante la descripción de texto. Puede mantener el cuadro en el mismo estilo o combinar conceptos diferentes.
Al transferir un estilo de un cuadro terminado a otro nuevo, Kandinsky te permite utilizar las poses de las personas de una fotografía o pintura, así como el esquema general de la imagen original. Por ejemplo, puedes sustituir a una persona de un retrato por otra, manteniendo la composición general y el fondo. Este algoritmo funciona a través de un bot en Telegram.
Al combinar dos imágenes, el sistema no conserva la construcción ni la disposición de los objetos. La combinación se produce de forma aleatoria, lo que a veces da lugar a resultados inesperados e ideas nuevas.
Kandinsky 2.2 es mucho mejor a la hora de generar fotogramas realistas que las versiones anteriores. Los resultados son similares a los del popular servicio Midjourney, pero siguen siendo inferiores en términos de detalle.
Para obtener buenos resultados, es necesario experimentar con parámetros y descripciones de consulta. En ocasiones, Kandinsky produce imágenes con errores. Por ejemplo, el sistema muestra de forma extraña objetos arquitectónicos conocidos por mucha gente. Pero esto suele ocurrir si se introducen promts demasiado largos con muchos detalles menores.