Funzione di visione AI – Descrivi immagine al prompt

AI Vision is the feature to describe an image and convert the image to a prompt. It’s done by using one of the popular IA models such ChatGpt or Gemini. You can select the model you prefer, based on the performance or the cost.

AI Vision: Descrivi le immagini per suggerire l'illustrazione.

Download Light Image Editor

Scarica e installa Light Image Resizer 7

Individua Light Image Editor nell'icona nella barra delle applicazioni, carica un'immagine ed esegui nel menu principale – Utensileria – Visione AI.

Light Image Editor icon in taskbar

Ottieni la chiave API

La funzione AI Vision con intelligenza artificiale è ora disponibile nell'applicazione Light Image Editor. Che è un pacchetto con il pacchetto di installazione di Light Image Resizer. È un'app locale solo per Windows. Avrai bisogno di una chiave API , per Google Gemini o ChatGPT di OpenAI. Ciò significa che pagherai in base al consumo, senza bisogno di un abbonamento mensile.

Innanzitutto, ottieni la chiave API dei modelli di visione

Ottieni la chiave API per Google AI Studio (Gemini)

Ottieni la chiave API da OpenAI (ChatGPT)

Per ora, consigliamo di utilizzare Gemini, più economico e funziona bene per descrivere le immagini.

Una volta ottenuta la chiave (e i crediti), è possibile inserire la chiave nell'opzione Light Image Resizer AI vision disponibile in questo menu.

The LLM vision models works fine in english, french, german, and popular languages, which is not the case of some other popular vision models, Ollama could be supported later if you find it interesting, and the big advantage means the data will be full private and local, and you won’t be charged for any requests and tokens. Scopri i modelli di visione supportati da Ollama

Perché descrivere le tue foto?

Trovare le parole giuste per le tue foto è facile con Light Image Resizer Funzione AI Vision Nell'editor di immagini Light. Analizza le tue immagini a livello tecnico per generare automaticamente le descrizioni. L'applicazione prepara la tua immagine (convertendola in JPEG e ridimensionandola a una dimensione come 1024×1024, regolabile) per un'efficiente elaborazione AI. Questa fase di pre-analisi consente di garantire un'elaborazione più rapida e di rendere la funzionalità più conveniente. Lascia che sia l'IA a descrivere, così non devi farlo tu!

Venice sunset with gondolas and historic buildings.

Che tipo di attività puoi completare?

Annotate your images to find them by keywords. Geoguessing the picture when you don’t remember where you took them. Find inspiration when you want to publish a new Instagram or TikTok post. It will add some nice icons to make your marketing better.

Tutto dipende dal tuo prompt, guarda alcuni esempi di prompt e come influisce sul risultato.

Una volta ottenuta la chiave (e i crediti), è possibile inserire la chiave nell'opzione Light Image Resizer AI vision disponibile in questo menu.

The LLM vision models work fine in English, French, German, and popular languages, which is not the case of some other popular vision models. Ollama could be supported later if you find it interesting, and the big advantage is that the data will be completely private and local, and you won’t be charged for any requests and tokens. Scopri i modelli di visione supportati da Ollama

Qual è la differenza tra descrivere un'immagine, analizzare un'immagine, riassumere un'immagine?

E potrebbe essere la stessa domanda sulla differenza tra un'immagine, una fotografia e un quadro. È un po' la stessa cosa, ma dipende da cosa devi fare e da chi sei. Vedi alcune attività di AI Vision possibili:

  • Trovare parole chiave per i fotografi
  • OCR e documento riepilogativo per i contabili
  • Didascalia automatica delle immagini
  • Influenza l'ispirazione per i post di Instagram o Tiktok
  • Identifica marchi e celebrità
  • E-commerce di moda
  • Ipotesi geografiche – Trova la posizione dalla foto
  • Diagnostica scientifica, sanitaria, astronomica

Alcune ispirazioni di suggerimenti per descrivere un'immagine

Parole chiave per la fotografia

Restituisci direttamente senza commento un elenco di 50 parole chiave separate da una virgola per descrivere l'argomento, lo sfondo, gli oggetti, la posizione e l'umore

donna in auto, cammelli sullo sfondo del deserto.

Woman, convertible, car, desert, camels, sand, road, travel, tourism, adventure, vacation, stylish, fashion, portrait, outdoors, sunny, wind, hair, red hair, scarf, white car, leather seats, headrest, dry landscape, arid, heat, sunlight, model, posing, confident, relaxed, tourist attraction, horizon, background, faraway, blurred, out of focus, transport, open-top, leisure, wanderlust, modern, trendy, vogue, stylish, elegance, freedom, journey, explorer, remote, scenic, destination, casual, summer, daytime, vacation, escape, adventure, travel, road trip.

Riepilogo del documento OCR

Esegui un OCR dettagliato del documento, quindi traduci in inglese e spiega in un riassunto di 200 parole qual è il documento e gli elementi importanti.

Fattura dell'hotel per camera e servizi.

Questo documento è una fattura da “Les Minotiers,” a hotel/lodging (Logis de France) located in Mirepoix, France. The invoice, numbered 43197 and dated February 18, 2014, details the charges for a stay in Room 12. The guest arrived on February 17, 2014, and departed on February 18, 2014. The total amount due is 73.92 Euros. The charges include the room rate (57.00 Euros), tourist tax (0.92 Euros) and breakfast (16.00 Euros). The invoice breaks down the VAT (Value Added Tax) applied at 10% to a portion of the charges. The invoice also mentions an equivalent value of 484.88 in old french currency “Franchi”. Le informazioni di contatto dell'azienda, gli identificativi dell'azienda e l'IVA

Descrizione di Instagram

Crea una descrizione per un post su Instagram per una domenica, sii creativo e divertente per ottenere il miglior coinvolgimento e il miglior numero di Mi piace o commenti

Uomo in piedi accanto a un'auto d'epoca sotto il ponte

Sunday mood: plotting my next Parisian adventure. 🥐 This classic car + riverside views = 💯. But the real question is… champagne brunch or museum hop? 🤔 What’s YOUR ideal Sunday activity? Let me know in the comments! 👇 #ParisianVibes #SundayFunday #ClassicCars #StyleInspo #WeekendGetaway #TravelDreams

Scienza & Educazione

In qualità di esperto, si prega di analizzare scientificamente questa immagine e di restituire una descrizione di 200 parole. Suggerire la migliore specializzazione scientifica per diagnosticare una soluzione.

Radiografia della mano umana e delle ossa del polso.

This X-ray image depicts the bones of a human hand and wrist. The carpal bones, metacarpals, and phalanges are all visible. There appears to be a fracture of the proximal phalanx of the fourth digit (ring finger). The fracture appears to be a comminuted fracture, meaning the bone is broken into multiple fragments. There is visible displacement of the fractured bone fragments, indicating the fracture is not stable and may require intervention to ensure proper healing and alignment. No other obvious fractures or dislocations are apparent in the remaining bones of the hand and wrist in this particular projection. The bone density appears normal within the limits of this image.

The best scientific specialty to diagnose and determine a solution for this case is Orthopedic Surgery, specifically a hand specialist, who has the expertise to interpret the X-ray, assess the extent of the injury, and recommend the most appropriate treatment, which may involve immobilization with a cast or splint, or surgical intervention to realign and stabilize the fracture fragments. Radiologists are often consulted to ensure interpretation of x-rays.

Moda & Commercio elettronico

Per una pagina di prodotto ecommerce, descrivi l'immagine con colore, forma, materiali, stile. Descrizione di 100 parole con impatto di marketing.

Abito nero con polsini morbidi

Dare to be different in this stunning black dress. Crafted from a soft, body-hugging knit, this piece features a sophisticated turtleneck and a figure-flattering silhouette that falls to a chic midi length. The drama lies in the voluminous, faux-fur cuffs, adding a touch of opulent texture and undeniable edge. Perfect for a night out or a statement-making event, this dress is a modern masterpiece. Effortlessly chic and endlessly versatile, prepare to turn heads wherever you go. Own the room. Own your style.

Indovinare la geografia

Indovina la posizione dell'immagine, inizia dal paese, dall'area, quindi dalla città. Aggiungi 50 parole per descrivere l'argomento. Termina con una percentuale della stima dell'accuratezza.

Barca sull'acqua con vista sul faro in lontananza.

Ecco la mia analisi dell'immagine:

  • Paese: Francia
  • Area: Nuova Aquitania
  • Paese: Cap Ferret

Descrizione del soggetto: A small, brightly painted boat floats calmly on the water, its red and black hull a striking contrast to the blue. The foreground is dotted with wooden posts sticking out of the water. The Arcachon lighthouse is visible behind the trees. The sandy beach stretches out in the distance.

Stima dell'accuratezza: 85%s