Γενικός

Το Google Gemini πήρε πολύ καλύτερα στο “Photoshopping”, και ανησυχώ


Γνωρίζατε ότι μπορείτε να προσαρμόσετε το Google για να φιλτράρετε τα σκουπίδια; Κάντε αυτά τα βήματα Για καλύτερα αποτελέσματα αναζήτησης, συμπεριλαμβανομένης της προσθήκης LifeHacker ως προτιμώμενη πηγή για τεχνολογικά νέα.


Η Google ενημέρωσε την εφαρμογή Gemini (και τον ιστότοπο) για να κάνει την παραγωγή εικόνων λίγο πιο διαισθητική και για μια φορά, αυτό που έγραψα προηγουμένως ως καινοτομία θα μπορούσε τώρα να είναι μια βιώσιμη εναλλακτική λύση του Photoshop. Υπάρχει ακόμα μερικά τυπικά σκουπίδια AI, αλλά το νέο μοντέλο, που δοκιμάστηκε με το όνομα “νανο μπανάνα“Και τώρα ζείτε για όλους τους χρήστες των Δίδυμων ως εικόνα Flash Gemini 2.5, κάνει πολλά για να σας αφήσει να τελειοποιήσετε μια εικόνα σύμφωνα με τις προτιμήσεις σας. Όλα έχουν ακόμα ένα υδατογράφημα και” φτιαγμένες με AI “προειδοποιήσεις στα μεταδεδομένα, αλλά ετοιμαστείτε να είστε πολύ πιο απαιτητικοί για το αν μια φωτογραφία είναι πραγματική ή όχι-η νέα Δίδυμο θολώνει αυτές τις γραμμές περισσότερο από ποτέ.

Το Google Gemini είναι πλέον καλύτερο στην επεξεργασία πραγματικών φωτογραφιών

Αυτό που κάνει το ενημερωμένο μοντέλο τόσο ξεχωριστό είναι η εστίαση στη διατήρηση των λεπτομερειών σε πολλές φωτογραφίες. Τώρα, αντί να δημιουργείτε ουσιαστικά από το μηδέν κάθε φορά που ζητάτε από την εφαρμογή Gemini για μια φωτογραφία, μπορεί να μεταφέρει τμήματα είτε μιας φωτογραφίας πηγής είτε μιας προωθημένης εικόνας και αλλάζει μόνο αυτό που το ζητάτε. Υπάρχουν δύο μεγάλοι λόγοι για τους οποίους έχει σημασία, και ειρωνικά, ένας από αυτούς σημαίνει ότι χρησιμοποιείται λιγότερο AI.

Για παράδειγμα, ας πούμε ότι έχετε μια φωτογραφία του εαυτού σας φορώντας ένα κόκκινο πουκάμισο, αλλά θέλετε να είναι μπλε. Προηγουμένως, είχατε δύο επιλογές: είτε έπρεπε να πάρετε την εικόνα στο Photoshop και να το τσίμπημα με το χέρι, είτε να το χρησιμοποιήσετε ως προτροπή για το AI και να συνεχίσετε να δημιουργείτε μέχρι να πάρετε κάτι που φαινόταν αρκετά κοντά στην αρχική φωτογραφία, αλλά τώρα με το πουκάμισο με μπλε. Με τις αλλαγές στη Nano Banana, η Google τελειώνει το μοντέλο της έτσι ώστε να αφήνει το μεγαλύτερο μέρος της εικόνας σας και μόνο αλλάζει το πουκάμισο.


Credit: Michelle Ehrhardt, Google

Για παράδειγμα, εδώ είναι αυτή η ακριβής κατάσταση, με μερικές φωτογραφίες μου. Παρατηρήστε πώς το μοντέλο διατηρεί λεπτές λεπτομέρειες όπως το frizz των μαλλιών μου ή η συγκεκριμένη έκφραση του προσώπου μου και θέτουν. Δεν είναι τέλειο και θα παρατηρήσετε ότι το δέρμα μου φαίνεται πραγματικά πιο ομαλότερο στην έκδοση επεξεργασμένης έκδοσης, αλλά με τις νέες ενημερώσεις, ο Gemini είναι τώρα σε θέση να καθορίσει τι εννοώ με το “πουκάμισο” και να επικεντρώσει τις περισσότερες από τις επεξεργασίες του σε αυτό. Θα πω ότι το πουκάμισο φαίνεται επίσης λίγο αφύσικο, ειδικά γύρω από τον δεξιό μου ώμο, αλλά επίσης δεν έδωσα στους Δίδυμους πολλά για να δουλέψω με την προτροπή μου. Εκεί έρχεται η επόμενη μεγάλη αλλαγή.

Χρησιμοποιήστε το Gemini για να επεξεργαστείτε το ίδιο αποτέλεσμα πολλές φορές

Αυτό είναι όπου το πραγματικό τέχνασμα είναι. Είτε μια εικόνα είναι εξ ολοκλήρου που δημιουργείται ή όχι, μπορείτε τώρα να χρησιμοποιήσετε εικόνες που δημιουργούνται προηγουμένως ως βάση για τις μελλοντικές γενιές. Με άλλα λόγια, αν ο Δίδυμος δεν πήρε κάτι σωστό την πρώτη φορά, μπορείτε να το ζητήσετε να δοκιμάσετε ξανά μέχρι να το κάνει.

Για να σας δώσω μια ιδέα για το τι μοιάζει, εδώ είναι η ίδια φωτογραφία μου στο μπλε πουκάμισο, αλλά τώρα με polka κουκκίδες που προστέθηκαν μέσα, για να ταιριάζουν καλύτερα με το κόκκινο πουκάμισο από την αρχική φωτογραφία.

Ο συγγραφέας, σε μια φωτογραφία που εκδόθηκε από το Google Gemini


Credit: Michelle Ehrhardt, Google

Και εδώ είναι μια εξ ολοκλήρου εικόνα που δημιουργήθηκε από μια γάτα, την οποία είχα αλλαγή δίδυμων σε πορτοκαλί.

Γάτες που δημιουργούνται από το Google Gemini


Πίστωση: Google

Αυτό είναι τεράστιο για την παραγωγή εικόνων AI. Προηγουμένως, όταν ζητάτε από τους Δίδυμους να κάνουν μικρά τσιμπήματα για να ικανοποιηθούν, θα έχει ήδη δημιουργηθεί, θα έχετε ουσιαστικά ολοκαίνουργιες φωτογραφίες κάθε φορά, όπως συμβαίνει με αυτά τα σκυλιά που φορούν καπέλα.

Τα σκυλιά που δημιουργούνται από το Google Gemini


Πίστωση: Google

Τώρα, όμως, μπορείτε να επαναλάβετε την εφαρμογή στην ίδια φωτογραφία πολλές φορές, πράγμα που σημαίνει ότι εάν το αρχικό αποτέλεσμα φαίνεται μη πειστικό, έχετε την ευκαιρία να το διορθώσετε. Για μένα, αυτό παίρνει αυτό από την ύπαρξη καινοτομίας – όπου ουσιαστικά πρέπει να γυρίσετε έναν τροχό με κάθε γενιά και ελπίζω να προσγειωθεί σε κάτι χρήσιμο – σε μια πραγματική απειλή του Photoshop.

Η Google προτείνει, για παράδειγμα, ότι θα μπορούσατε να το χρησιμοποιήσετε για να δείτε πώς θα φαινόταν αν ζούσατε σε διαφορετική δεκαετία ή είχατε διαφορετική καριέρα. Θα παραδεχτώ ότι τα αποτελέσματα φαίνονται αρκετά πειστικά για να εργαστούν για περιστασιακές θέσεις, ειδικά αν ανεβάσετε μια πραγματική φωτογραφία ως πλαίσιο. Εδώ είμαι δίπλα στην πραγματική ζωή Mona Lisa, αλλά επαναπροσδιορίστηκε ως καλλιτέχνης.

Ο συγγραφέας, σε μια φωτογραφία πηγής και μια φωτογραφία που επεξεργάστηκε από το Google Gemini


Credit: Michelle Ehrhardt, Google

Αυτό δεν είναι αυστηρά ρεαλιστικό (γιατί υπάρχει μια δεύτερη Mona Lisa δίπλα μου;), αλλά θα μπορούσα να δω ένα συγκεκριμένο είδος ατόμου να πάρει αρκετό από ένα χτύπημα από αυτό που πλημμυρίζουν τα κοινωνικά μέσα με θέσεις όπως αυτό. Περάστε λίγο χρόνο για να επαναφέρετε σε αυτό, και θα μπορούσατε πιθανότατα να το φτιάξετε σαν να πήγα ακριβώς στο Λούβρο.

Αλλά αν είστε σκεπτικιστής AI όπως εγώ, υπάρχει ακόμα μια χάρη εξοικονόμησης που δείχνει ότι το μοντέλο έχει ένα μικρό περιθώριο για να αναπτυχθεί.

Τι νομίζετε μέχρι τώρα;

Ο συνδυασμός φωτογραφιών δεν είναι ακόμα σωστός

Ενώ οι νέες ενημερώσεις των Δίδυμων καθιστούν την επένδυση στις υπάρχουσες φωτογραφίες πολύ πιο βιώσιμες, ζητώντας του να δημιουργήσει νέο περιεχόμενο, όπου δεν μπορεί να βασιστεί πάρα πολύ σε μια φωτογραφία πηγής, σας δίνει ακόμα μια αξιοσημείωτη ai sheen. Ένα από τα πρόσθετα χαρακτηριστικά που ανακοίνωσε η Google με αυτήν την ενημέρωση ήταν η δυνατότητα χρήσης του Gemini για να συνδυάσει πολλαπλές φωτογραφίες πηγής σε μία. Όμως, ενώ οι άλλες αλλαγές περιλαμβάνουν κυρίως τη δημιουργία μικρών τροποποιήσεων στις υπάρχουσες φωτογραφίες, αυτό εξακολουθεί να απαιτεί από το AI να κάνει πολλά για να βάλει τις φωτογραφίες μαζί και είναι εδώ όπου είναι πιθανότερο να αντιμετωπίσετε τα ίδια παλιά προβλήματα.

Ο συγγραφέας και η γάτα της, σε φωτογραφίες πηγής και μια φωτογραφία που δημιουργείται από το Google Gemini


Credit: Michelle Ehrhardt, Google

Για παράδειγμα, μετά από ένα από τα προτεινόμενα παραδείγματα της Google, ανέβασα μια φωτογραφία του εαυτού μου και της γάτας μου σε Δίδυμους και του ζήτησα να κάνει μια φωτογραφία μας αγκαλιάζοντας μαζί. Αλλά ενώ οι άλλες δοκιμές που έκανα με αυτήν την ενημέρωση έμοιαζαν πολύ με τις φωτογραφίες πηγής, το αποτέλεσμα εδώ μου έδωσε μια έκδοση του εαυτού μου σε ένα πολύ σφιχτό πουκάμισο, με πολύ γυαλιστερά μαλλιά, αγκαλιάζοντας μια πολύ τρελή γάτα. Τα ευρύτατα εγκεφαλικά επεισόδια ήταν σωστά – το πρόσωπό μου εξακολουθεί να μοιάζει κυρίως με τον εαυτό μου, το μοτίβο γούνας της γάτας μου είναι περίπου άθικτο και ο καναπές έχει ακόμη το σωστό χρώμα και γενικό σχήμα. Αλλά πάνω από μερικές μικρές ασυνέπειες με, ας πούμε, οι πτυχές στον καναπέ ή οι κοιλότητες μου ή η λάμπα στο παρασκήνιο (που φαίνεται να έχει δύο πόλους), όποιος συναντά τη γάτα μου ξέρει ότι δεν είναι τόσο μεγάλος. Η φωτογραφία έχει επίσης αυτή την βαζελίνη-όπως, υπερβολικά επεξεργασμένη εμφάνιση που είναι ενδημική στο AI.

Σε κάποιο βαθμό, αυτό είναι αναμενόμενο. Δεν ανέβασα πάρα πολλές φωτογραφίες και σίγουρα καμία από εμένα ή τη γάτα μου στις θέσεις που παρουσιάστηκαν στην εικόνα AI. Το AI δεν είχε κανέναν τρόπο να μάθει πώς θα κοιτάξουμε από διαφορετικές γωνίες, ειδικά αφού ο selfie μου ήταν απλώς ένα headshot. Αλλά αυτό που έχω σημαίνει ότι όταν το AI τρέχει από χρήσιμες πληροφορίες πηγής και πρέπει να Intuit πώς πρέπει να φανεί μια σκηνή, εξακολουθεί να τρέχει σε γνωστά προβλήματα που καθιστούν αρκετά εύκολο να διακρίνουν από τις φωτογραφίες που γίνονται χωρίς AI. Θα μπορούσα πιθανότατα να κάνω την φωτογραφία AI πιο ρεαλιστική, αν ανέβασα φωτογραφίες πηγής πιο κοντά σε αυτό που ήθελε να δημιουργήσει ο Δίδυμος, αλλά τότε πρέπει να αναρωτηθώ ποιο θα ήταν το σημείο της συμμετοχής του AI στη διαδικασία επεξεργασίας;

Εν πάση περιπτώσει, μπορώ να πω με βεβαιότητα ότι οι προχωρημένες επεξεργασίες AI φαίνονται πειστικές θα εξακολουθούν να παίρνουν ένα καλό κομμάτι της ανθρώπινης παρέμβασης.

Ετοιμαστείτε για ένα μείγμα AI και την πραγματικότητα

Οι νέες ενημερώσεις του Δίδυμου είναι, για μένα, πιο εντυπωσιακές όταν χρησιμοποιούνται για μικρότερες τσιμπήματα, πράγμα που είναι πραγματικά εκεί που νομίζω ότι η απειλή για το Photoshop έρχεται. Μου αρέσει να πιστεύω ότι έχω την ικανότητα να εντοπίσω φωτογραφίες που δημιουργήθηκαν από το AI, αλλά σε ένα γρήγορο κύλινδρο, δεν είμαι σίγουρος ότι η εικόνα μου σε ένα μπλε πουκάμισο θα σηκώσει καμπάνες συναγερμού.

Τι σημαίνει αυτό; Λοιπόν, για ένα, αυτό σημαίνει ότι τα δωρεάν εργαλεία AI είναι τελικά στο σημείο όπου θα μπορούσατε να τα χρησιμοποιήσετε για να κάνετε με μια φυσική γλώσσα να σας ζητήσει αυτό που θα μπορούσε να πάρει μερικά λεπτά για να κάνει με το χέρι πριν. Η Adobe έχει ήδη πει ότι σχεδιάζει ενσωματώστε τη μπανάνα νανο στο Photoshop, αλλά να είστε προετοιμασμένοι για περαιτέρω αλλαγές στις παραδοσιακά ανέγγιχτες εφαρμογές, καθώς το AI προχωράει. Είναι στο σημείο όπου, τουλάχιστον για τα μικρά πράγματα, μπορεί πραγματικά να απειλήσει την παραδοσιακή ροή εργασίας σας.

Για τους ανθρώπους που δεν είναι δημιουργοί περιεχομένου, αναμένετε να αναπτύξετε ένα ακόμη πιο απαιτητικό μάτι για το τι είναι και δεν είναι πραγματικό στο διαδίκτυο. Ενώ οι πλήρως εξειδικευμένες εικόνες είναι συχνά αρκετά εύκολο να εντοπιστούν και οι πιο ρεαλιστικές επεξεργασίες μπορούν να είναι ως επί το πλείστον αβλαβές (κανείς δεν θα νοιάζεται για το χρώμα του πουκάμισου μου), οι ενημερώσεις του Gemini καθιστούν τώρα ευκολότερη από ποτέ να συνδυάσουν την πραγματικότητα με λίγη απλή. Εδώ είναι μια εικόνα που είχα το νέο Gemini Make του Taylor Swift σε ένα κόκκινο καπέλο μπέιζμπολ, αν πιάσετε την παρασυρόμενη μου.

Μια εικόνα που παράγεται από το AI του Taylor Swift σε ένα κόκκινο καπέλο μπέιζμπολ


Πίστωση: Google

Ενώ περιμένουμε να δούμε πώς παίζει αυτό, είναι μια καλή στιγμή να θυμόμαστε ότι εάν μια εικόνα παίρνει τα κουδούνια συναγερμού σας, ο Δίδυμος βάζει τα υδατογραφήματα AI στην κάτω αριστερή γωνία όλων των αποτελεσμάτων της και θα σηματοδοτήσει τις φωτογραφίες που παράγονται χρησιμοποιώντας στα μεταδεδομένα τους, τα οποία μπορείτε να δείτε τόσο στο iPhone όσο και στο Android, στρέφοντας σε μια λήψη φωτογραφίας. Υπάρχουν τρόποι για να τρίβετε τα μεταδεδομένα, αλλά ως εναλλακτικό, επειδή οι πιο πειστικές τροποποιήσεις είναι πιθανό να χρησιμοποιούν πραγματικές φωτογραφίες ως πηγές τους (Το έκανα Για το Taylor Swift ένα παραπάνω), ως έσχατη λύση, μπορείτε επίσης να χρησιμοποιήσετε ένα Αναζήτηση εικόνας αντίστροφης εικόνας Google για να προσπαθήσετε να βρείτε το αμετάβλητο πρωτότυπο. Προσέξτε εκεί έξω.