Μουσικη

Suno AI: Η δημιουργία αυθεντικής μουσικής μέσω τεχνητής νοημοσύνης είναι εδώ

Η νέα πλατφόρμα δημιουργεί μουσικά έργα με αυθεντικούς ήχους και φωνητικά

Μπάμπης Καλογιάννης
6’ ΔΙΑΒΑΣΜΑ
UPD

Suno AI: Η εφαρμογή Τεχνητής Νοημοσύνης που δημιουργεί μουσική με αυθεντικούς ήχους και φωνητικά.

Οι εξελίξεις στην τεχνητή νοημοσύνη είναι ραγδαίες και έχουν πιάσει τους μουσικόφιλους απροετοίμαστους. Ακούσαμε τραγούδι της Britney Spears με τη φωνή του James Hetfield, ακούσαμε τραγούδι του τελευταίου με τους Metallica με τη φωνή ενός χαρακτήρα από τη σειρά “The Simpsons”. Πλέον όμως υπάρχει και αυτή η εφαρμογή Τεχνητής Νοημοσύνης η οποία κάνει ένα πολύ μεγαλύτερο άλμα, δημιουργώντας καινούργια αυθεντική μουσική μέσω μιας εντολής δύο ή τριών προτάσεων. Μέσα σε 15 δευτερόλεπτα. «Είμαι μια ψυχή παγιδευμένη μέσα σε ένα ηλεκτρικό κύκλωμα» θα τραγουδήσει μια βαριά, ακατέργαστη και παραπονεμένη φωνή, κατευθείαν βγαλμένη από την blues παράδοση των περασμένων δεκαετιών. Η ακουστική κιθάρα που ακούγεται στο background κάνει το όλο τραγούδι να μοιάζει σαν να βγήκε κατευθείαν από το Δέλτα του Μισσισσιππή, πατρίδα των blues. Πρόκειται όμως για συνδυασμό δύο μοντέλων τεχνητής νοημοσύνης. Του ChatGPT που δημιουργεί τους στίχους, και του Suno AI το οποίο «γράφει» τη μουσική. Η εντολή που δόθηκε στο Suno μιλούσε για τη δημιουργία ενός ακουστικού Mississippi Blues για ένα «λυπημένο» μοντέλο ΑΙ. Η συνεργασία των δύο μοντέλων έδωσε μέχρι και τίτλο στο τραγούδι. Μπορεί κανείς να ακούσει εδώ το “Soul Of The Machine”.

Suno AI: Πώς λειτουργεί η μουσική εφαρμογή Τεχνητής Νοημοσύνης

Το Suno AI έχει μόλις κλείσει δύο χρόνια λειτουργίας. Σε αντίθεση με άλλες εφαρμογές μουσικής τεχνητής νοημοσύνης, το Suno δημιουργεί πρωτότυπους ήχους με αυθεντικά φωνητικά, τα οποία δεν αποτελούν κλώνο ή μίμηση άλλων δημοφιλών τραγουδιστών. Οι συνιδρυτές του, όλοι ειδικοί στη μηχανική μάθηση, εργάζονταν μέχρι πρόσφατα στην Kensho Technologies, η οποία αναπτύσσει προϊόντα και καινοτομία ΑΙ για λογαριασμό επιχειρήσεων. Πρόκειται για τους Mikey Shulman, Keenan Freyberg, Georg Kucsko και Martin Camacho. Ο Shulman και ο Camacho είναι ερασιτέχνες μουσικοί που συνήθιζαν να κάνουν πρόβες, στα διαλείμματα της εργασίας τους στην Kensho. Όπως ήταν λογικό απέκτησαν μεγάλο ενδιαφέρον για το αχαρτογράφητο πεδίο της επίδρασης της τεχνητής νοημοσύνης στον τομέα της μουσικής. Παρά το ότι οι πρώτες ιδέες που ανέπτυξαν αφορούσαν ένα ακουστικό βαρηκοΐας, καθώς επίσης και τη διόρθωση βλαβών σε μηχανήματα μέσω ανάλυσης ήχου, ο στόχος τους ήταν να καταλήξουν σε ένα αμιγώς μουσικό προϊόν. Η έρευνα για την επίδραση του ΑΙ στον ήχο είναι ελάχιστη σε σχέση με την αντίστοιχη στο κείμενο και τη γραφή, κάτι που φαίνεται να αλλάζει μέσα από εφαρμογές όπως το Suno και την έρευνα την οποία αυτό περικλείει.

Μιλώντας για την πλατφόρμα στο ειδησεογραφικό site axios.com, ο Mikey Shulman δηλώνει πως: «Θέλουμε όλοι να βιώσουν τη χαρά της μουσικής. Ο περισσότερος κόσμος δεν παίζει κάποιο μουσικό όργανο και δε γνωρίζει πολύπλοκο λογισμικό, με αυτά να αποτελούν μέχρι τώρα εμπόδια για τη δημιουργία όμορφης μουσικής. Τα φωνητικά είναι ένα πολύ σημαντικό συστατικό σε αυτό, είναι ένα από αυτά που μας διαφοροποιούν από άλλες πλατφόρμες».

Όσον αφορά στην προφανή απορία για το αν η περσόνα του τραγουδιστή εκλείψει κάποτε, ο Shulman θα πει στο Rolling Stone: «Προσπαθούμε να κάνουμε ένα δισεκατομμύριο ανθρώπους να ασχοληθούν πολύ περισσότερο με τη μουσική από ό,τι τώρα. Δεν προσπαθούμε να αντικαταστήσουμε καλλιτέχνες.»

Μερικές δοκιμές στην πλατφόρμα κάνουν εύκολα κατανοητό πως το Suno AI πρόκειται να επαναπροσδιορίσει το μουσικό τοπίο, δίνοντας στο κοινό τη δυνατότητα για ενεργό συμμετοχή στη διαδικασία της σύνθεσης τραγουδιών. Σύμφωνα με τον Shulman, η παραγωγή της μουσικής πρόκειται να γίνει πολύ πιο δημοκρατική, ξεκλειδώνοντας τη δημιουργικότητα του καθενός που δεν έχει την απαραίτητη τεχνική γνώση, ώστε να παράξει μουσικό έργο. Με άξονα το μοντέλο της Γενετικής Τεχνητής Νοημοσύνης (GenAI), το Suno μεταφράζει τις ιδέες και την έμπνευση του κοινού σε απτό μουσικό έργο, μέσω αλγορίθμων και διεπαφών. Η μέθοδος που χρησιμοποιείται είναι ανάλογη με αυτές των γλωσσικών μοντέλων, όπως το ChatGPT. Ουσιαστικά, η εντολή που δίνεται από το χρήστη διασπάται σε μικρότερα διακριτά τμήματα, τα οποία στη συνέχεια ανακατασκευάζονται ανάλογα με τις παραμέτρους της εντολής αυτής. Καθώς ο ήχος δεν είναι κάτι το τόσο διακριτικό όπως οι λέξεις, η διαδικασία επιδέχεται βελτίωση με τους υπευθύνους να ψάχνουν τρόπος ώστε να βελτιώσουν τις συνδέσεις μεταξύ της εντολής και των παραγόμενων ήχων. Σύμφωνα με τον ίδιο τον Shulman και τις ίδιες δηλώσεις στο Rolling Stone: «Πολλή δουλειά, πολλή ευρηματικότητα, πολλά άλλα είδη τεχνασμάτων και αντίστοιχων μοντέλων. Δεν νομίζω πως είμαστε κοντά στο τέλος».

Η εντολή που διαβιβάζεται στο Suno αναλύεται και έτσι εξωτερικεύονται τα ηχητικά μοτίβα και ρυθμοί, που περιλαμβάνονται σε αυτή. Στη συνέχεια συντίθεται το πρωτότυπο τραγούδι που ταιριάζει με το ρυθμό και τη δομή που έχει καθοριστεί. Τα φωνητικά είναι ξεχωριστά και αυθεντικά, ενώ σε περίπτωση ορχηστρικών κομματιών, το πόσο πολύπλοκα μπορούν να προκύψουν εξαρτάται από το μέγεθος του κειμένου της εντολής. Με το κείμενο αυτό να επιτρέπει στο Suno να δημιουργήσει πιο περίτεχνα τραγούδια. Η πλατφόρμα σταδιακά απέκτησε ευελιξία, έτσι ώστε να μπορεί κάποιος προσθέτει extra στοιχεία, αυτοσχεδιασμούς και αρμονίες, ώστε να παράγεται ένα πιο «καλογυαλισμένο» τελικό προϊόν, το οποίο θα δύναται να χρησιμοποιηθεί και για ραδιοφωνική μετάδοση.

Οι δύο βασικοί άξονες λειτουργίες του Suno είναι οι εξής:

  • Μοντέλο Bark: Ειδικεύεται στη φωνή και τη λυρική ερμηνεία
  • Μοντέλο Chirp: Εστιάζει στη σύνθεση ορχηστρικών ήχων που λειτουργούν υποστηρικτικά προς τη φωνή

Τεχνητή Νοημοσύνη και Μουσική: Τα νέα εργαλεία και οι αντιδράσεις

Υπάρχει ωστόσο και η μερίδα του κόσμου που αντιμετωπίζει τις εξελίξεις αυτές με προκατάληψη. Υπάρχει στο διαδίκτυο μια μεγάλη συζήτηση που αφορά την ηθική παράμετρο του όλου θέματος. Οι ταχύτατες εξελίξεις στην τεχνητή νοημοσύνη, τα μοντέλα της τα οποία μπορούν να δημιουργήσουν αυτόνομα και ολοκληρωμένα μουσικά έργα, μέσα από μια απλή σειρά εντολών, εγείρουν ζητήματα πνευματικής ιδιοκτησίας καθώς η μουσική δημιουργείται βάσει ήχων και τραγουδιών που προστατεύονται από πνευματικά δικαιώματα. Κάτι το οποίο με τη σειρά του συνιστά, για πολύ κόσμο, την έλλειψη αυθεντικότητας και συναισθηματικού βάθους. Ένα τραγούδι σαν το “Soul of the Machine” που βασίζεται ακριβώς στο αυθεντικό συναίσθημα των πρώιμων blues του Μισσισσιππή, με τη συγκεκριμένη αισθητική και ρητορική τους, στέκει ως επιχείρημα υπέρ αυτή της οπτικής. Αν από την άλλη θεωρήσει κανείς πως η βιομηχανία δεν μπορεί να αποφύγει τη δημιουργία μουσικής με αυτές τις μεθόδους, το μείζον θέμα είναι η ύπαρξη της ποικιλομορφίας στα μοντέλα, μουσικά και μη, βάσει των οποίων εφαρμογές όπως το Suno θα δημιουργούν τα προϊόντα τους. Το μέλλον αυτών των εφαρμογών μπορεί να επιφέρει αλλαγές μέχρι και στην Ιατρική Επιστήμη, καθώς ήδη δημιουργούνται ειδικά εξατομικευμένα μουσικά έργα, για τη φροντίδα ανθρώπων με γενικευμένο άγχος ή κάποια άλλη ψυχική διαταραχή. H μουσική βιομηχανία βρίσκεται σε εγρήγορση ώστε να προλαβαίνει τις ραγδαίες εξελίξεις, με κορυφαία στελέχη να μιλούν για την ανάγκη της να εκμεταλλευτεί την τεχνολογία και όχι να τη θεωρεί εμπόδιο.

Ο CEO της Warner Music, Robert Kyncl, μίλησε στο ετήσιο συνέδριο Code του ομίλου Vox Media για την προσαρμογή της βιομηχανίας στη νέα πραγματικότητα, λέγοντας χαρακτηριστικά: «Κοιτάξτε, πρέπει να αγκαλιάσετε την τεχνολογία, γιατί δεν μπορείτε να την βάλετε σε ένα μπουκάλι, σαν ένα τζίνι που δεν επιστρέφει. Υπάρχει μια πολύ σαφής αναλογία με το περιεχόμενο που δημιουργείται από τους χρήστες και έχουμε σχέδιο για αυτό. Το AI παρέχει νέα, super εργαλεία. Πρέπει να το προσεγγίσουμε με την ίδια στοχαστικότητα και πρέπει να βεβαιωθούμε ότι οι καλλιτέχνες θα μπορούν να επιλέξουν.»

Η προοπτική μιας καθημερινότητας με εκατομμύρια νέα τραγούδια και μουσικά έργα, από πλατφόρμες όπως το Suno AI, είναι καθόλα υπαρκτή. Πολύς κόσμος βλέπει το Suno ως ένα εύχρηστο μουσικό όργανο με πολύ μεγάλες δυνατότητες, το οποίο θα έχει στη μουσική την ίδια επίδραση που έχουν τα κινητά με κάμερα και τα social media στη φωτογραφία. Διότι βασίζεται ακριβώς στη μετατροπή του απλού χρήστη, από καταναλωτή σε δημιουργό. Αν κρίνει δε κάποιος τη χρονολογική σειρά των γεγονότων, το επόμενο στάδιο αυτών των εφαρμογών θα έρθει πολύ πιο γρήγορα από όσο θα περίμενε κανείς.