- CITY GUIDE
- PODCAST
-
17°
Project Panama: Το μυστικό σχέδιο της Anthropic για να «ταΐσει» την τεχνητή νοημοσύνη
«Να ψηφιοποιήσουμε όλα τα βιβλία του κόσμου»
«Να σαρώσουμε καταστροφικά κάθε βιβλίο στον κόσμο»
Ένα εσωτερικό σχέδιο της Anthropic, της εταιρείας εταιρείας τεχνητής νοημοσύνης πίσω από το chatbot Claude, περιγράφει με ωμή σαφήνεια έναν στόχο που —κατά τα ίδια τα έγγραφα— έπρεπε να μείνει μυστικός: «Project Panama είναι η προσπάθειά μας να σαρώσουμε καταστροφικά όλα τα βιβλία στον κόσμο. Δεν θέλουμε να είναι γνωστό ότι δουλεύουμε πάνω σε αυτό».
Το περιεχόμενο προέρχεται από δικαστικά έγγραφα που αποσφραγίστηκαν στο πλαίσιο αγωγής πνευματικών δικαιωμάτων συγγραφέων κατά της εταιρείας και αποκαλύπτει πώς οι εταιρείες τεχνητής νοημοσύνης έτρεξαν σε μια άτυπη κούρσα εξοπλισμών για να εξασφαλίσουν όσο το δυνατόν περισσότερα βιβλία για την εκπαίδευση των μοντέλων τους. Σύμφωνα με τα έγγραφα που επικαλείται η Washington Post, η Anthropic φέρεται να δαπάνησε δεκάδες εκατομμύρια δολάρια για να αγοράσει τεράστιους όγκους βιβλίων, να κόψει τις ράχες τους (ώστε να λυθούν σε σελίδες), να τα ψηφιοποιήσει σε υψηλή ταχύτητα και στη συνέχεια να τα οδηγήσει σε ανακύκλωση. Δηλαδή, η διαδικασία ήταν «καταστροφική»: το φυσικό βιβλίο δεν επέστρεφε ποτέ στο ράφι.
Η υπόθεση εντάσσεται στο μεγαλύτερο κύμα δικαστικών συγκρούσεων για το πώς «τρέφονται» τα μεγάλα γλωσσικά μοντέλα. Τα ίδια αρχεία —μαζί με παλαιότερες καταθέσεις σε άλλες δίκες— περιγράφουν ένα οικοσύστημα όπου η απόκτηση δεδομένων γίνεται στρατηγικό πλεονέκτημα και η προσέγγιση της άμεσης αδειοδότησης από εκδότες/συγγραφείς θεωρείται από ορισμένες εταιρείες δύσχρηστη ή και μη ρεαλιστική σε κλίμακα. Έτσι, όπως προκύπτει από τους ισχυρισμούς των αγωγών, αναζητήθηκαν εναλλακτικές: αγορές σε «πακέτα», σάρωση φυσικών αντιτύπων, αλλά και πρόσβαση σε «σκιώδεις βιβλιοθήκες» πειρατικού περιεχομένου.
Στα ίδια δικαστικά έγγραφα αναφέρεται ότι ο συνιδρυτής της Anthropic, Μπεν Μαν, κατέβασε σε διάστημα 11 ημερών (Ιούνιος 2021) μεγάλο όγκο υλικού από το LibGen, μια γνωστή «σκιώδη» βιβλιοθήκη. Επιπλέον, γίνεται αναφορά σε εσωτερικό μήνυμα για τον ιστότοπο Pirate Library Mirror, που δηλώνει ότι «σκόπιμα παραβιάζει» πνευματικά δικαιώματα σε πολλές χώρες. Η Anthropic υποστήριξε σε νομικές καταθέσεις ότι δεν εκπαίδευσε εμπορικό μοντέλο που απέφερε έσοδα με δεδομένα από LibGen και ότι δεν χρησιμοποίησε το Pirate Library Mirror για να εκπαιδεύσει «ολόκληρο» μοντέλο.
Το ρεπορτάζ, ωστόσο, δείχνει ότι το θέμα δεν είναι μόνο «αν» επιτρέπεται η εκπαίδευση. Είναι και το «πώς» αποκτήθηκαν τα βιβλία. Σε πρώιμες αποφάσεις, δικαστές έκριναν ότι η εκπαίδευση μοντέλων πάνω σε βιβλία χωρίς άδεια μπορεί να εμπίπτει στην έννοια του fair use, ως «μετασχηματιστική» χρήση. Στην περίπτωση της Anthropic, ο δικαστής Γουίλιαμ Άλσαπ φέρεται να θεώρησε ότι η εκπαίδευση είναι μετασχηματιστική διαδικασία, όμως άφησε ανοιχτό το ζήτημα πιθανής παραβίασης για τον τρόπο απόκτησης πειρατικών αντιγράφων πριν το «Project Panama». Με βάση τα ίδια έγγραφα, η εταιρεία κατέληξε σε διακανονισμό ύψους 1,5 δισ. δολαρίων, χωρίς παραδοχή ενοχής, για το σκέλος που αφορούσε την απόκτηση υλικού.
Το ρεπορτάζ περιγράφει και τον ευρύτερο ανταγωνισμό. Εσωτερικές επικοινωνίες που έχουν έρθει στο φως σε δίκη κατά της Meta δείχνουν στελέχη να χαρακτηρίζουν «απαραίτητη» την πρόσβαση σε τεράστιες ψηφιακές βιβλιοθήκες για να μείνουν ανταγωνιστικοί. Σε μηνύματα εργαζομένων εμφανίζονται ενστάσεις του τύπου «το torrenting από εταιρικό laptop δεν μου φαίνεται σωστό», αλλά και ανησυχίες ότι η χρήση πλατφορμών torrent ενδέχεται να συνεπάγεται διανομή πειρατικού υλικού. Σε ένα email (Δεκέμβριος 2023) γίνεται αναφορά σε έγκριση μετά από «κλιμάκωση προς MZ», που η αγωγή ερμηνεύει ως αναφορά στον Μαρκ Ζάκερμπεργκ, αν και η Meta δεν σχολίασε προς την Washington Post.
Στο φόντο αυτών των αποκαλύψεων, ειδικοί και οργανώσεις δημιουργών πιέζουν για νέο πλαίσιο: αμοιβές και κανόνες για τη χρήση έργων, μεγαλύτερη διαφάνεια για τα datasets, και πρακτικούς μηχανισμούς αδειοδότησης που να μπορούν να «σηκώσουν» τον όγκο της αγοράς. Όπως σημειώνει νομικός ακαδημαϊκός που επικαλείται το ρεπορτάζ, πολλές εταιρείες ξεκίνησαν με πρακτικές της ακαδημαϊκής έρευνας, αλλά συνέχισαν την ίδια λογική όταν τα μοντέλα εμπορευματοποιήθηκαν — κι όταν η ένταση έγινε προφανής, είχαν ήδη επενδύσει τεράστια ποσά και είχαν «κλειδώσει» σε ανταγωνισμό ταχύτητας.
Πηγή: The Washington Post
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Ο αστροναύτης Ρόναλντ Γκάραν περιγράφει πώς η παρατήρηση της Γης από τον Διεθνή Διαστημικό Σταθμό τον έκανε να δει διαφορετικά την ανθρωπότητα.
Στο τραπέζι περικοπές άνω του 20% του προσωπικού - Ο Μαρκ Ζάκερμπεργκ ποντάρει δισεκατομμύρια στην AI
Τι δείχνει νέα έρευνα
Το πλήρωμα ετοιμάζεται για την πρώτη επανδρωμένη πτήση γύρω από το φεγγάρι μετά από μισό αιώνα
Η ιδέα βασίζεται στην έννοια της «τριβής» στη συμπεριφορά του χρήστη
Πάρα πολλές δουλειές ήδη γίνονται από ΑΙ, ή Τεχνητή Νοημοσύνη, και ο/η Τζέμιναϊ έχει μπει για τα καλά στη ζωή μας
Παρατηρήθηκε για πρώτη φορά η δημιουργία magnetar μέσα σε υπερφωτεινή υπερκαινοφανή έκρηξη
Υπό ποια δικαιολογία προχώρησε σε αυτές τις διαγραφές
Ποιοι είναι οι λεγόμενοι «hasslers»
O ιαπωνικός κολοσσός προσφεύγει στη δικαιοσύνη ζητώντας επιστροφή δισεκατομμυρίων από την κυβέρνηση των ΗΠΑ
Ραγδαία εξάπλωση της ΑΙ στην Ελλάδα αλλά βαθύ χάσμα αντιλήψεων μεταξύ χρηστών και μη χρηστών
Οι αθέατες πρωτοπόροι της επιστήμης, των ιδεών, των τεχνών και των γραμμάτων: Αυτές είναι οι ιστορίες τους.
Το Coruna στο στόχαστρο της Google - Ποιες εκδόσεις λογισμικού κινδυνεύουν και πώς να προστατευτείτε
Ποια τα χαρακτηριστικά του νέου προϊόντος
Φθορίζουσες πρωτεΐνες με κβαντικές ιδιότητες υπόσχονται πρωτοφανή ακρίβεια στην παρατήρηση των κυττάρων
Αυστηρά μέτρα από τον Έλον Μασκ μετά τον κατακλυσμό παραπλανητικού υλικού για τη σύγκρουση στο Ιράν
Από το πράσινο στο κόκκινο και το χρυσό, το show των δέντρων μαγεύει, αλλά εξηγείται δύσκολα
Το κρίσιμο ερώτημα από εδώ και πέρα είναι αν η πολεμική επιχείρηση μετατρέπεται σε ένα καθεστώς όπου η ταχύτητα υπολογισμού λειτουργεί αντιστρόφως ανάλογα με την ανθρώπινη ευθύνη και φρόνηση.
Η άρνηση του Ντάριο Αμοντέι να υποχωρήσει σε θέματα ηθικής για τη στρατιωτική χρήση της AI οδήγησε σε ρεκόρ εγγραφών
Έχετε δει 20 από 200 άρθρα.