- CITY GUIDE
- PODCAST
-
10°
Project Panama: Το μυστικό σχέδιο της Anthropic για να «ταΐσει» την τεχνητή νοημοσύνη
«Να ψηφιοποιήσουμε όλα τα βιβλία του κόσμου»
«Να σαρώσουμε καταστροφικά κάθε βιβλίο στον κόσμο»
Ένα εσωτερικό σχέδιο της Anthropic, της εταιρείας εταιρείας τεχνητής νοημοσύνης πίσω από το chatbot Claude, περιγράφει με ωμή σαφήνεια έναν στόχο που —κατά τα ίδια τα έγγραφα— έπρεπε να μείνει μυστικός: «Project Panama είναι η προσπάθειά μας να σαρώσουμε καταστροφικά όλα τα βιβλία στον κόσμο. Δεν θέλουμε να είναι γνωστό ότι δουλεύουμε πάνω σε αυτό».
Το περιεχόμενο προέρχεται από δικαστικά έγγραφα που αποσφραγίστηκαν στο πλαίσιο αγωγής πνευματικών δικαιωμάτων συγγραφέων κατά της εταιρείας και αποκαλύπτει πώς οι εταιρείες τεχνητής νοημοσύνης έτρεξαν σε μια άτυπη κούρσα εξοπλισμών για να εξασφαλίσουν όσο το δυνατόν περισσότερα βιβλία για την εκπαίδευση των μοντέλων τους. Σύμφωνα με τα έγγραφα που επικαλείται η Washington Post, η Anthropic φέρεται να δαπάνησε δεκάδες εκατομμύρια δολάρια για να αγοράσει τεράστιους όγκους βιβλίων, να κόψει τις ράχες τους (ώστε να λυθούν σε σελίδες), να τα ψηφιοποιήσει σε υψηλή ταχύτητα και στη συνέχεια να τα οδηγήσει σε ανακύκλωση. Δηλαδή, η διαδικασία ήταν «καταστροφική»: το φυσικό βιβλίο δεν επέστρεφε ποτέ στο ράφι.
Η υπόθεση εντάσσεται στο μεγαλύτερο κύμα δικαστικών συγκρούσεων για το πώς «τρέφονται» τα μεγάλα γλωσσικά μοντέλα. Τα ίδια αρχεία —μαζί με παλαιότερες καταθέσεις σε άλλες δίκες— περιγράφουν ένα οικοσύστημα όπου η απόκτηση δεδομένων γίνεται στρατηγικό πλεονέκτημα και η προσέγγιση της άμεσης αδειοδότησης από εκδότες/συγγραφείς θεωρείται από ορισμένες εταιρείες δύσχρηστη ή και μη ρεαλιστική σε κλίμακα. Έτσι, όπως προκύπτει από τους ισχυρισμούς των αγωγών, αναζητήθηκαν εναλλακτικές: αγορές σε «πακέτα», σάρωση φυσικών αντιτύπων, αλλά και πρόσβαση σε «σκιώδεις βιβλιοθήκες» πειρατικού περιεχομένου.
Στα ίδια δικαστικά έγγραφα αναφέρεται ότι ο συνιδρυτής της Anthropic, Μπεν Μαν, κατέβασε σε διάστημα 11 ημερών (Ιούνιος 2021) μεγάλο όγκο υλικού από το LibGen, μια γνωστή «σκιώδη» βιβλιοθήκη. Επιπλέον, γίνεται αναφορά σε εσωτερικό μήνυμα για τον ιστότοπο Pirate Library Mirror, που δηλώνει ότι «σκόπιμα παραβιάζει» πνευματικά δικαιώματα σε πολλές χώρες. Η Anthropic υποστήριξε σε νομικές καταθέσεις ότι δεν εκπαίδευσε εμπορικό μοντέλο που απέφερε έσοδα με δεδομένα από LibGen και ότι δεν χρησιμοποίησε το Pirate Library Mirror για να εκπαιδεύσει «ολόκληρο» μοντέλο.
Το ρεπορτάζ, ωστόσο, δείχνει ότι το θέμα δεν είναι μόνο «αν» επιτρέπεται η εκπαίδευση. Είναι και το «πώς» αποκτήθηκαν τα βιβλία. Σε πρώιμες αποφάσεις, δικαστές έκριναν ότι η εκπαίδευση μοντέλων πάνω σε βιβλία χωρίς άδεια μπορεί να εμπίπτει στην έννοια του fair use, ως «μετασχηματιστική» χρήση. Στην περίπτωση της Anthropic, ο δικαστής Γουίλιαμ Άλσαπ φέρεται να θεώρησε ότι η εκπαίδευση είναι μετασχηματιστική διαδικασία, όμως άφησε ανοιχτό το ζήτημα πιθανής παραβίασης για τον τρόπο απόκτησης πειρατικών αντιγράφων πριν το «Project Panama». Με βάση τα ίδια έγγραφα, η εταιρεία κατέληξε σε διακανονισμό ύψους 1,5 δισ. δολαρίων, χωρίς παραδοχή ενοχής, για το σκέλος που αφορούσε την απόκτηση υλικού.
Το ρεπορτάζ περιγράφει και τον ευρύτερο ανταγωνισμό. Εσωτερικές επικοινωνίες που έχουν έρθει στο φως σε δίκη κατά της Meta δείχνουν στελέχη να χαρακτηρίζουν «απαραίτητη» την πρόσβαση σε τεράστιες ψηφιακές βιβλιοθήκες για να μείνουν ανταγωνιστικοί. Σε μηνύματα εργαζομένων εμφανίζονται ενστάσεις του τύπου «το torrenting από εταιρικό laptop δεν μου φαίνεται σωστό», αλλά και ανησυχίες ότι η χρήση πλατφορμών torrent ενδέχεται να συνεπάγεται διανομή πειρατικού υλικού. Σε ένα email (Δεκέμβριος 2023) γίνεται αναφορά σε έγκριση μετά από «κλιμάκωση προς MZ», που η αγωγή ερμηνεύει ως αναφορά στον Μαρκ Ζάκερμπεργκ, αν και η Meta δεν σχολίασε προς την Washington Post.
Στο φόντο αυτών των αποκαλύψεων, ειδικοί και οργανώσεις δημιουργών πιέζουν για νέο πλαίσιο: αμοιβές και κανόνες για τη χρήση έργων, μεγαλύτερη διαφάνεια για τα datasets, και πρακτικούς μηχανισμούς αδειοδότησης που να μπορούν να «σηκώσουν» τον όγκο της αγοράς. Όπως σημειώνει νομικός ακαδημαϊκός που επικαλείται το ρεπορτάζ, πολλές εταιρείες ξεκίνησαν με πρακτικές της ακαδημαϊκής έρευνας, αλλά συνέχισαν την ίδια λογική όταν τα μοντέλα εμπορευματοποιήθηκαν — κι όταν η ένταση έγινε προφανής, είχαν ήδη επενδύσει τεράστια ποσά και είχαν «κλειδώσει» σε ανταγωνισμό ταχύτητας.
Πηγή: The Washington Post
ΤΑ ΠΙΟ ΔΗΜΟΦΙΛΗ
ΔΙΑΒΑΖΟΝΤΑΙ ΠΑΝΤΑ
ΔΕΙΤΕ ΕΠΙΣΗΣ
Πώς μπορούν να παρακολουθήσουν χρήστες και τι πρέπει να προσέξουν
«Να ψηφιοποιήσουμε όλα τα βιβλία του κόσμου»
Χάρτης-ρεκόρ από το James Webb αποκαλύπτει πώς η σκοτεινή ύλη διαμόρφωσε γαλαξίες επί 10 δισ. χρόνια
Νέα έρευνα δείχνει ότι τα μικροπλαστικά στην ατμόσφαιρα ίσως είναι λιγότερα και ζητά ενιαίες μετρήσεις
Νέα μελέτη δείχνει ότι ο μυστηριώδης οργανισμός δεν ήταν μύκητας, αλλά άγνωστη μορφή πολυκύτταρης ζωής
Ανησυχίες για την αξιοπιστία των απαντήσεων - Οι «έξυπνες» περιλήψεις παραπέμπουν σε βίντεο αντί για επίσημες πηγές
Εντοπίστηκε σε απροστάτευτη βάση δεδομένων από ερευνητή κυβερνοασφάλειας
Παράλληλα με την ευκολία της, η τεχνολογία φέρνει και άγχη
Το πρόβλημα δεν είναι δικό σας
Έρευνα καταγγέλλει βιομηχανική παραγωγή πορνογραφικού υλικού ανηλίκων από το εργαλείο AI της X
Η ισχυρότερη ηλιακή ακτινοβολιακή καταιγίδα από το 2003 προκαλεί ανησυχία για δορυφόρους, πτήσεις και GPS
Kαι αυτό αλλάζει όσα ξέραμε για τον ιό
Σε αυτή την περίπτωση η προσέγγιση είναι πλήρως εξατομικευμένη
Μέχρι σήμερα έχουν θεραπευτεί 35 ασθενείς
Από πάροχος υπηρεσιών εξυπηρέτησης σε στρατηγικό digital partner για την ψηφιακή εποχή
Ο Επικεφαλής Συνεργασιών Ειδησεογραφικού Περιεχομένου της Google για τη Νότια Ευρώπη μιλά στην Athens Voice
Αστροναύτισσα της NASA μιλά ανοιχτά για την ανθρώπινη επαφή σε συνθήκες μηδενικής βαρύτητας
Οι αθέατες πρωτοπόροι της επιστήμης, των ιδεών, των τεχνών και των γραμμάτων: Αυτές είναι οι ιστορίες τους.
Έχετε δει 20 από 200 άρθρα.