Το μοντέλο Chinchilla, που αναπτύχθηκε από DeepMind ερευνητές, έχει τον ίδιο υπολογιστικό προϋπολογισμό με τον Gopher, αλλά έχει 70 δισεκατομμύρια παραμέτρους και τετραπλάσια δεδομένα. Εάν γνωρίζετε καλά το Chinchilla AI και αναρωτιέστε πώς να χρησιμοποιήσετε το Chinchilla AI, τότε αυτό το άρθρο είναι αφιερωμένο σε εσάς.
Σε μια μεγάλη ποικιλία εργασιών αξιολόγησης κατάντη, το Chinchilla ξεπερνά σταθερά και σημαντικά τους Gopher (280B), GPT-3 (175B), Jurassic-1 (178B) και Megatron-Turing NLG (530B). Για εξαγωγή συμπερασμάτων και λεπτομέρεια, καταναλώνει σημαντικά λιγότερους υπολογισμούς, γεγονός που διευκολύνει δραματικά την κατάντη χρήση. Θέλετε να μάθετε πώς να χρησιμοποιείτε το Chinchilla AI; Ας εξερευνήσουμε το άρθρο.
Αν ψάχνετε πώς να χρησιμοποιήσετε το Chinchilla AI, τότε ας σας πούμε ότι η πρόσβαση στο Chinchilla AI είναι δυστυχώς περιορισμένη μεταξύ επιλεγμένων χρηστών. Οι περισσότεροι από τους επιστήμονες του DeepMind χρησιμοποιούν αυτό το σαφές AI και δημοσιεύουν το αποτέλεσμα στο Twitter. Μπορούμε μόνο να ελπίζουμε ότι το DeepMind Chinchilla AI θα είναι σύντομα διαθέσιμο για τους απλούς ανθρώπους.
Ανατρέξτε στο άρθρο και εξερευνήστε περισσότερα σχετικά με τον τρόπο χρήσης Chinchilla AI από την DeepMind.
Τι είναι το Chinchilla AI;
Για να μάθετε πώς να χρησιμοποιείτε το Chinchilla AI, ας ξεκινήσουμε με την εκμάθηση των βασικών. Η αύξηση της πολυπλοκότητας του μοντέλου χωρίς επέκταση του αριθμού των κουπονιών εκμάθησης είναι η τάση τελευταία στις προκλήσεις μοντελοποίησης γλώσσας (περίπου 300 δισεκατομμύρια κατά τη διάρκεια της εκπαίδευσης). Το Megatron-Turing NLG, το οποίο είναι περισσότερο από τρεις φορές μεγαλύτερο από το GPT-3 του OpenAI, είναι το μεγαλύτερο μοντέλο μετασχηματιστή αυτή τη στιγμή. Το Chinchilla είναι ένα ολοκαίνουργιο μοντέλο γλώσσας που παρουσίασε η DeepMind. Παρόλο που έχει παρόμοια απόδοση με τεράστια μοντέλα γλώσσας όπως η Megatron-Turing NLG (530B παράμετροι), το Jurassic-1 (παράμετροι 178B), το GPT-3 (παράμετροι 175B), το Gopher (παράμετροι 280B) και το GPT-3, υπάρχει μια σημαντική διάκριση : Επιτυγχάνει μέση ακρίβεια 67,5% στο σημείο αναφοράς MMLU χρησιμοποιώντας τον ίδιο υπολογιστικό προϋπολογισμό με το Gopher αλλά με μόλις 70 δισεκατομμύρια παραμέτρους συν 4 φορές περισσότερα δεδομένα, που είναι αύξηση 7% σε σχέση με το Gopher.
Πώς να χρησιμοποιήσετε το Chinchilla AI? Πώς λειτουργεί?
Αν αναρωτιέστε πώς να χρησιμοποιήσετε το Chinchilla AI. Λοιπόν, δυστυχώς, αυτή τη στιγμή δεν είναι διαθέσιμη στο κοινό. Ωστόσο, θα είναι σύντομα διαθέσιμο τους επόμενους μήνες και στη συνέχεια μπορείτε να χρησιμοποιήσετε το Chinchilla AI για να δημιουργήσετε ένα chatbot, εικονικό βοηθό, μοντέλα πρόβλεψης και άλλες εφαρμογές τεχνητής νοημοσύνης.
Το Chinchilla ξεπέρασε τις επιδόσεις του Gopher κατά 7%, επιτυγχάνοντας μια υπερσύγχρονη μέση ακρίβεια 67,5% στο σημείο αναφοράς MMLU. Η ανάπτυξη του μοντέλου χωρίς αύξηση της προσφοράς κουπονιών εκπαίδευσης ήταν η διαδεδομένη προσέγγιση στην εκπαίδευση μοντέλων μεγάλων γλωσσών. Σε σύγκριση με τα 170 δισεκατομμύρια χαρακτηριστικά του GPT-3, ο μεγαλύτερος πυκνός μετασχηματιστής, ο MT-NLG 530B, είναι τώρα πάνω από 3 φορές μεγαλύτερος.
Ο Toby Shevlane, ένας ερευνητής στο DeepMind, επεσήμανε πρόσφατα αυτές τις περιπτώσεις Chinchilla να σκέφτεται τις συνδέσεις μεταξύ των εννοιών σε ένα Tweet που έχει λάβει τώρα πολλά likes και retweets.
Δυστυχώς, οι απλοί άνθρωποι δεν έχουν πρόσβαση στο Chinchilla AI προς το παρόν. Βασιζόμαστε σε μεγάλο βαθμό στα Tweets που δημιουργούνται από επιστήμονες της DeepMind.
Οι παρατηρήσεις του Kaplan επανεξετάστηκαν από ερευνητές της DeepMind σε μια πρόσφατη μελέτη (“Training Compute-Optimal Large Language Models” από τους Hoffmann et al.), οι οποίοι ανακάλυψαν ότι η αύξηση του αριθμού των διακριτικών (δηλ. ο όγκος της εισαγωγής κειμένου που δίνεται στο μοντέλο ) είναι εξίσου σημαντική με την αύξηση του μεγέθους του μοντέλου. Προκειμένου να επιτευχθεί το υπολογιστικό-βέλτιστο μοντέλο, οι επιστήμονες θα πρέπει να παρέχουν έναν προκαθορισμένο υπολογιστικό προϋπολογισμό σε αναλογικά αυξανόμενα ποσά στο μέγεθος του μοντέλου και στα κουπόνια εκπαίδευσης (μετρούμενα με ελάχιστη απώλεια εκπαίδευσης). Ο αριθμός των κουπονιών εκπαίδευσης πρέπει να αυξάνεται κάθε φορά που το μέγεθος του μοντέλου διπλασιάζεται. Αυτό υποδηλώνει ότι ένα μικρότερο μοντέλο μπορεί να νικήσει δραματικά ένα μεγαλύτερο, αλλά χειρότερο, μοντέλο εάν εκπαιδευτεί σε μεγάλο αριθμό μάρκες.
Και έδωσαν στοιχεία για αυτό. Το Chinchilla, ένα μοντέλο παραμέτρων 70B που εκπαιδεύτηκε σε τέσσερις φορές περισσότερα δεδομένα, αλλά είναι τέσσερις φορές μικρότερο από τον προηγούμενο πρωταθλητή της βιομηχανίας στη γλώσσα AI, το Gopher (δημιουργήθηκε επίσης από την DeepMind), είναι το αποκορύφωμα του νέου άρθρου.
Επιπλέον, το τσιντσιλά είναι μικρότερο, επομένως το συμπέρασμα και η λεπτομέρεια είναι λιγότερο ακριβά. Αυτό διευκολύνει τις μικρότερες επιχειρήσεις ή τα ακαδημαϊκά ιδρύματα που ενδέχεται να στερούνται χρηματοδότησης ή απαρχαιωμένων μηχανημάτων να χρησιμοποιούν μεγαλύτερα μοντέλα για να χρησιμοποιούν αυτά τα μοντέλα. “Τα οφέλη ενός πιο βέλτιστα εκπαιδευμένου μικρότερου μοντέλου, επομένως, εκτείνονται πέρα από τα άμεσα οφέλη της βελτιωμένης απόδοσής του.” αναφέρεται από τους προγραμματιστές.
Τυλίγοντας
Ελπίζω, αυτός ο σύντομος οδηγός σας φώτισε πώς να χρησιμοποιήσετε το Chinchilla AI. Έχουμε συζητήσει τη χρήση του Chinchilla AI σε αυτό το άρθρο μαζί με τον τρόπο λειτουργίας του. Ενημερώστε μας εάν χρειάζεστε περισσότερες πληροφορίες σχετικά με το Chinchilla AI. Δυστυχώς, το Chinchilla AI δεν είναι διαθέσιμο στους απλούς ανθρώπους. Προς το παρόν, μπορούμε μόνο να πάρουμε μια γεύση από τα Tweets που έγιναν από τους επιστήμονες του DeepMind. Ακολουθήστε το Deasilex για περισσότερες ενημερώσεις σχετικά με το Chinchilla AI.
Συχνές Ερωτήσεις
Q1. Ποιες είναι οι τελευταίες τάσεις στην τεχνητή νοημοσύνη;
Εισάγονται καλύτερα αυτοματοποιημένα συστήματα, που είναι ένα από τα κύρια θέματα της τεχνητής νοημοσύνης. Η ανάπτυξη της τεχνολογίας των drone, της αυτόνομης εξερεύνησης και των συστημάτων βιο-εμπνευσμένων αποτελούν προτεραιότητες για την επερχόμενη γενιά αυτόνομων συστημάτων που τροφοδοτούνται από μοντέλα AI.
Ε2. Ποιο είναι το πιο προηγμένο AI τώρα;
Παρόλο που η τεχνητή νοημοσύνη έχει γίνει καλύτερη, η εισαγωγή του ChatGPT τον Νοέμβριο του 2022 άλλαξε το παιχνίδι. Το πιο ισχυρό σύστημα AI στον κόσμο, το GPT-3, διαθέτει μια εφαρμογή συνομιλίας που ονομάζεται ChatGPT που σας δίνει τη δυνατότητα να διεξάγετε μια φυσική συζήτηση με αυτήν την τεχνολογία αιχμής.
Ε3. Ποιο είναι το πιο γρήγορο AI στον κόσμο;
Τα 18 “SuperPods” που αποτελούν τον υπερυπολογιστή Eos περιλαμβάνουν όλα τα 32-DGX H100 Pods. 4.608 από τις τελευταίες H100 GPU της Nvidia, 500 μεταγωγείς Quantum-2 InfiniBand και 360 διακόπτες NVLink αποτελούν μέρος των συστημάτων 576 DGX H100.
Q4. Τι είναι η Trending Technology το 2022;
Μερικές από τις νεότερες κορυφαίες τεχνολογικές τάσεις για το 2022–2024 παρατίθενται παρακάτω: Ρομποτική αυτοματοποίηση διεργασιών (RPA), υπολογιστές αιχμής και τεχνητή νοημοσύνη (AI).
Q5. Ποιο είναι το πιο έξυπνο AI για να μιλήσεις;
Το πιο ανθρωποειδές ρομπότ συνομιλίας στον κόσμο, σύμφωνα με ισχυρισμούς, είναι το Mitsuku. Το bot έχει κερδίσει συχνά το βραβείο Loenber για συνομιλίες που φαίνονται οι πιο ρεαλιστικές. Η πλατφόρμα Pandorabot χρησιμοποιήθηκε για την κατασκευή Mitsuku.