Nvidia Blackwell: Εμβαθύνοντας στη νέα αρχιτεκτονική GPU των RTX 50 Series

Η Nvidia προσπερνά τα κατασκευαστικά εμπόδια του σήμερα και με την αρχιτεκτονική Blackwell μας υπενθυμίζει ότι δεν είναι τυχαία η πιο ισχυρή εταιρία στον κόσμο με τη συνολική της αξία να εκτιμάται στα 3.38 δις δολάρια τον Ιανουάριο του 2025. Και σε συνεργασία με την Nvidia, το 8Bitz έχει αποκλειστικό υλικό να μοιραστεί σχετικά με την αρχιτεκτονική των νέων GPU σε ένα άρθρο που οι φανατικοί του PC hardware σίγουρα θα βρουν ενδιαφέρον.

Με μικρά αλλά σταθερά βήματα, η Nvidia ανακοίνωσε την επόμενη γενιά desktop καρτών γραφικών με την αρχιτεκτονική που έδειξε στους data centers μέσα στο 2024. Η αρχιτεκτονική Nvidia Blackwell έρχεται στο προσκήνιο και μαζί της φέρνει αυξημένες επιδόσεις παρά το γεγονός ότι ο νόμος του Μουρ, που λέει χοντρικά ότι η ισχύς των υπολογιστών διπλασιάζεται κάθε περίπου δύο χρόνια, έχει φτάσει σε σημείο κορεσμού.

Nvidia Blackwell

Η εταιρία με έδρα την Σάντα Κλάρα της Καλιφόρνια βρήκε έναν ενδιαφέρον τρόπο να συνεχίσει τον νόμο του Μουρ αξιοποιώντας προ εκπαιδευμένα μοντέλα AI και το Neural rendering. Όλα αυτά έδωσαν στην Nvidia τα κατάλληλα εφόδια για να δώσει στην Blackwell μια ζωηρή και μετρήσιμη αύξηση των επιδόσεων σε πολλές εργασίες, ενώ εστιάζει και στο αγαπημένο της κομμάτι, το AI.

Ας πάρουμε όμως τα πράγματα από την αρχή. O Jensen Huang, ανεβαίνοντας στη σκηνή με το γυαλιστερό του τζάκετ, μας υπενθύμισε πολλές φορές πως ό,τι βλέπουμε δε θα μπορούσε να συμβεί χωρίς τη βοήθεια του AI.

Εκείνη τη μέρα η Nvidia αποκάλυψε τέσσερις κάρτες γραφικών:

  • RTX 5070
  • RTX 5070 Ti
  • RTX 5080
  • RTX 5090

Ξεκινώντας από το Neural rendering και από τεχνολογίες όπως το DLSS 4 (ολοκαίνουργιο φέτος), έκανε σημαντική πρόοδο φέρνοντας υψηλή ποιότητα εικόνας με μειωμένες απαιτήσεις σε υπολογιστική δύναμη, κάτι που έχουμε αρκετό καιρό να δούμε.

Nvidia Blackwell GPU

Οι βασικοί πυλώνες που στηρίχθηκε η Nvidia σε αυτή τη γενιά είναι οι εξής:

  • Βελτιστοποίηση για νευρωνικά δίκτυα (neural networks) με μειωμένες απαιτήσεις σε μνήμη και επιτρέποντας περισσότερες ταυτόχρονες διεργασίες.
  • Βελτιωμένη ενεργειακή απόδοση χάρη στη λιθογραφία αλλά και σε πολλές βελτιώσεις σε επίπεδο χρονισμών και συνολικής σχεδίασης.
  • Ανασχεδιασμένος πυρήνας για ασύγχρονη εκτέλεση διαφορετικών διεργασιών. Πχ, ray tracing, raster rendering και διάφορους παρεμφερείς υπολογισμούς που γίνονται πολλές φορές σε διαφορετικό χρόνο από τους υπόλοιπους στο graphics pipeline.
  • Ray tracing πυρήνες 4ης γενιάς με υποστήριξη για mega geometry και μεγαλύτερα σε πολυπλοκότητα αντικείμενα και πιο σύνθετες σκηνές με καλύτερα και ταχύτερα αποτελέσματα. Το ray tracing ήρθε για να μείνει λοιπόν.
  • AI Management Processor (AMP): Αυτός ο επεξεργαστής βοηθά στον προγραμματισμό εργασιών AI παράλληλα με το κλασικό graphics processing, εξασφαλίζοντας ομαλή λειτουργία σε πολύπλοκες σκηνές και φορτία.

Παράλληλα όμως, έχουμε και ορισμένα ανανεωμένα τεχνικά χαρακτηριστικά που βοηθούν στην αύξηση των επιδόσεων που υπόσχεται η Nvidia έναντι της προηγούμενης γενιάς. Σύμφωνα με πληροφορίες, η RTX 5090 θα είναι έως και 30% ταχύτερη από την RTX 4090 σε raw performance, κάτι που υπολογίζουμε για την ώρα ‘χοντρικά’. Πάμε να δούμε όμως τις υπόλοιπες προσθήκες στη νέα γενιά GPU:

Ανασχεδιασμένοι Shader Multiprocessors (SM)

Για χρόνια, η Nvidia χρησιμοποιεί Shader Multiprocessors για να ομαδοποιήσει τους πυρήνες παρέχοντας έτσι καλύτερο παραλληλισμό και μία κάποια αυτονομία για κάθε task. Το κάθε Blackwell SM σε αυτή την αρχιτεκτονική Nvidia Blackwell λαμβάνει πλέον υπόψη του του neural shaders έχοντας το διπλάσιο bandwidth για απαιτητικές εργασίες, ιδίως όσων απαιτούν deep learning και neural shading, ένα από τα κορυφαία νέα αυτής της γενιάς GPU.

Nvidia Blackwell: Εμβαθύνοντας στη νέα αρχιτεκτονική GPU των RTX 50 Series

Κάθε Blackwell SM διπλασιάζει ουσιαστικά το εύρος των εντολών INT32 και έτσι μπορεί να τρέξει είτε αυτές, είτε εντολές FP32 κάτι που δεν ήταν εφικτό με τις Ada Lovelace σε ολόκληρο το τσιπ. Επιπλέον, το χαρακτηριστικό Shader Execution Reordering (SER) παρέχει σαφείς αναβαθμίσεις από το παρελθόν οδηγώντας σε ταχύτερο και πιο αποτελεσματικό διαμοιρασμό των εργασιών στους Tensor cores και τους Shader cores.

Με αυτές τις τροποποιήσεις αλλά και με την αυξημένη και διαφοροποιημένη μνήμη που θα αναφέρουμε αμέσως μετά, η Nvidia Blackwell είναι έτοιμη για mega geometry σκηνές, δηλαδή φτιαγμένη για τεράστια projects που ευελπιστούμε να δούμε κάποια στιγμή σύντομα.

GDDR7 ακόμα μεγαλύτερο ‘leap’ σε επιδόσεις και τρομακτικό bandwidth από non-HBM μνήμες

Οι GDDR7 στο προσκήνιο. Μαζί με τον ανασχεδιασμένο πυρήνα και τους Shader Multiprocessors, η Nvidia πλαισιώνει τις νέες κάρτες της με μνήμες τύπου GDDR7 που πλέον κατασκευάζονται από πολλές εταιρίες όπως η Micron και η Samsung.

Nvidia Blackwell: Εμβαθύνοντας στη νέα αρχιτεκτονική GPU των RTX 50 Series

Η βασική διαφορά έγκειται στον τρόπο αποστολής των δεδομένων. Οι μνήμες GDDR6X χρησιμοποιούν μια μέθοδο που ονομάζεται σηματοδότηση PAM4, η οποία λειτουργεί με τέσσερα επίπεδα σημάτων για την αποστολή πληροφοριών. Σκεφτείτε το σαν να έχετε τέσσερις λωρίδες σε έναν αυτοκινητόδρομο για να ταξιδέψουν τα δεδομένα. Αυτή η μέθοδος δημιουργεί ένα “data eye”, το οποίο είναι απλώς ένας ευφάνταστος τρόπος που αναφέρεται στο ‘παραθυράκι’ στο οποίο συμβαίνει η μεταφορά των δεδομένων. Μεγαλύτερο data eye σημαίνει ομαλότερη και ταχύτερη μεταφορά δεδομένων. Στην Nvidia Blackwell αγγίζει τα 1.8TB/s.

Πηγαίνοντας στη σχεδίαση τριών παλμών PAM3 από το PAM4 μπορεί να μοιάζει με υποβάθμιση, όμως το “data eye” είναι μεγαλύτερο και έτσι το bandwidth είναι υψηλότερο. Τέλος, οι μνήμες τύπου GDDR7 απαιτούν ακόμα λιγότερη ενέργεια για να λειτουργήσουν.

Ray Tracing για μέρες!

Η τεχνική Ray Tracing σημείωσε ένα μεγάλο άλμα προς τα μπροστά με τους πυρήνες RT τέταρτης γενιάς της Blackwell. Οι εν λόγω πυρήνες διαθέτουν μια ειδική μηχανή που έχει σχεδιαστεί για να χειρίζεται πιο λεπτομερή τρισδιάστατα σχήματα, διευκολύνοντας τη διαχείριση πολύπλοκων οπτικών στοιχείων. Περιλαμβάνουν επίσης έξυπνη τεχνική συμπίεσης και αποσυμπίεσης, η οποία επεξεργάζεται όλες αυτές τις λεπτομέρειες πιο αποτελεσματικά χωρίς να επηρεάζεται η ποιότητα.

Σύμφωνα με την NVIDIA, οι συγκεκριμένες αναβαθμίσεις διπλασιάζουν την ταχύτητα με την οποία επεξεργάζονται τα τρίγωνα (τα δομικά στοιχεία των τρισδιάστατων μοντέλων σήμερα) σε σύγκριση με τις παλαιότερες εκδόσεις. Αυτό σημαίνει ότι τα βιντεοπαιχνίδια και οι εφαρμογές 3D μπορούν πλέον να αποδίδουν πολύ πιο λεπτομερείς και αληθοφανείς σκηνές, με την ανίχνευση ακτίνων να λειτουργεί ταχύτερα και ομαλότερα από ποτέ.

Οι Tensor Cores της Blackwell εισάγουν υποστήριξη για INT4 και FP4, οι οποίες είναι λιγότερο ακριβείς εντολές δεδομένων. Η χρήση αυτών των εντολών επιτρέπει σε ορισμένες εργασίες ανίχνευσης ακτίνων να εκτελούνται δύο φορές πιο γρήγορα, ενώ παράλληλα χρησιμοποιούν μόνο τη μισή μνήμη.

Το μειονέκτημα είναι μία μικρή πτώση της ακρίβειας, αλλά για τα γραφικά πραγματικού χρόνου σε παιχνίδια αυτό δε γίνεται ιδιαίτερα αντιληπτό και αξίζει τα οφέλη στην ταχύτητα και την αποδοτικότητα.

Nvidia Blackwell: Εμβαθύνοντας στη νέα αρχιτεκτονική GPU των RTX 50 Series

Ακόμα περισσότερο AI στο… παρασκήνιο με έξυπνο scheduling που θέλει να εξαλείψει το stuttering, να βελτιώσει την επιλογή των clocks και να μειώσει την συνολική κατανάλωση των καρτών.

Η ενσωμάτωση της Τεχνητής Νοημοσύνης στα παιχνίδια έφερε νέες προκλήσεις όσον αφορά τη διατήρηση της ομαλής και άμεσης απόκρισης κατά το gaming. Τόσο η απόδοση του παιχνιδιού όσο και οι εργασίες ΤΝ, όπως η δημιουργία διαλόγων για ψηφιακούς χαρακτήρες, όπως αναφέραμε στο πρόσφατο Podcast μας, χρειάζονται τους ίδιους πόρους, γεγονός που μπορεί να οδηγήσει σε διάφορα προβλήματα. Για παράδειγμα, οι καθυστερήσεις στις απαντήσεις της ΤΝ μπορούν να επηρεάσουν τη ροή μιας συνομιλίας και οι διακοπές στο rendering μπορεί να προκαλέσουν κολλήματα στο gameplay.

Για την επίλυση αυτού του ζητήματος, η NVIDIA εισήγαγε τον επεξεργαστή διαχείρισης AI (AMP). Το προγραμματιστικό αυτό σύστημα βρίσκεται στο ‘μπροστινό μέρος’ της GPU (όσον αφορά την ουρά επεξεργασίας) και ενεργεί σαν ελεγκτής κυκλοφορίας, διασφαλίζοντας ότι οι εργασίες AI, όπως η δημιουργία διαλόγων, δεν επιβραδύνουν την οπτική απεικόνιση του παιχνιδιού. Το αποτέλεσμα είναι μια πιο ομαλή, πιο καθηλωτική εμπειρία όπου τόσο η AI όσο και τα γραφικά λειτουργούν απρόσκοπτα.

Η φιλοσοφία Max-Q της NVIDIA, παρμένη από τα laptop της, στοχεύει στην επίτευξη της καλύτερης δυνατής απόδοσης, διατηρώντας την κατανάλωση ενέργειας σε ελεγχόμενα επίπεδα, ακόμη και σε περιόδους αδράνειας.

Μια σημαντική βελτίωση είναι το DLSS 4, μια τεχνολογία που επιταχύνει το rendering των γραφικών και βοηθά στη μείωση της κατανάλωσης. Η NVIDIA σχεδίασε ακόμη και hardware ειδικά για το DLSS 4, έχοντας ως αποτέλεσμα εντυπωσιακή εξοικονόμηση ενέργειας.

Τα επίπεδα βελτίωσης της κατανάλωσης γίνονται πιο έντονα και από τις αστραπιαίες εναλλαγές που υπόσχεται η αρχιτεκτονική Nvidia Blackwell ανάλογα με το φορτίο. Σύμφωνα με την εταιρία οι κάρτες Blackwell εναλλάσσουν τα power states τους 1000 φορές ταχύτερα απ’ ότι στο παρελθόν, πηγαίνοντας για παράδειγμα στο χαμηλότερο power state πολύ πιο γρήγορα, άρα καταναλώνοντας λιγότερη ενέργεια σε ένα δεδομένο χρονικό διάστημα, ιδιαίτερα χρήσιμο για περιοχές όπου η κατανάλωση της GPU αποτελεί βασικό κριτήριο για τη επιλογή μιας κάρτας γραφικών.

Η λέξη ‘βελτίωση’ όμως δε σταματάει εκεί αφού η Nvidia μας επεφύλασσε και ακόμα πιο σταθερές επιδόσεις κατά το gaming με πιο έξυπνη επιλογή συχνοτήτων ανάλογα με την πολυπλοκότητα της σκηνής.

Μια μεγάλη αναβάθμιση είναι η υποστήριξη για DisplayPort 2.1. Αυτό επιτρέπει τη χρήση ενός μόνο καλωδίου για υψηλούς ρυθμούς ανανέωσης σε μεγαλύτερες οθόνες, κάνοντας τα πάντα να φαίνονται πιο ομαλά και με μεγαλύτερη απόκριση. Με το αυξημένο εύρος ζώνης, το DisplayPort 2.1 είναι ιδανικό για παιχνίδια, δημιουργία περιεχομένου και άλλες απαιτητικές εργασίες, προσφέροντάς σας συνολικά καλύτερη οπτική εμπειρία.

Η εταιρία υποστηρίζει επίσης το AV1 Ultra High Quality, το οποίο κάνει τις ροές βίντεο να φαίνονται ακόμα καλύτερες. Επίσης, διπλασιάζει την ταχύτητα αποκωδικοποίησης H.264, μιας κοινής μορφής βίντεο, ώστε τα βίντεο να φορτώνονται και να αναπαράγονται πιο αποτελεσματικά.

Nvidia Blackwell: Εμβαθύνοντας στη νέα αρχιτεκτονική GPU των RTX 50 Series

Οι διαφάνειες πάρθηκαν από το Nvidia.com σε συνεργασία του 8Bitz με την Nvidia.

Ακολουθήστε το 8Bitz.gr στο Google News για να μαθαίνετε πρώτοι τα νέα για το PC Hardware!

Περισσότερα:

Σχετικά Άρθρα