Επιχειρήσεις

DeepSeek: Ποια είναι η κινέζικη startup τεχνητής νοημοσύνης που φέρνει «τρόμο» στη Silicon Valley

Η εταιρεία αναπτύσσει μοντέλα AI που είναι ανοικτού κώδικα

Η DeepSeek, μια κινεζική startup τεχνητής νοημοσύνης που είναι μόλις ενός έτους, έχει προκαλέσει δέος και ανησυχία στην Silicon Valley.

Η επίδειξη των πρωτοποριακών μοντέλων τεχνητής νοημοσύνης της startup που προσφέρουν συγκρίσιμες επιδόσεις με τα καλύτερα chatbots του κόσμου σε πολύ χαμηλότερο κόστος, μοιάζουν ασυναγώνιστα. Η εμφάνιση της DeepSeek μπορεί να προσφέρει έναν αντίλογο στην ευρέως διαδεδομένη πεποίθηση ότι το μέλλον της τεχνητής νοημοσύνης θα απαιτεί ολοένα και μεγαλύτερες ποσότητες ισχύος και ενέργειας για την ανάπτυξή της.

Στα τέλη Ιανουαρίου, καθώς η διαφημιστική εκστρατεία γύρω από την καινοτομία της DeepSeek πήρε διαστάσεις χιονοστιβάδας και οι επενδυτές άρχισαν να αφομοιώνουν τις επιπτώσεις για τους ανταγωνιστές της με έδρα τις ΗΠΑ και τις προμηθευτές υλικού.

Τι ακριβώς είναι η DeepSeek;

Η DeepSeek ιδρύθηκε το 2023 από τον Liang Wenfeng, τον επικεφαλής του προσανατολισμένου στην AI hedge fund High-Flyer. Η εταιρεία αναπτύσσει μοντέλα AI που είναι ανοικτού κώδικα, που σημαίνει ότι ένας οποιοσδήποτε από την ανοιχτή κοινότητα των developers μπορεί να επέμβει το λογισμικό. Η εφαρμογή της για κινητά τηλέφωνα σημείωσε ραγδαία αύξηση για iPhone στις ΗΠΑ μετά την κυκλοφορία της στις αρχές του Ιανουαρίου.

Η εφαρμογή διακρίνεται από άλλα chatbots, όπως το ChatGPT της OpenAI, εξηγώντας το σκεπτικό του πριν δώσει απάντηση σε μια προτροπή. Η εταιρεία ισχυρίζεται ότι η έκδοση R1 προσφέρει επιδόσεις εφάμιλλες με τις τελευταίες του OpenAI και έχει παραχωρήσει άδεια χρήσης σε ιδιώτες που ενδιαφέρονται να αναπτύξουν chatbots χρησιμοποιώντας την τεχνολογία για να βασιστούν σε αυτήν.

Πώς λειτουργεί το DeepSeek R1 – Συγκρίνεται με το OpenAI ή το Meta AI;

Αν και δεν είναι απόλυτα σαφές από την εταιρεία, το κόστος εκπαίδευσης και ανάπτυξης των μοντέλων της DeepSeek φαίνεται να είναι μόνο ένα κλάσμα αυτού που απαιτείται για το OpenAI ή τις πλατφόρμες της Meta. Η πολύ καλύτερη αποδοτικότητα του μοντέλου θέτει την ανάγκη για τεράστιες κεφαλαιακές δαπάνες για την απόκτηση των πιο πρόσφατων και ισχυρότερων επιταχυντών τεχνητής νοημοσύνης από εταιρείες όπως η Nvidia.

Αυτό επίσης ενισχύει την προσοχή στους περιορισμούς των αμερικανικών εξαγωγών τέτοιων προηγμένων ημιαγωγών προς την Κίνα – οι οποίες είχαν ως στόχο να αποτρέψουν μια επανάσταση του είδους που η DeepSeek φαίνεται να αντιπροσωπεύει.

 Η DeepSeek λέει ότι η R1 είναι κοντά ή ήδη καλύτερη από τα αντίπαλα μοντέλα σε διάφορα κορυφαία συγκριτικά κριτήρια, όπως το AIME 2024 για τις μαθηματικές εργασίες, MMLU για γενικές γνώσεις και AlpacaEval 2.0 για απόδοση ερωτήσεων και απαντήσεων. Κατατάσσεται επίσης μεταξύ των κορυφαίων επιδόσεων σε ένα UC Berkeley που ονομάζεται Chatbot Arena.

Τι προκαλεί συναγερμό στις ΗΠΑ;

Η Ουάσιγκτον απαγόρευσε την εξαγωγή τεχνολογιών υψηλής τεχνολογίας, όπως οι ημιαγωγοί GPU, στην Κίνα, σε μια προσπάθεια να ανακόψει την πρόοδο της χώρας στην τεχνητή νοημοσύνη, το βασικό όριο στον ανταγωνισμό ΗΠΑ-Κίνας για την τεχνολογική υπεροχή.

Ωστόσο, η πρόοδος του DeepSeek δείχνει ότι οι Κινέζοι μηχανικοί AI έχουν δουλέψει για να παρακάμψουν τους περιορισμούς, εστιάζοντας σε μεγαλύτερη αποδοτικότητα με περιορισμένους πόρους. Η εταιρεία έχει επιδείξει αρκετά στοιχεία που υποδηλώνουν ότι οι εμπορικοί περιορισμοί δεν ήταν απόλυτα αποτελεσματικοί στην παρεμπόδιση της κινεζικής προόδου.

Επιχειρήσεις
Ακολουθήστε το Νewsit.gr στο Google News και ενημερωθείτε πρώτοι για όλη την ειδησεογραφία και τα τελευταία νέα της ημέρας
Newsit Blogs
Επιχειρήσεις: Περισσότερα άρθρα