DeepSeek – jakie daje możliwości?
DeepSeek jest napędzany modelem DeepSeek-V3. Jego producent twierdzi, że to potężny model AI, który przewyższa najbardziej zaawansowane modele na świecie, a więc – jest najlepszy. To oczywiście przede wszystkim chwytliwe hasło reklamowe, a jak jest naprawdę? Cóż, tu opinie w sieci są różne.
Startup został założony przez menedżera funduszu hedgingowego Liang Wenfenga w 2023 roku, który podobno użył tylko 2048 kart NVIDIA H800 i zainwestował w biznes mniej niż 6 milionów dolarów. Jeśli chodzi o branżę sztucznej inteligencji, to stosunkowo niska kwota. Starczyła jednak do wytrenowania modelu z 671 miliardami parametrów. To mniej więcej ułamek tego, co OpenAI i Google wydały na wytrenowanie swoich modeli SI!
Administracja Bidena egzekwowała surowe zasady dotyczące eksportu chipów high-tech do Chin. Kontrole te miały na celu spowolnienie chińskich postępów w dziedzinie sztucznej inteligencji. Wydaje się jednak, że DeepSeek znalazł sposób na trenowanie swoich modeli przy użyciu mniej zaawansowanych chipów niż zakazane wersje. Niektórzy eksperci kwestionują jednak dokładność twierdzeń DeepSeek na temat chipów i kosztów związanych z trenowaniem modeli sztucznej inteligencji.
DeepSeek uruchomił w zeszłym tygodniu bezpłatnego asystenta, który – jak twierdzi – wykorzystuje mniej danych za ułamek kosztów modeli konkurencji, co prawdopodobnie oznacza punkt zwrotny w poziomie inwestycji potrzebnych do sztucznej inteligencji. Jednym z najnowszych modeli jest DeepSeek-R1, a jego wydajność pokazuje poniższe porównanie.
Czytaj też: Bitcoin znowu mocno. Czy Trump przejdzie do historii jako “prezydent kryptowalut”?
DeepSeek podgryzany przez konkurencję?
Choć Inne chińskie firmy, takie jak Baidu, rozwijają swoje własne modele SI, sukces DeepSeek w USA mocno wyróżnia go na tle innych. Sukces startupu spowodował nawet, że inwestorzy technologiczni wyprzedawali swoje akcje technologiczne, co doprowadziło do spadków wartości akcji dużych graczy AI, takich jak NVIDIA i Oracle. Komuś ten sukces musiał się nie spodobać, gdyż DeepSeek poinformował w poniedziałek, że tymczasowo ograniczy rejestracje z powodu cyberataku.
Źródło ataku nie jest znane. Jednak wiemy, że przerwy w poniedziałek były najdłuższymi przerwami w działaniu firmy od około 90 dni. Obecnie rozwiązano już problemy związane z interfejsem programowania aplikacji i brakiem możliwości zalogowania się użytkowników do witryny, aczkolwiek może być to nieco ograniczone. DeepSeek ma jednak pewne problemy z rejestracją nowych użytkowników – co jest spowodowane olbrzymim zainteresowaniem usługą na całym świecie.
Nowy model właśnie się pojawił
Mimo problemów, planowane działania DeepSeek wciąż się odbywają – producent opublikował właśnie wyniki testów najnowszego modelu – Janus-Pro-7B. To rozwinięcie modelu do generowania obrazów Janus, który pojawił się w drugiej połowie grudnia ub. roku. Udoskonalono go w każdy aspekcie. Może teraz wykorzystywać ponad 72 mln obrazów najwyższej jakości oraz obsługiwać 7 miliardów parametrów. Jak podaje DeepSeek, bije on w testach Dall-E oraz Stable Diffusion nie tylko pod względem szybkości działania, ale również zrozumienia.
Janus-Pro-7B znajduje szereg zastosowań – od tworzenia tapet, po grafiki do kampanii reklamowych, a nawet kreowanie światów i postaci w grach wideo. Nie ma jeszcze dwudziestu czterech godzin od jego premiery, ale już można przewidzieć, że może namieszać na rynku. A co jeszcze nas czeka?