VIDEO TRANSCRIPTION
DeepSeek, chińska firma AI, szykuje się do wydania nowego modelu R2, który ma ulepszone zdolności kodowania i rozumienie języków obcych. Próbują przyspieszyć harmonogram premiery, co może wstrząsnąć ekosystemem AI. Ich założyciel, Liang Wenfeng, prowadzi firmę jak laboratorium badawcze, oferując wysokie pensje pracownikom. DeepSeek koncentruje się na obniżaniu kosztów i wykorzystuje zaawansowane techniki, aby osiągnąć porównywalną wydajność z większymi firmami. W międzyczasie OpenAI rozszerza dostęp do narzędzi badawczych i funkcji głosowych, a także bada ryzyko związanego z perswazją. Apple plotkuje o współpracy z OpenAI w celu udoskonalenia interakcji głosowych AI na swoich urządzeniach.
DeepSeek ściga się, aby wypuścić swój następny model AI przed terminem, zmniejszając koszty nawet o 40 razy w porównaniu do OpenAI i wywracając całą branżę do góry nogami. Tymczasem nowa sztuczna inteligencja wideo Alibaby już przewyższa Sora od OpenAI, a rządy zachodnie zaczynają panikować. I gdy OpenAI wprowadza nowe narzędzia badawcze i funkcje głosowe, pojawia się jedno duże pytanie. Jak bardzo przekonująca powinna być sztuczna inteligencja? Dobra, przede wszystkim DeepSeek robi duże zamieszanie w mediach. Jeśli pamiętacie, w styczniu uruchomili swój model R1, który w zasadzie zaskoczył wszystkich. R1 był reklamowany jako potężny model wnioskowania AI, a jego szkolenie kosztowało ułamek tego, co większe firmy, takie jak OpenAI, rzekomo inwestują w swoje własne modele. Niektórzy byli sceptyczni wobec tych twierdzeń. Google nawet nazwał oświadczenia DeepSeek przesadzonymi, a OpenAI podejrzewał, że DeepSeek mógł wykorzystać destylację z infrastruktury ChatGPT.
Ale tak czy inaczej model był już dostępny, a wielkie nazwy, takie jak Microsoft, dodały R1 do Azure AI Foundry, a GitHub i Amazon Web Services umieściły go również w swoim katalogu modeli. Teraz wielka historia jest taka, że DeepSeek chce wypuścić swojego następcę, R2, wcześniej niż pierwotnie planowano. Mówili, że R2 może wystartować na początku maja, ale nowe raporty sugerują, że próbują wypuścić go jeszcze wcześniej. Niestety nie mamy dokładnej daty, ale plotka głosi, że to może być przed majem. Nadchodzący model R2 ma mieć ulepszone zdolności kodowania i lepiej radzić sobie z rozumowaniem w językach innych niż angielski. To ogromna sprawa, ponieważ jeśli się nad tym zastanowisz, wiele zaawansowanych modeli językowych skupia się wokół angielskiego.
Dlaczego DeepSeek przyspiesza ten harmonogram? Cóż, GPT 4,5 jest jeszcze tygodnie od premiery, a GPT 5 może nie pojawić się przez miesiące, więc jeśli R2 trafi wkrótce na rynek, DeepSeq może ponownie wstrząsnąć ekosystemem AI. I już udowodnili, że mogą znacząco obniżyć ceny OpenAI. Według analityków z Bernstein ceny DeepSeq mogą być 20 do 40 razy niższe niż te, które nalicza OpenAI za porównywalną wydajność. Ten aspekt oszczędności kosztów przyciągną nie tylko małe przedsiębiorstwa, ale także głównych graczy, którzy chcą zintegrować R1 z ich ofertami. Aby naprawdę zrozumieć, co napędza DeepSeq, trzeba poznać trochę jego założyciela, Liang Wenfenga. Jest opisywany jako bardzo introwertyczny i skromny, ale stał się miliarderem dzięki swojemu kwantytatywnemu funduszowi hedgingowemu. Atmosfera jest taka, że prowadzi DeepSeek bardziej jak laboratorium badawcze niż klasyczny startup nastawiony na zysk. Nawet płaci pracownikom najwyższe pensje.
Niektórzy starsi naukowcy danych zarabiają 1,5 miliona yuanów rocznie, podczas gdy inne konkurencyjne fundusze kwantowe zazwyczaj ograniczają się do około 800 tysięcy yuanów. Jest również znany z posiadania bardziej płaskiej struktury korporacyjnej, co jest dość odmienne od typowego modelu chińskiego giganta technologicznego pracującego od 9 rano do 9 wieczorem, 6 dni w tygodniu. Zamiast tego ludzie zgłaszają, że pracują normalne, 8-godzinne dni w dość wspólnym, praktycznym środowisku. High Flyer, fundusz hedgingowy stojący za tym wszystkim, rzeczywiście zainwestował mnóstwo pieniędzy w badania nad sztuczną inteligencją, na długo zanim Air 1 znalazło się na pierwszych stronach gazet. Wydali około 1,5 miliarda yuanów na dwa klastry superkomputerowe AI. w 2020 i 2021 roku. Jeden z tych klastrów, Firefly 2, składa się z około 10 tysięcy chipów NVIDIA A100.
To było zanim Stany Zjednoczone zakazały eksportu tych chipów do Chin, więc kiedy ten zakaz wszedł w życie, High Flyer było już gotowe. Dało im to dużą przewagę. Kluczem do efektywności kosztowej DeepSeek jest wykorzystanie technik takich jak mieszanka ekspertów, Moe i wielogłowa, latentna uwaga, MLI. W MOE model dzieli się na wyspecjalizowane komponenty ekspertów, więc nie musi korzystać z całego modelu przy każdym zapytaniu. Tymczasem MLA oznacza, że model może przetwarzać różne części wejścia jednocześnie, wybierając najważniejsze szczegóły bardziej efektywnie. W rezultacie DeepSeek twierdzi, że może osiągnąć wydajność porównywalną z większymi, bardziej kosztownymi modelami bez nadmiernych wydatków. Chińskie władze interesująco w pełni wspierają DeepSeek. Widzimy jak rządy miejskie, firmy energetyczne i duże korporacje takie jak Lenovo, Baidu i Tencent integrują DeepSeek w swoich produktach. Rząd nawet mówi DeepSeek, aby utrzymywał niski profil w międzynarodowych mediach.
Tymczasem niektóre zachodnie rządy, jak Korea Południowa i Włochy, ograniczyły lub usunęły aplikacje oparte na DeepSeek z powodu obaw o prywatność. Istnieją też szersze obawy, że zaawansowane modele AI mogą być używane do manipulacji społecznej lub kampanii dezinformacyjnych. więc nie jest zaskakujące, że kontrola się nasila w niektórych regionach. Ale to nie tylko DeepSeek podejmuje działania. Alibaba niedawno ogłosiła swój open-source'owy model bazowy wideo One 2. 1, który podobno przewyższa inny model OpenAI, zwany Sora, w niektórych testach. Nowa oferta Alibaby obejmuje wiele submodeli zoptymalizowanych pod kątem tekstu do wideo, obrazu do wideo, edytowania wideo, tekstu do obrazu i więcej. T2FU14B i WAN 2. 1T2 FUR 14B, które oba mogą generować filmy w 480p i 720p, plus mniejszy model T2 FUR 1. 3B, który może działać na kartach GPU klasy konsumenckiej, jak RTX 4090. Według Alibaby WAN 2.
1 potrafi obsługiwać skomplikowane ruchy i realistyczne symulacje fizyki, a na liście rankingowej WABENCH opublikował znakomite wyniki. Częścią sekretu jest nowatorska trójwymiarowa przyczynowa architektura WAE, z mechanizmem kaszowania funkcji dla szybkości oraz struktura dopasowywania przepływu w ramach transformera z dyfuzją. Krótko mówiąc, wrzucili wiele zaawansowanych technik do tego procesu, trenując na około 1,5 miliarda filmów i 10 miliardach obrazów. To ogromne. Po stronie OpenAI pojawiło się kilka dużych wiadomości. Po pierwsze, rozszerzyli dostęp do swojego zaawansowanego narzędzia badawczego. Początkowo było dostępne tylko dla profesjonalnych subskrybentów, za 200 dolarów miesięcznie, a teraz jest otwarte dla wszystkich płatnych użytkowników ChatGPT oraz Team Adjet Enterprise. Jeśli masz Plan Plus, otrzymasz 10 zapytań do głębokiego badania każdego miesiąca. Użytkownicy Pro zyskują wzrost z 100 zapytań do 120.
Jeśli nie jesteś z tym zaznajomiony, głębokie badanie to w zasadzie zaawansowane narzędzie do generowania szczegółowych, zasobochłonnych raportów, które czasami zajmują od 5 do 30 minut na złożenie pojedynczego zapytania. Rozumowanie jest nieco wolniejsze, ale może być bardziej dogłębne. A teraz zawiera także obrazy w cytatach dla głębszej analizy. Jednak darmowi użytkownicy chat GPT nadal nie mają dostępu do głębokich badań, ponieważ jest to podobno bardzo zasobożerne. Kolejna aktualizacja OpenAI dotyczy ryzyka związanego z perswazją. W swoim ostatnim raporcie omawiali, jak model Deep Research może być używany do przekonywania lub wpływania na przekonania ludzi. Z tego powodu wstrzymują się z uruchomieniem wersji API modelu głębokiego badania. praktycznie rzecz biorąc ponownie oceniają, jak testować perswazję w świecie rzeczywistym. W tym jak sztuczna inteligencja może tworzyć niezwykle spersonalizowane treści, które masowo wpływają na opinie.
Przeprowadzili również testy, na przykład sprawdzali czy zaawansowany model badawczy mógłby przekonać GPT-4. 0 do zapłacenia pieniędzy lub ujawnienia hasła. W rzeczywistości przewyższył niektóre starsze modele OpenAI w tej kwestii, chociaż nie był tak przekonujący w scenariuszu z hasłem. Mimo to OpenAI chce postępować ostrożnie, zanim udostępni go szeroko zewnętrznym deweloperom. Na koniec jest jeszcze jedna ciekawostka od OpenAI. Udostępniają wersję pokazową zaawansowanego trybu głosowego w ChatGPT dla darmowych użytkowników platformy. Ta funkcja była wcześniej dostępna wyłącznie dla subskrybentów plus. Zaawansowany tryb głosowy pozwala rozmawiać z ChatGPT na głos, zamiast pisać wszystkie pytania. Może obsługiwać bardziej naturalne rozmowy w czasie rzeczywistym, nawet pozwalając przerwać w trakcie odpowiedzi, aby zadać pytania uzupełniające lub zmienić temat. Trzeba jednak pamiętać o dziennych limitach użytkowania, które mogą się zmieniać. Ale to nadal fajne, że więcej osób może to przetestować bez płacenia za subskrypcję premium.
Jeśli chcesz spróbować, po prostu dotknij ikony głosu w aplikacji ChatGPT, udziel dostępu do mikrofonu i gotowe. Co ciekawe, Apple również zaangażował się w pewną współpracę z OpenAI. Krążą plotki o umowie między Apple OpenAI i ChatGPT, która może dotyczyć. . . udoskonalenia interakcji głosowych AI na urządzeniach Apple. Będziemy musieli poczekać na oficjalne potwierdzenie, ale wydaje się, że coś się tam kroi. Tak więc ceny spadają, konkurencja się nasila, a wielcy gracze podejmują działania, które mogą całkowicie zmienić cały krajobraz. Dajcie znać w komentarzach, czy uważacie, że DeepSeek ma to, czego potrzeba, aby rzucić wyzwanie OpenAI, czy też zachodni giganci będą jeszcze bardziej się opierać. Jeśli podobało Ci się to omówienie, zostaw lajka, zasubskrybuj, aby zobaczyć więcej dogłębnych analiz. Dzięki za oglądanie i do zobaczenia w następnym.
By visiting or using our website, you agree that our website or the websites of our partners may use cookies to store information for the purpose of delivering better, faster, and more secure services, as well as for marketing purposes.