"Що таке DeepSeek R1 і як китайська модель штучного інтелекту порівнюється з OpenAI, Meta?" - Юрій Ніколов

28 січ. 2025 09:55:00

Китай стукнув США так, що це поняв весь світ. Китайці запустили власний штучний інтелект DeepSeek. Він політично цензурований, не відповідає на питання про Сі Цзіньпіня. Але настільки крутий у всьому іншому, що всі прифігіли. І головне – він набагато дешевший від усіх американських розробок. І найголовніше – він зроблений на основі мікросхем нижчого покоління, ніж ті що у американців. Торік Байден вводив санкції на найновіші і найдорожчі мікросхеми. Так китайці змогли це обїхати на дешевшій козі. Фактично їм з гамна і вєток вдалось зробити шось подібне до найновіших американських бомбардувальників Ф-35, які коштують таку прірву грошей, що таке враження, що на них навіть бояться літать на війну.

Це вже порівнюють з тим, як у минулому сторіччі американці думали, що вони впєрєді планєти всєй по космосу, а СРСР взяло і першим запустило космічний супутник, а потім і першого космонавта. Так, тоді американці змогли оговтатись і першими висадили людину на Луну, і радянці навіть не змогли добігти до такого результату, а потім ще й розпались. Але чи вдасться американцям виграти гонку тепер, коли Трамп оголосив новий консорціум по штучному інтелекту, а його учасники намалювали вже таку купу охуіліардів інвестицій, що «космонавт» навіть висказав сумніви, що вся ця єбалла не перетвориться на довгостроковий розпил грошей і взагалі хоч колись злетить.

Тому сьогодні зранку акції виробника американських мікросхем посипались. Бо нафіг дороге коли можна дешеве?

Ось вам поясняшка «Bloomberg» про тектонічний зсув у сфері ШІ. Навіть якщо ви цими технологіями ніколи не цікавились – не думайте що вони не зацікавляться вами. Технології галопують за вашою головою.

Що таке DeepSeek R1 і як китайська модель штучного інтелекту порівнюється з OpenAI, Meta?

DeepSeek, китайський стартап у сфері штучного інтелекту, якому трохи більше року, викликав трепет і переляк у Кремнієвій долині після демонстрації проривних моделей штучного інтелекту, які пропонують продуктивність, порівнянну з найкращими світовими чат-ботами, за, здавалося б, невелику частину вартості.

Поява DeepSeek може стати контраргументом поширеній думці про те, що майбутнє штучного інтелекту потребуватиме дедалі більших потужностей та енергії для свого розвитку.

Наприкінці січня світові акції технологічних компаній впали в ціні, оскільки ажіотаж навколо інновацій DeepSeek наростав, а інвестори почали аналізувати наслідки для її американських конкурентів та їхніх постачальників апаратного забезпечення.

Що таке DeepSeek?

DeepSeek заснував у 2023 році Лян Веньфенг, керівник квантового хедж-фонду High-Flyer, що працює на основі штучного інтелекту. Компанія розробляє моделі штучного інтелекту з відкритим вихідним кодом, що означає, що спільнота розробників може перевіряти та вдосконалювати програмне забезпечення. Її мобільний додаток злетів на вершину чартів завантажень для iPhone у США після релізу на початку січня.

Додаток відрізняється від інших чат-ботів, таких як ChatGPT від OpenAI, тим, що він формулює свої міркування перед тим, як дати відповідь на запит. Компанія стверджує, що її версія R1 пропонує продуктивність на рівні з останньою версією OpenAI, і надала ліцензію для осіб, зацікавлених у розробці чат-ботів з використанням цієї технології, щоб побудувати їх на її основі.

Як DeepSeek R1 порівнюється з OpenAI або Meta AI?

Хоча компанія не надає повної інформації, витрати на навчання та розробку моделей DeepSeek, схоже, становлять лише частку від того, що потрібно для найкращих продуктів OpenAI або Meta Platforms Inc. Набагато краща ефективність моделі ставить під сумнів необхідність величезних капітальних витрат на придбання новітніх і найпотужніших прискорювачів ШІ від таких компаній, як Nvidia Corp. Це також посилює увагу до американських обмежень на експорт таких передових напівпровідників до Китаю, які мали на меті запобігти прориву, подібному до того, який, як видається, представляє DeepSeek.

DeepSeek стверджує, що R1 близький або кращий за конкуруючі моделі в декількох провідних тестах, таких як AIME 2024 для математичних задач, MMLU для загальних знань та AlpacaEval 2.0 для перевірки знань у формі запитань-відповідей. Він також посідає одне з перших місць у рейтингу лідерів афілійованого з Каліфорнійським університетом Берклі форуму під назвою Chatbot Arena.

Що викликає занепокоєння в США?

Вашингтон заборонив експорт високих технологій, таких як напівпровідники для графічних процесорів, до Китаю, намагаючись зупинити прогрес країни в галузі штучного інтелекту, що є ключовим напрямком у змаганні між США та Китаєм за технологічну перевагу. Але прогрес DeepSeek свідчить про те, що китайські інженери зі штучного інтелекту змогли обійти обмеження, зосередившись на підвищенні ефективності з обмеженими ресурсами. Хоча залишається незрозумілим, до якої кількості передового обладнання для навчання ШІ мала доступ DeepSeek, компанія продемонструвала достатньо, щоб припустити, що торговельні обмеження не були повністю ефективними у стримуванні прогресу Китаю.

Коли DeepSeek викликала глобальний інтерес?

За розробником штучного інтелекту пильно стежать з моменту випуску його найпершої моделі у 2023 році. Тоді, у листопаді, він представив світові свою модель міркувань DeepSeek R1, розроблену для імітації людського мислення. Ця модель лежить в основі мобільного додатку для чат-ботів, який разом із веб-інтерфейсом у січні здобув світову популярність як набагато дешевша альтернатива OpenAI, а інвестор Марк Андрессен назвав його «моментом Супутника ШІ».

Мобільний додаток DeepSeek був завантажений 1,6 мільйона разів до 25 січня і посів перше місце в магазинах додатків для iPhone в Австралії, Канаді, Китаї, Сінгапурі, США і Великобританії, згідно з даними трекера ринку App Figures.

Хто є засновником DeepSeek?

Лян народився в провінції Гуандун у 1985 році, отримав ступінь бакалавра та магістра в галузі електронної та інформаційної інженерії в Чжецзянському університеті. Він заснував DeepSeek зі статутним капіталом у 10 мільйонів юанів (1,4 мільйона доларів), згідно з базою даних компаній Tianyancha.

Вузьким місцем для подальшого прогресу є не збільшення фінансування, сказав Лян в інтерв'ю китайському виданню 36kr, а обмеження США на доступ до найкращих чіпів. Більшість його найкращих дослідників були нещодавніми випускниками найкращих китайських університетів, сказав він, наголосивши на необхідності для Китаю розвивати власну внутрішню екосистему, подібну до тієї, що побудована навколо Nvidia та її чіпів зі штучним інтелектом.

«Більше інвестицій не обов'язково веде до більшої кількості інновацій. В іншому випадку великі компанії перебрали б на себе всі інновації», - сказав Лян.

Яке місце займає DeepSeek в китайському ландшафті ШІ?

Китайські технологічні лідери, від Alibaba Group Holding Ltd. і Baidu Inc. до Tencent Holdings Ltd., вклали значні кошти і ресурси в гонку за придбання обладнання та клієнтів для своїх ШІ-підприємств. Поряд зі стартапом 01.AI Кай-Фу Лі, DeepSeek виділяється своїм підходом з відкритим вихідним кодом - розробленим для швидкого набору найбільшої кількості користувачів, перш ніж розробляти стратегії монетизації для цієї великої аудиторії.

Оскільки моделі DeepSeek є більш доступними, це вже зіграло свою роль у зниженні витрат для розробників ШІ в Китаї, де великі гравці вступили в цінову війну, в результаті якої за останні півтора року відбулися послідовні хвилі зниження цін.

Які наслідки це матиме для світового ринку ШІ?

Успіх DeepSeek може підштовхнути OpenAI та інших американських провайдерів до зниження цін, щоб зберегти своє лідерство. Це також ставить під сумнів величезні витрати таких компаній, як Meta і Microsoft Corp. - кожна з яких зобов'язалася інвестувати цього року 65 мільярдів доларів або більше, в основному в інфраструктуру ШІ - якщо більш ефективні моделі можуть конкурувати з набагато меншими витратами.

Це сколихнуло світові фондові ринки, оскільки інвестори розпродавали такі компанії, як Nvidia Corp. і ASML Holding NV, які отримали вигоду від бурхливого попиту на послуги ШІ. Акції китайських компаній, пов'язаних з DeepSeek, таких як Iflytek Co.

Розробники по всьому світу вже експериментують з програмним забезпеченням DeepSeek і прагнуть створювати інструменти на його основі. Це може прискорити впровадження передових моделей міркувань штучного інтелекту, але водночас може викликати додаткове занепокоєння щодо необхідності обмежень у їхньому використанні. Досягнення DeepSeek можуть прискорити регулювання, щоб контролювати розробку ШІ.

Які недоліки DeepSeek?

Як і всі інші китайські моделі ШІ, DeepSeek здійснює самоцензуру на теми, які в Китаї вважаються чутливими. Він відхиляє запити про протести на площі Тяньаньмень 1989 року або геополітично небезпечні питання, такі як можливість вторгнення Китаю на Тайвань. Під час тестів бот DeepSeek здатен давати детальні відповіді про таких політичних діячів, як прем'єр-міністр Індії Нарендра Моді, але відмовляється робити це про президента Китаю Сі Цзіньпіна.

Хмарна інфраструктура DeepSeek, ймовірно, зазнає випробувань через раптову популярність. Компанія ненадовго пережила серйозний збій у роботі 27 січня, і їй доведеться справлятися з ще більшим трафіком, оскільки нові користувачі та ті, що повертаються, засипають чат-бот запитами.