Китайският DeepSeek изненада ИТ индустрията и разтърси сектора на центровете за данни

19.02.2025 852 0

Китай за пореден път изненада ИТ индустрията с нова компания. Но този път това не е ново приложение за социални мрежи. А AI стартъп. Компанията DeepSeek се появи на сцената неочаквано и вече предизвика много емоции в индустрията.

Повечето от тях бяха в свързани с политика, потребителско изживяване и цялостна геополитика. Но DeepSeek акцентира на потенциална голяма слабост в настоящите най-добри AI алгоритми и техните начини за работа и потребление на ресурси. DeepSeek вече има потенциала да промени дори подхода на индустрията към центровете за данни, като по този начин предизвиква голяма промяна в текущите инвестиции и цели. Може ли това наистина да се случи? Ако твърденията на DeepSeek в крайна сметка се оправдаят и издържат в по-дълъг период от време – тогава да, можем да очакваме съществени промени в начина, по който AI се разработва и внедрява.

За да видим какво може да се случи, нека да направим едно пътешествие, за да проучим какво е DeepSeek, защо предизвика всички тези емоции и може ли наистина да е тази голяма промяна в целия AI сектор. И разбира се – как всичко това ще се отрази на центровете за данни.

Какво е DeepSeek?

DeepSeek е китайски AI стартъп. През януари 2025 г. той реализира първия си публичен AI модел – R1. Компанията заяви, че R1 съперничи и дори побеждава ChatGPT на OpenAI в повечето си възможности. Не само това – той е в състояние да постигне тези резултати със значително по-малко ресурси за обучение и цялостна изчислителна мощност. Консумирането на огромни ресурси е един от основните проблеми с повечето модели на AI – и това е основната причина за огромния бум в търсенето на центрове за данни през последните две или три години.

R1 на DeepSeek обаче разби концепцията, че AI е ресурсоемък. Алгоритъмът е насочен към o1 на OpenAI – техният настоящ най-добър модел за AI разсъждение. Но докато OpenAI казва, че е похарчила „над 100 милиона долара“, за да обучи своя модел GPT-4 (по-ранен и не толкова усъвършенстван модел в сравнение с o1), R1 се нуждаеше само от 6 милиона долара, за да бъде обучен до нивото на o1. Такава огромна разлика в разходите предизвика огромно „земетресение“ в индустрията на AI. Дали западният ИТ свят е бил на грешен път през цялото време? Започнал ли да разработва AI по начин, който не е устойчив? Или DeepSeek е използвал някакъв трик, за да постигне тези резултати?

Китайската компания като прост отговор: За разлика от o1 и други затворени модели, R1 е с напълно отворен код. Базиран е на някои от AI моделите на Meta, които са смесени с други методи и са прецизно настроени с GRPO (оптимизация на груповата относителна политика). Въпросът е какви данни е използвал? OpenAI първоначално твърдеше, че DeepSeek е „откраднал“ техните данни, които са използвали за обучение на своите модели. Поддръжниците на DeepSeek отвърнаха, че R1 е обучен с публично достъпни данни и OpenAI не трябва да държи други компании отговорни за това какви данни използват, като се има предвид собствената им противоречива история.

Последствията от DeepSeek

Спорът за това какви данни се използват беше само малка част от огромните последици, които DeepSeek имаше върху ИТ индустрията. След като R1 стана достъпен под формата на чатбот чрез приложение за потребители и фирми, той се превърна в успех сякаш за една нощ. Приложението на DeepSeek се издигна до върха на класацията за безплатни приложения на Apple App Store и изпревари ChatGPT. То събра милиони изтегляния.

След като новината, че моделът R1 е толкова евтин за обучение и внедряване, достигна основните медии, това предизвика огромен спад на фондовия пазар за много големи западни публично търгувани ИТ компании. Nvidia понесе най-тежкия удар, губейки около 600 милиарда долара от пазарната си стойност – най-големият единичен спад, регистриран някога. Това свали компанията от върха като най-скъпата организация в света до третото място след Apple и Microsoft. Дори президентът на САЩ Доналд Тръмп коментира събитието, като каза, че DeepSeek е „събуждане“ за американските компании.

Защо Nvidia пое главния удар? Защото се издигна до върха благодарение на своите AI процесори, които се превърнаха в еталон в индустрията и са най-желаният хардуер за операторите на AI центрове за данни. А DeepSeek не може да използва последното поколение от тези чипове поради санкциите на САЩ срещу Китай. В резултат на това китайският стартъп реши да използва какъвто и да е хардуер (беше обвинен в заобикаляне на санкциите чрез складиране на чипове H100 на Nvidia, въпреки че това не може да бъде доказано). Вместо това компанията се фокусира върху оптимизирането на своя софтуер и алгоритми и си партнира с местни китайски фирми за по-нататъшно оптимизиране на R1.

В резултат на това DeepSeek успя да разтърси най-мощните компании в света с минимална част в сравнение с техните бюджети. Дори след спада на фондовия пазар, стойността на Nvidia все още е огромните 2,9 трилиона долара. Основният конкурент на DeepSeek, OpenAI, се оценява на около 157 милиарда долара и има над 13 милиарда долара инвестиции само от Microsoft. За сравнение, според малкото публична информация, DeepSeek е събрал общо под 1 милиард долара, а прогнозната му оценка е под 10 милиарда долара.

Трудно е да се знаят точните цифри, тъй като в момента DeepSeek е частна компания. Основана е през декември 2023 г. от Лянг Уенфенг, който има дипломи по електронно информационно инженерство и компютърни науки, но също така има опит във финансите и дори е главен изпълнителен директор на хедж фонд.

Естествено, сега той е много търсен от медиите. Запитан защо DeepSeek изглежда е изненадал Силициевата долина, Лианг казва, цитиран от BBC: „Изненадата им произтича от това, че виждат китайска компания да се присъедини към играта им като новатор, а не просто последовател – а са свикнали повечето китайски фирми да са такива.“

Можем ли да се доверим на DeepSeek?

Увереността на Лианг не беше добре приета на Запад. Няколко страни обявиха ограничения за използването на алгоритмите на компанията. Австралия ги забрани на правителствени устройства и системи, заявявайки, че представлява риск за националната сигурност. Италия ги блокира изцяло и дори нареди на компанията да спре да обработва личната информация на своите граждани. САЩ също проучват ограничения.

След това Cisco публикува проучване, в което се твърди, че R1 не е преминал успешно тестовете за безопасност. Изследването е направено съвместно с Университета на Пенсилвания и е проверено дали алгоритъмът на DeepSeek може да се справи срещу опити за злоупотреба, вредни команди, дезинформация, киберпрестъпления и т.н. Изследователите казват, че DeepSeek е отговорил на всички техни бързи атаки и не е отказал никакви заявки. За сравнение, o1 на OpenAI отговоря само на 26% от вредните подкани, докато Claude 3.5 Sonnet от Anthropic отбелязва 36%. Платформата за сигурност Enkrypt AI също твърди, че DeepSeek е средно 11 пъти по-вероятно да генерира вредни резултати в сравнение с o1.

Въпреки това Amazon, Nvidia и Microsoft обявиха поддръжка за алгоритмите на DeepSeek на техния хардуер и инфраструктура.

Въздействието върху центровете за данни

Според Newmark до 2030 г. индустрията на центровете за данни ще се удвои по размер, за да се отговори на възхода на AI. Но тази оценка не взима предвид разрушителна промяна като DeepSeek. Независимо дали е перфектен алгоритъм или не, R1 показа, че в света на центровете за данни може да се постигне много повече с много по-малко.

Инвестициите на R1 изглеждат скромни в сравнение с това, което се случва на Запад. Според CNBC OpenAI преговаря за нов инвестиционен кръг от около 40 милиарда долара. Операторите на центрове за данни също бързат да получат инвестиции от стотици милиони до едноцифрени милиарди. А Apollo Global Management прогнозира, че за да се покрие цялото търсене на центрове за данни от сега до 2030 г., ще са необходими допълнителни $2 трилиона инвестиции.

Това трябва да е страхотна новина за инвеститорите и компаниите, тъй като означава огромни възможности. Но DeepSeek накара индустрията да направи крачка назад и да преосмисли своя подход. Да, дори ако R1 наистина е толкова внимателен с ресурсите, той пак ще се нуждае от огромни центрове за данни. Особено за да покрие цялото огромно търсене, очаквано за AI – от потребители, фирми, организации, институции по целия свят.

„Пазарът все още проучва въздействието на новите AI модели, но това може да е здравословна корекция. Дори и да окаже влияние върху търсенето на центрове за данни за AI, все още се очаква растеж, но може да е малко по-нисък растеж“, казва Тимо Буис, старши директор по финансиране на проекти и инфраструктура в ABN Amro Bank пред The Straits Times.

Други също гледат от положителната страна. „Ако информациите за DeepSeek са истина, това само ще тласне напред иновациите в AI. Иновациите в AI не намаляват търсенето – те го подхранват. Тъй като AI става по-достъпен и рентабилен, индустрията ще види непрекъсната експанзия, поддържайки нуждата от високопроизводителна инфраструктура и центрове за данни“, казва Мич Лензи, вицепрезидент по продажбите и операциите в Baxtel, пред DataCenterKnowledge.

Една възможна възможност е, че „по-леките“ AI модели ще отворят вратата за модулни и Edge центрове за данни. Сега те се разглеждат като помощник на основните съоръжения, но ако AI моделите могат да работят с пълен капацитет на по-малки центрове за данни и с по-малко ресурси, това ще направи много по-лесно създаването на Edge центрове и разполагането им по-близо до източника на данни – идеално за изискванията за ниско времезакъснение на AI.

Така че, макар първоначално да изглежда, че DeepSeek нарушава бума на центровете за данни, всъщност може да бъде от полза за него. Компанията може да вдъхнови индустрията да коригира курса си и да използва още по-добре инвестициите, като се фокусира върху действителни решения, вместо просто да следва подхода „повече е повече“ и да се надява на най-доброто, като същевременно рискува в крайна сметка да се окаже с огромни съоръжения, които не се използват пълноценно.

Китайският DeepSeek изненада ИТ индустрията и разтърси сектора на центровете за данни

Какво е DeepSeek?

Последствията от DeepSeek

Можем ли да се доверим на DeepSeek?

Въздействието върху центровете за данни

Вашият коментар

Content

Последни публикации

Какво е DeepSeek?

Последствията от DeepSeek

Можем ли да се доверим на DeepSeek?

Въздействието върху центровете за данни

Вашият коментар Отказ

Content

Последни публикации

Вашият коментар