DeepSeek: Sú byltingarkennda sem gjörbyltir gervigreindarlandslaginu

AIPU WATON HÓPUR

Inngangur

Áframhaldandi kvíði meðal samkeppnisaðila stórra fyrirtækja, skýjaþjónustuaðila sem keppa um markaðshlutdeild og duglegra örgjörvaframleiðenda — DeepSeek-áhrifin halda áfram.

Nú þegar vorhátíðin er að ljúka er spennan í kringum DeepSeek enn mikil. Nýleg hátíð undirstrikaði mikla samkeppni innan tæknigeirans og margir ræddu og greindu þennan „steinbít“. Sílikondalurinn er að upplifa fordæmalausa kreppu: stuðningsmenn opins hugbúnaðar eru að láta skoðanir sínar í ljós á ný og jafnvel OpenAI er að endurmeta hvort lokaður hugbúnaður þeirra hafi verið besti kosturinn. Nýja viðmiðið um lægri útreikningskostnað hefur hrundið af stað keðjuverkun meðal örgjörvarisa eins og Nvidia, sem hefur leitt til mettap á markaðsvirði á einum degi í sögu bandaríska hlutabréfamarkaðarins, á meðan ríkisstofnanir eru að rannsaka hvort örgjörvarnir sem DeepSeek notar uppfylli kröfur. Þrátt fyrir misjafnar umsagnir um DeepSeek erlendis er það að upplifa ótrúlegan vöxt innanlands. Eftir að R1 líkanið var sett á markað hefur umferð á tengda appinu aukist, sem bendir til þess að vöxtur í forritageiranum muni knýja vistkerfi gervigreindar áfram. Jákvæða þátturinn er að DeepSeek mun víkka möguleika á forritum, sem bendir til þess að það verði ekki eins dýrt að reiða sig á ChatGPT í framtíðinni. Þessi breyting hefur endurspeglast í nýlegum starfsemi OpenAI, þar á meðal því að rökfræðilíkan sem kallast o3-mini var veitt ókeypis notendum sem svar við DeepSeek R1, sem og síðari uppfærslum sem gerðu hugmyndakeðjuna á bak við o3-mini aðgengilega. Margir erlendir notendur lýstu yfir þakklæti til DeepSeek fyrir þessa þróun, þó að þessi hugmyndakeðja sé aðeins samantekt.

Það er bjartsýnt að DeepSeek sé að sameina innlenda aðila. Með áherslu á að lækka þjálfunarkostnað eru ýmsir framleiðendur örgjörva, millistig skýjaþjónustuaðilar og fjölmörg sprotafyrirtæki að taka virkan þátt í vistkerfinu og auka kostnaðarhagkvæmni við notkun DeepSeek líkansins. Samkvæmt greinum DeepSeek þarf aðeins 2,788 milljónir H800 GPU klukkustunda til að þjálfa V3 líkanið í heild sinni og þjálfunarferlið er mjög stöðugt. MoE (Mixture of Experts) arkitektúrinn er mikilvægur til að tífalda kostnað við forþjálfun samanborið við Llama 3 með 405 milljarða breytur. Eins og er er V3 fyrsta opinberlega viðurkennda líkanið sem sýnir fram á svona mikla dreifni í MoE. Að auki virkar MLA (Multi Layer Attention) samverkandi, sérstaklega í rökhugsunarþáttum. „Því dreifðari sem MoE er, því stærri er stærð hópsins sem þarf við rökhugsun til að nýta reikniorku til fulls, þar sem stærð KVCache er lykiltakmarkandi þáttur; MLA dregur verulega úr stærð KVCache,“ sagði rannsakandi frá Chuanjing Technology í greiningu fyrir AI Technology Review. Í heildina litið liggur árangur DeepSeek í samsetningu ýmissa tækni, ekki bara einnar. Sérfræðingar í greininni lofa verkfræðigetu DeepSeek teymisins og taka fram framúrskarandi þjálfun þeirra og hagræðingu notenda, sem ná byltingarkenndum árangri með því að fínpússa hvert smáatriði. Opinn hugbúnaður DeepSeek knýr enn frekar áfram heildarþróun stórra líkana og búist er við að ef svipuð líkön verða stækkuð í myndir, myndbönd og fleira, muni það örva verulega eftirspurn í allri greininni.

Tækifæri fyrir rökfærsluþjónustu þriðja aðila

Gögn benda til þess að frá útgáfu DeepSeek hafi það náð 22,15 milljónum virkra notenda daglega (DAU) á aðeins 21 degi, sem gerir það að 41,6% af notendagrunni ChatGPT og yfir 16,95 milljónum virkra notenda Doubao daglega. Þetta er því ört vaxandi forrit í heiminum og er efst í Apple App Store í 157 löndum/svæðum. Hins vegar, á meðan notendur flykktust að í stórum stíl, hafa tölvuþrjótar ráðist óþreytandi á DeepSeek forritið og valdið miklu álagi á netþjóna þess. Sérfræðingar í greininni telja að þetta sé að hluta til vegna þess að DeepSeek notar kort til þjálfunar en hefur ekki nægilega reikniafl til rökhugsunar. Heimildarmaður í greininni sagði við AI Technology Review: „Tíð vandamál með netþjóna er auðvelt að leysa með því að innheimta gjöld eða fjármagna kaup á fleiri vélum; að lokum fer það eftir ákvörðunum DeepSeek.“ Þetta er málamiðlun í áherslu á tækni á móti vöruvæðingu. DeepSeek hefur að mestu leyti treyst á skammtafræðilega magnvæðingu til sjálfbærni, þar sem það hefur fengið litla utanaðkomandi fjármögnun, sem leiðir til tiltölulega lágs sjóðstreymisþrýstings og hreinna tækniumhverfis. Í ljósi fyrrnefndra vandamála hvetja sumir notendur DeepSeek á samfélagsmiðlum til að hækka notkunarmörk eða kynna greidda eiginleika til að auka þægindi notenda. Þar að auki hafa forritarar byrjað að nota opinber forritaskil eða forritaskil þriðja aðila til að hámarka notkun. Hins vegar tilkynnti opinn vettvangur DeepSeek nýlega: „Núverandi netþjónsauðlindir eru af skornum skammti og hleðslur á forritaskilþjónustu hafa verið stöðvaðar.“

 

Þetta opnar án efa fleiri tækifæri fyrir þriðja aðila í greininni um gervigreindarinnviði. Nýlega hafa fjölmargir innlendir og erlendir skýjarisar hleypt af stokkunum forritunarviðmótum fyrir líkanið DeepSeek - erlendu risarnir Microsoft og Amazon voru meðal þeirra fyrstu til að ganga til liðs við í lok janúar. Leiðtoginn á innlendum markaði, Huawei Cloud, tók fyrsta skrefið og gaf út rökhugsunarþjónustur DeepSeek R1 og V3 í samstarfi við Silicon-fyrirtækið Flow þann 1. febrúar. Skýrslur frá AI Technology Review benda til þess að notendur hafi fjölgað í þjónustu Flow, sem er í raun byggt á Silicon, og að það hafi í raun „hrundið“ kerfinu. Þrjú stóru tæknifyrirtækin - BAT (Baidu, Alibaba, Tencent) og ByteDance - gáfu einnig út lággjaldatilboð í takmarkaðan tíma frá og með 3. febrúar, sem minnir á verðstríð skýjarisauðlinda í fyrra sem kveikt var í þegar DeepSeek kynnti V2 líkanið, þar sem DeepSeek fór að vera kallað „verðslátrarinn“. Æðislegar aðgerðir skýjaframleiðenda endurspegla fyrri sterk tengsl milli Microsoft Azure og OpenAI, þar sem Microsoft fjárfesti umtalsvert 1 milljarð Bandaríkjadala í OpenAI árið 2019 og naut góðs af því eftir að ChatGPT var sett á laggirnar árið 2023. Þetta nána samband fór þó að slitna eftir að Meta gerði Llama að opnum hugbúnaði, sem gerði öðrum framleiðendum utan Microsoft Azure vistkerfisins kleift að keppa við stóru gerðirnar sínar. Í þessu tilviki hefur DeepSeek ekki aðeins farið fram úr ChatGPT hvað varðar vöruhita heldur hefur það einnig kynnt til sögunnar opnar hugbúnaðargerðir eftir útgáfu o1, svipað og spennan í kringum endurvakningu GPT-3 hjá Llama.

 

Í raun eru skýjaþjónustuaðilar einnig að staðsetja sig sem umferðargátt fyrir gervigreindarforrit, sem þýðir að aukin tengsl við forritara þýða forskot. Skýrslur benda til þess að yfir 15.000 viðskiptavinir Baidu Smart Cloud hafi notað DeepSeek líkanið í gegnum Qianfan vettvanginn á útgáfudegi líkansins. Að auki bjóða nokkur smærri fyrirtæki upp á lausnir, þar á meðal Silicon-based Flow, Luchen Technology, Chuanjing Technology og ýmsar AI Infra-þjónustuaðilar sem hafa hafið stuðning við DeepSeek líkön. AI Technology Review hefur komist að því að núverandi hagræðingarmöguleikar fyrir staðbundnar innleiðingar DeepSeek eru aðallega til staðar á tveimur sviðum: annað er að hagræða fyrir dreifða eiginleika MoE líkansins með því að nota blandaða rökhugsunaraðferð til að setja upp 671 milljarða breyta MoE líkanið á staðnum meðan nýtt er blönduð GPU/CPU ályktun. Að auki er hagræðing á MLA mikilvæg. Hins vegar standa tvær gerðir DeepSeek enn frammi fyrir nokkrum áskorunum í hagræðingu innleiðingar. „Vegna stærðar líkansins og fjölmargra breytna er hagræðing sannarlega flókin, sérstaklega fyrir staðbundnar uppsetningar þar sem það verður krefjandi að ná sem bestum jafnvægi milli afkasta og kostnaðar,“ sagði rannsakandi frá Chuanjing Technology. Stærsta hindrunin felst í því að sigrast á takmörkunum á minnisgetu. „Við notum fjölbreytta samvinnuaðferð til að nýta örgjörva og aðrar reikniauðlindir til fulls, og setjum aðeins þá hluta af dreifðu MoE fylkinu sem ekki er sameiginlegur á örgjörva/DRAM til vinnslu með því að nota afkastamikla örgjörvastýri, en þéttari hlutar eru áfram á skjákortinu,“ útskýrði hann enn fremur. Skýrslur benda til þess að opinn hugbúnaðarrammi Chuanjing, KTransformers, sprauti aðallega ýmsum aðferðum og stýrum inn í upprunalegu Transformers útfærsluna í gegnum sniðmát, sem eykur verulega ályktunarhraða með aðferðum eins og CUDAGraph. DeepSeek hefur skapað tækifæri fyrir þessi sprotafyrirtæki, þar sem vaxtarávinningur er að koma í ljós; mörg fyrirtæki hafa greint frá umtalsverðum vexti viðskiptavina eftir að hafa sett DeepSeek API á markað og fengið fyrirspurnir frá fyrri viðskiptavinum sem leita að hagræðingu. Heimildir í greininni hafa bent á: „Áður fyrr voru nokkuð rótgrónir viðskiptavinahópar oft bundnir við stöðluð þjónustu stærri fyrirtækja, fastbundnir af kostnaðarkostum sínum vegna stærðar. Hins vegar, eftir að við lauk innleiðingu DeepSeek-R1/V3 fyrir vorhátíðina, fengum við skyndilega beiðnir um samstarf frá nokkrum þekktum viðskiptavinum, og jafnvel áður óvirkir viðskiptavinir höfðu samband til að kynna DeepSeek þjónustu okkar.“ Eins og er virðist DeepSeek vera að gera afköst líkanaályktana sífellt mikilvægari, og með víðtækari notkun stórra líkana mun þetta halda áfram að hafa veruleg áhrif á þróun í gervigreindarinnviðageiranum. Ef hægt væri að innleiða líkan á DeepSeek-stigi á staðnum á lágum kostnaði, myndi það hjálpa stjórnvöldum og fyrirtækjum til muna við að umbreyta stafrænni þróun. Hins vegar eru enn áskoranir, þar sem sumir viðskiptavinir kunna að hafa miklar væntingar varðandi getu stórra líkana, sem gerir það ljósara að það verður mikilvægt að jafna afköst og kostnað í hagnýtri innleiðingu. 

Til að meta hvort DeepSeek sé betra en ChatGPT er nauðsynlegt að skilja helstu muninn á þeim, styrkleika og notkunartilvik. Hér er ítarlegur samanburður:

Eiginleiki/þáttur Djúpleit SpjallGPT
Eignarhald Þróað af kínversku fyrirtæki Þróað af OpenAI
Upprunalíkan Opinn hugbúnaður Eiginfjárfestir
Kostnaður Ókeypis í notkun; ódýrari aðgangsmöguleikar að API Áskriftar- eða greiðsluverð fyrir hverja notkun
Sérstilling Mjög sérsniðin, sem gerir notendum kleift að fínstilla og byggja á því Takmörkuð sérstilling í boði
Frammistaða í tilteknum verkefnum Skýrir sig á ákveðnum sviðum eins og gagnagreiningu og upplýsingaöflun Fjölhæfur með góða frammistöðu í skapandi skrifum og samræðuverkefnum
Tungumálastuðningur Mikil áhersla á kínverska tungumálið og menninguna Víðtækur stuðningur við tungumál en miðlægur fyrir Bandaríkin
Kostnaður við þjálfun Lægri þjálfunarkostnaður, fínstilltur fyrir skilvirkni Hærri þjálfunarkostnaður, sem krefst mikilla reiknivélaauðlinda
Breytileiki í svörun Getur boðið upp á mismunandi svör, hugsanlega undir áhrifum frá landfræðilegu og stjórnmálalegu samhengi Samræmd svör byggð á þjálfunargögnum
Markhópur Miðað við forritara og vísindamenn sem vilja sveigjanleika Miðað við almenna notendur sem leita að samræðumöguleikum
Notkunartilvik Skilvirkari fyrir kóðagerð og hraðvirkari verkefni Tilvalið til að búa til texta, svara fyrirspurnum og taka þátt í samræðum

Gagnrýnin sýn á „að raska Nvidia“

Auk Huawei eru nokkrir innlendir örgjörvaframleiðendur eins og Moore Threads, Muxi, Biran Technology og Tianxu Zhixin einnig að aðlagast tveimur gerðum DeepSeek. Örgjörvaframleiðandi sagði við AI Technology Review: „Uppbygging DeepSeek sýnir nýsköpun, en það er samt sem áður LLM. Aðlögun okkar að DeepSeek beinist fyrst og fremst að rökhugsunarforritum, sem gerir tæknilega útfærslu frekar einfalda og hraða.“ Hins vegar krefst MoE-aðferðin meiri krafna hvað varðar geymslu og dreifingu, ásamt því að tryggja samhæfni við uppsetningu með innlendum örgjörvum, sem skapar fjölmargar verkfræðilegar áskoranir sem þarf að leysa við aðlögun. „Eins og er er innlend reikniafl ekki jafngóð Nvidia í notagildi og stöðugleika, sem krefst þátttöku upprunalegrar verksmiðju fyrir uppsetningu hugbúnaðarumhverfis, bilanaleit og grunnframmistöðuhagræðingu,“ sagði sérfræðingur í greininni út frá hagnýtri reynslu. Á sama tíma: „Vegna stórs breytumála DeepSeek R1 krefst innlends reikniafls fleiri hnúta fyrir samsíða tengingu. Að auki eru innlendar vélbúnaðarforskriftir enn nokkuð á eftir; til dæmis getur Huawei 910B ekki stutt FP8-ályktunina sem DeepSeek kynnti til sögunnar.“ Einn af hápunktum DeepSeek V3 líkansins er kynning á FP8 blandaðri nákvæmnisþjálfunarramma, sem hefur verið staðfestur á áhrifaríkan hátt á afar stóru líkani, sem markar verulegan árangur. Áður hafa stórir aðilar eins og Microsoft og Nvidia lagt til svipaða vinnu, en efasemdir eru enn til staðar innan greinarinnar varðandi hagkvæmni. Það er skilið að samanborið við INT8 er helsti kostur FP8 sá að magnbundin eftirþjálfun getur náð nánast taplausri nákvæmni og aukið ályktunarhraða verulega. Í samanburði við FP16 getur FP8 náð allt að tvöfaldri hröðun á H20 frá Nvidia og yfir 1,5 sinnum hröðun á H100. Athyglisvert er að þar sem umræður um þróun innlendrar reikniafls ásamt innlendum líkönum eru að aukast, eru vangaveltur um hvort Nvidia gæti raskast og hvort hægt sé að komast framhjá CUDA-skurðinum að verða sífellt algengari. Ein óumdeilanleg staðreynd er sú að DeepSeek hefur vissulega valdið verulegri lækkun á markaðsvirði Nvidia, en þessi breyting vekur upp spurningar varðandi heiðarleika hágæða reikniafls Nvidia. Áður viðurkenndar frásagnir varðandi fjármagnsdrifin reikniaðferð eru nú umdeildar, en samt er erfitt fyrir Nvidia að vera að fullu skipt út í þjálfunartilvikum. Greining á djúpri notkun DeepSeek á CUDA sýnir að sveigjanleiki - eins og að nota SM til samskipta eða stjórna netkortum beint - er ekki framkvæmanlegur fyrir venjulegar skjákort. Sjónarmið atvinnugreinarinnar leggja áherslu á að skurður Nvidia nær yfir allt CUDA vistkerfið frekar en bara CUDA sjálft, og PTX (Parallel Thread Execution) skipanirnar sem DeepSeek notar eru enn hluti af CUDA vistkerfinu. „Til skamms tíma er ekki hægt að komast framhjá reikniorku Nvidia - þetta er sérstaklega ljóst í þjálfun; hins vegar verður tiltölulega auðveldara að nota innlend kort til rökhugsunar, svo framfarir verða líklega hraðari. Aðlögun innlendra korta beinist fyrst og fremst að ályktunum; engum hefur enn tekist að þjálfa líkan af afköstum DeepSeek á innlendum kortum í stórum stíl,“ sagði greinandi atvinnugreinarinnar við AI Technology Review. Í heildina litið, frá ályktunarsjónarmiði, eru aðstæðurnar hvetjandi fyrir innlendar stórar flísar. Tækifærin fyrir innlenda örgjörvaframleiðendur á sviði ályktunar eru augljósari vegna of mikilla krafna um þjálfun, sem hindra aðgang. Sérfræðingar halda því fram að það dugi einfaldlega að nýta innlend ályktunarkort; ef nauðsyn krefur er mögulegt að eignast viðbótarvél, en þjálfunarlíkön fela í sér einstakar áskoranir - að stjórna auknum fjölda véla getur orðið þungt og hærri villutíðni getur haft neikvæð áhrif á þjálfunarniðurstöður. Þjálfun hefur einnig sérstakar kröfur um klasastærð, en kröfurnar um klasa fyrir ályktanir eru ekki eins strangar, sem dregur úr kröfum GPU. Eins og er er afköst eins H20 korts Nvidia ekki betri en Huawei eða Cambrian; styrkur þess liggur í klasamyndun. Miðað við heildaráhrif á reikniorkumarkaðinn sagði stofnandi Luchen Technology, You Yang, í viðtali við AI Technology Review: "DeepSeek gæti tímabundið grafið undan stofnun og leigu á mjög stórum þjálfunarreikniklösum. Til lengri tíma litið, með því að draga verulega úr kostnaði sem tengist stórum líkanaþjálfun, rökhugsun og forritum, er líklegt að eftirspurn á markaði aukist. Síðari endurtekningar á gervigreind sem byggja á þessu munu því stöðugt knýja áfram viðvarandi eftirspurn á reikniorkumarkaðnum." Að auki er „aukin eftirspurn DeepSeek eftir rökhugsunar- og fínstillingarþjónustu betur samhæfð innlendu reikniumhverfi, þar sem staðbundin geta er tiltölulega veik, sem hjálpar til við að draga úr sóun frá óvirkum auðlindum eftir stofnun klasa; þetta skapar raunhæf tækifæri fyrir framleiðendur á mismunandi stigum innlends reiknivistkerfis.“ Luchen Technology hefur unnið með Huawei Cloud að því að kynna DeepSeek R1 seríuna af rökhugsunar-API og skýmyndgreiningarþjónustu sem byggir á innlendri reikniorku. You Yang lýsti yfir bjartsýni á framtíðina: „DeepSeek vekur traust á innlendum lausnum og hvetur til meiri áhuga og fjárfestingar í innlendri reiknigetu í framtíðinni.“

微信图片_20240614024031.jpg1

Niðurstaða

Hvort DeepSeek sé „betra“ en ChatGPT fer eftir þörfum og markmiðum notandans. Fyrir verkefni sem krefjast sveigjanleika, lágs kostnaðar og sérstillingar gæti DeepSeek verið betra. Fyrir skapandi skrif, almennar fyrirspurnir og notendavænt samræðuviðmót gæti ChatGPT verið leiðandi. Hvert tól þjónar mismunandi tilgangi, þannig að valið fer mjög eftir samhenginu sem það er notað í.

Finndu ELV kapallausn

Stjórnkaplar

Fyrir BMS, BUS, iðnaðar, tækjabúnaðarsnúru.

Skipulagt kapalkerfi

Net og gögn, ljósleiðari, tengisnúra, einingar, framhlið

Yfirlit yfir sýningar og viðburði 2024

16.-18. apríl 2024, Orka í Mið-Austurlöndum í Dúbaí

16.-18. apríl 2024, Securika í Moskvu

9. maí 2024 KYNNINGARVIÐBURÐUR NÝJRA VÖRU OG TÆKNI í Sjanghæ

22.-25. október 2024, ÖRYGGISFÉLAG KÍNA í Peking

19.-20. nóvember 2024, CONNECTED WORLD KSA


Birtingartími: 10. febrúar 2025