Index
Verlede naweek het ’n kunsmatige intelligensie genaamd DeepSeek, wat in China ontwikkel is, ’n opskudding in die wêreld van tegnologie veroorsaak en veroorsaak dat die aandeelwaarde van Amerikaanse reuse soos NVIDIA, Google, Meta en Microsoft met meer as 1 triljoen dollar gedaal het. Verstaan hoe dit werk en hoe dit die wêreld van tegnologie kan beïnvloed, maar spesifiek OpenAI se ChatGPT.
Wat is DeepSeek
DeepSeek is 'n Chinese kunsmatige intelligensie-maatskappy, geskep in 2023 deur Liang Wenfeng, Chinese entrepreneur en medestigter van kwantitatiewe verskansingsfonds High-Flyer. Hierdie fonds, bekend vir die gebruik van masjienleertegnieke in aandelebelegging, is ook die huidige befondser van die maatskappy se KI-navorsing.
Sedert 2023 trek die maatskappy wêreldwye aandag vanweë die vinnige ontwikkeling van sy taalmodelle of LLM's.
Laekoste-ontwikkeling
Die grootste voordeel van modelle is hul ontwikkelingskoste. In 'n onlangs vrygestelde artikel het die maatskappy verduidelik dat sy taalmodel DeepSeek-V3 gebruik word 2 duisend NVIDIA H800-kaarte, wat reeds relatief oud is, vir opleiding by 'n totale koste van 5,5 miljoen dollar.
Ter vergelyking, dit is net 'n fraksie van die koste om 'n model soos Meta se Llama 3.3 op te lei, wat vanjaar alleen na verwagting meer as 65% miljard dollar in sy verbetering. In hierdie vergelyking is DeekpSeek se koste uiteindelik selfs laer as die jaarlikse salaris van sommige bestuurders by Meta se maatskappy. Volgens ontleders bereik die kosteverminderings indrukwekkend 95%.
Hierdie prestasie bring 'n einde aan die paradigma dat hoë beleggings in datasentrum-infrastruktuur en elektrisiteit nodig sal wees om KI's op te lei, wat DeepSeek 'n KI maak wat nie net goedkoper is nie, maar ook meer ekologies volhoubaar is.
In teorie, in plaas daarvan om gespesialiseerde datasentrums te gebruik met baie duur GPU's wat ontwerp is vir hoë KI-vereistes, kan DeepSeek-modelle selfs op tuisrekenaars opgelei word, met tradisionele GPU's, wat beide verbasing en vrees veroorsaak in maatskappye soos NVIDIA, wat so aangewend is deur die onlangse stormloop om datasentrums te bou deur maatskappye wat 'n aandeel in hierdie mark soek.
Om hierdie rede, in wat bekend geword het as die “DeepSeek Panic Day” ou "DeepSeek paniekdag", In vrye vertaling is 27 Januarie gekenmerk deur miljarde-dollar-dalings in aandele op die NASDAQ, die aandelebeurs vir Amerikaanse hoëtegnologiemaatskappye, wat 3,5% van die totaal verhandel het. ChatGPT se mededinger het alles om suksesvol te wees.
DeepSeek-V3 en DeepSeek-R1
Die maatskappy se modelle is ook 'n voorbeeld van doeltreffendheid. DIE DeepSeek-V3, byvoorbeeld, spog met indrukwekkende prestasie oor veelvuldige maatstawwe, terwyl dit aansienlik minder hulpbronne benodig as mededingers soos Meta se Llama 3.3. En die DeepSeek-R1, wat in Januarie 2025 bekendgestel is, fokus op redeneringstake en daag OpenAI se o1-model met sy gevorderde kenmerke uit.
In wese leer beide Chinese kunsmatige intelligensie-modelopsies deur interaksie met hul omgewing en ontvang terugvoer oor hul optrede, soortgelyk aan hoe mense leer deur ervaring. Dit laat hulle toe om te ontwikkel meer gesofistikeerde redenasievaardighede en meer effektief by nuwe situasies aan te pas. Hierdie benadering is ook goedkoper as die "menslike toesigleer" wat deur mededingers gebruik word.
Nog 'n voordeel van hierdie Chinese KI is die hulpbronbesparing. In plaas daarvan om al die model se parameters te gebruik om 'n navraag te beantwoord, kies DeepSeek se modelle slegs 'n paar "spesifieke parameters" of "kundiges" vir die onderwerp. Hierdie selektiewe aktivering verminder berekeningskoste aansienlik en verhoog modeldoeltreffendheid.
Om dit op 'n eenvoudiger manier te verduidelik, sal wees soos om 'n groot span spesialiste beskikbaar te hê vir alle soorte take, maar slegs diegene te bel wat die beste geskik is om dit in 'n spesifieke geval uit te voer, wat doeltreffende gebruik en kundigheid in diens waarborg.
O DeepSeek-V3 ook in diens neem distillasie tegnieke, wat beteken dat dit kennis en vermoëns van groter modelle na kleiner, meer doeltreffende modelle oordra. Dit is soos 'n onderwyser wat hul kennis aan 'n student oordra, wat die student in staat stel om take met soortgelyke vaardigheid uit te voer, maar met minder ervaring of hulpbronne.
Die resultaat is 'n KI wat minder spasie en hulpbronne opneem, met hoë doeltreffendheid om op kleiner toestelle, soos slimfone en notaboeke, te werk. Om die toepassing vir slimfone en ook in die webweergawe beskikbaar te stel, het die maatskappy DeepSeek R1 as basis gebruik en dit in 'n toepassing omskep.
Oopbronmodel
Benewens die kombinasie van doeltreffendheid en prestasietegnieke, trek die modelle ook voordeel uit die samewerking wat inherent is aan ontwerpprojekte. oop kode (of oopbron, in Engels).
Hier, anders as 'n maatskappy soos OpenAI, wat privaat werk aan die ontwikkeling van KI's, het DeepSeek se modelle hul kode beskikbaar op die web, en kan verkry word, getoets en selfs reggestel word deur die globale gemeenskap van ontwikkelaars, wat ook reflekteer op meer deursigtigheid en vertroue in die resultate wat aangebied word.
Trouens, die maatskappy wil enigiemand aanmoedig om sy modelle te toets en stel lisensies vir sy professionele persone vry om dit vir ander maatskappye makliker te maak om dit te gebruik.
Die strategie versterk ook mededingendheid, lok talent en beklemtoon DeepSeek se leiersposisie, in 'n tipe gratis bemarking. Die maatskappy trek nie regstreeks hierby baat nie, maar sal voordeel trek uit die massa-aanneming van die model, deur middel van aanvullende dienste, soos tegniese ondersteuning of premium weergawes, te kan verdien, terwyl dit 'n samewerkende en innoverende ekosisteem bevorder.
Nommer 1 in toepassingswinkels
Nuuskierigheid oor DeepSeek was nie net onder uitvoerende hoofde en tegnologie-ingenieurs nie.
Die R20, wat op 1 Januarie bekendgestel is, DeepSeek-toepassing vir iPhones en Android-slimfone, blyk die suksesvolle pad van mededinger ChatGPT te volg. Dit is reeds die mees afgelaaide toepassing in die Amerikaanse Apple App Store en die tweede in Brasilië, net agter die OpenAI-mededinger.
Na Play Winkel, Android winkel, is die sukses ook onmiskenbaar: wêreldwyd is die Chinese kletsbot reeds meer as 'n miljoen keer geïnstalleer.
Sam Altman, stigter en huidige uitvoerende hoof van OpenAI, het oor DeepSeek se sukses gepraat. Hy het genoem dat hy 'n ogie hou oor wat Chinese KI kan doen en dat die eerste model indrukwekkend is. Sien die tweets en vertalings hieronder.
Die deepseek r1 is 'n indrukwekkende model, veral in verhouding tot wat hulle vir die prys kan lewer. Dit is duidelik dat ons baie beter modelle sal lewer en dit is ook wettig verfrissend om 'n nuwe mededinger te hê! Ons sal 'n paar vrystellings maak.
Maar die belangrikste is dat ons opgewonde is om voort te gaan om ons doelwitte uit te voer en glo dat meer rekenaar nou belangriker is as ooit om in ons missie te slaag.
Die wêreld gaan BAIE KI wil gebruik en sal regtig verras wees deur die volgende generasie modelle wat kom. Ons sien uit daarna om vir julle almal van AGI en verder te bring.
Sam Altman oor die sukses van Chinese AI DeepSeek.
Implikasies en politieke vooroordeel
Maar met sukses ontstaan daar ook vermoedens. Kenners bevraagteken of die totale aantal GPU's wat gebruik is om DeepSeek-modelle op te lei, ondergerapporteer is, met die bedoeling om die gebruik van NVIDIA-hardeware wat onlangs verbied is om in China te verkoop, weg te steek weens die handelsoorlog met die Verenigde State. Maar die maatskappy ontken hierdie feit en sê dat dit daarin geslaag het om sy model op te lei selfs met lae-krag GPU's.
Daar is ook tekens van sensuur in die instrument, in ooreenstemming met die voorskrifte of politieke vooroordeel van die Chinese Kommunistiese Party. Byvoorbeeld, wanneer gevra word oor die “1989 Tiananmen-plein-slagting in Beijing”, waar honderde aktiviste deur die Chinese weermag dood of beseer is, weier die KI om die vraag te beantwoord.
Dieselfde gebeur wanneer die KI gevra word oor die konflik tussen China en Taiwan. DeepSeek noem dat Taiwan deel is van China en dit “Die Chinese regering is verbind tot die een-China-beginsel en streef na die vreedsame hereniging van die land.
Wat kom volgende?
Die moontlikheid om sulke doeltreffende KI-modelle te hê, teen aansienlik laer infrastruktuurkoste, laat beleggers heroorweeg om hul aandele te koop of selfs te verkoop in tegnologiemaatskappye wat op hierdie sektor gefokus is.
Een van die legendes van waagkapitaal Amerikaans, Marc Andreessen, sien die ontstaan van DeepSeek as die "KI se Spoetnik-oomblik", met verwysing na die historiese eerste satellietlansering in 'n wentelbaan in 1957, wat die oomblik was toe die Sowjetunie die Verenigde State tydelik verbygesteek het op die gebied van ruimtetegnologie.
Die feit is dat Amerikaanse meerderwaardigheid op die gebied van kunsmatige intelligensie in twyfel getrek is. En om hierdie rede is dit waarskynlik dat vergelding van die Amerikaanse regering, miskien deur meer sanksies op die kommersialisering van Amerikaanse tegnologieë en skyfies aan Chinese maatskappye, aangekondig sal word.
In reaksie op die saak het die nuwe president Donald Trump die opkoms van die Chinese maatskappy DeepSeek "'n wekroep" vir die Amerikaanse tegnologiebedryf genoem, 'n teken dat 'n reaksie binnekort behoort te kom.
Ons sal die onderwerp noukeurig volg. Vertel ons intussen kommentaar: Dink jy DeepSeek kan die ChatGPT-leierskap?
Sien die video
Kyk ook
Met inligting: Yahoo l Grondd Nuus l Info Geld l Forbes (1 e 2)
Ontdek meer oor Showmetech
Teken in om ons jongste nuus per e-pos te ontvang.