Hva er DeepSeek AI? Er det trygt? Her er alt du trenger å vite


Er den kinesiske oppstartens modeller spennende, forstyrrende eller truende? Det avhenger av ditt synspunkt. Her er hva ekspertene mener du bør vite.

Bare uker inn i sin nyvunne berømmelse, beveger den kinesiske AI-oppstarten DeepSeek seg i rasende fart, velter konkurrenter og utløser aksevippende samtaler om fordelene med åpen kildekode-programvare.

Imidlertid har det dukket opp mange sikkerhetsbekymringer om selskapet, noe som har fått private og offentlige organisasjoner til å forby bruken av DeepSeek. Her er det du trenger å vite.

Hva er DeepSeek?

Grunnlagt av Liang Wenfeng i mai 2023 (og dermed ikke engang to år gammel), har den kinesiske oppstarten utfordret etablerte AI-selskaper med sin åpen kildekode-tilnærming. IfølgeForbes, DeepSeeks fordel kan ligge i det faktum at det kun er finansiert av High-Flyer, et hedgefond som også drives av Wenfeng, som gir selskapet en finansieringsmodell som støtter rask vekst og forskning.

Oppstartenskapte bølger i januarda den ga ut fullversjonen av R1, dens åpen kildekode-resonneringsmodell som kan overgåOpenAIs o1. Kort tid etter toppet App Store-nedlastinger av DeepSeeks AI-assistent - som kjører V3, en modell DeepSeekutgitti desember - ChatGPT, tidligere den mest nedlastede gratisappen. DeepSeek R1 klatret til og med til tredjeplassen totalt på HuggingFaces Chatbot Arena, og kjempet med flere Gemini-modeller ogChatGPT-4o; samtidig ga DeepSeek ut en lovende newimage-modell.

Selskapets evne til å lage vellykkede modeller ved strategisk å optimalisere eldre brikker - et resultat av eksportforbudet mot USA-produserte brikker, inkludert Nvidia - og distribuere spørringsbelastninger på tvers av modeller for effektivitet er imponerende etter industristandarder.

Hva er DeepSeek R1?

Utgitt i sin helhet 21. januar, er R1 DeepSeeks flaggskip resonneringsmodell, som yter på eller over OpenAIs hyllede o1-modell på flere matematiske, kodings- og resonneringsreferanser.

Bygget på V3 og basert på AlibabasQwenog Metas Lama, det som gjør R1 interessant er at den, i motsetning til de fleste andre toppmodeller fra teknologigiganter, er åpen kildekode, noe som betyr at alle kan laste ned og bruke den. Når det er sagt, har ikke DeepSeek avslørt R1s treningsdatasett. Så langt er alle andre modeller den har gitt ut også åpen kildekode.

DeepSeek er billigere enn sammenlignbare amerikanske modeller. Som referanse starter R1 API-tilgang på $0,14 for en million tokens, en brøkdel av $7,50 som OpenAI tar for tilsvarende nivå.

DeepSeek hevder i et selskapforskningspapirat V3-modellen, som kan sammenlignes med en standard chatbot-modell som Claude, kostet 5,6 millioner dollar å trene, et tall som sirkuleres (og bestrides) som hele utviklingskostnaden for modellen. Som Reutersrapporterte, mener noen laboratorieeksperter at DeepSeeks artikkel bare refererer til den endelige treningskjøringen for V3, ikke hele utviklingskostnaden (som vil være en brøkdel av hva teknologigiganter har brukt på å bygge konkurransedyktige modeller). Andre eksperter antyder at DeepSeeks kostnader ikke inkluderer tidligere infrastruktur-, FoU-, data- og personalkostnader.

En ulempe som kan påvirke modellens langsiktige konkurranse med o1 og USA-produserte alternativer iscensorship. Kinesiske modeller inkluderer ofte blokker om visse emner, noe som betyr at selv om de fungerer sammenlignbart med andre modeller, svarer de kanskje ikke på noen spørsmål (se hvordan DeepSeeks AI-assistent svarer på spørsmål om Den himmelske freds plass og Taiwanher). Etter hvert som DeepSeek-bruken øker, er noen bekymret for at modellenes strenge kinesiske rekkverk og systemiske skjevheter kan være innebygd i alle typer infrastruktur.

Når det er sagt, kan du få tilgang til usensurerte, USA-baserte versjoner av DeepSeekgjennom plattformer som Perplexity. Disse plattformene har fjernet DeepSeeks sensurvekter og kjørt den på lokale servere for å unngå sikkerhetsproblemer.

I desember ble ZDNETs Tiernan RaycomparedR1-Lites evne til å forklare tankekjeden til o1, og resultatene var blandede. Når det er sagt, avslører DeepSeeks AI-assistent sin tankegang for brukeren under spørsmål, en ny opplevelse for mange chatbot-brukere gitt at ChatGPT ikke eksternaliserer resonnementet.

Selvfølgelig kommer alle populære modeller med red-teaming-bakgrunn, retningslinjer for fellesskapet og innholdsrekkverk. Men i det minste på dette stadiet er det usannsynlig at amerikanskproduserte chatbots vil avstå fra å svare på spørsmål om historiske hendelser.

Hva er personvern- og sikkerhetsbekymringene?

Bekymringer om personvern som har sirkulert på TikTok - den kinesiskeide sosiale medieappen nånoe forbudt i USA - dukker også opp rundt DeepSeek.

Tidligere denne måneden sa Feroot Security-sjef Ivan Tsarynny til ABC at firmaet hans hadde oppdaget «direkte koblinger til servere og til selskaper i Kina som er under kontroll av den kinesiske regjeringen», som han sa de «aldri har sett tidligere».

Etter å ha dekryptert noe av DeepSeeks kode, fant Feroot skjult programmering som kan sende brukerdata - inkludert identifiserende informasjon, spørsmål og nettaktivitet - til China Mobile, et kinesisk regjeringsdrevet telekomselskap som har vært utestengt fra å operere i USA siden 2019 på grunn av nasjonale sikkerhetshensyn.

NowSecure anbefalte daorganisasjoner "forby" bruken av DeepSeeks mobilapp etter å ha funnet flere feil, inkludert ukrypterte data (noe som betyr at alle som overvåker trafikk kan fange dem opp) og dårlig datalagring.

Forrige uke oppdaget analysefirmaet Wiz at en intern DeepSeek-database var offentlig tilgjengelig "i løpet av minutter" etter å ha utført en sikkerhetssjekk. Den "helt åpne og uautentiserte" databasen inneholdt chattehistorikk, bruker-API-nøkler og andre sensitive data.

"Mer kritisk var det at eksponeringen tillot full databasekontroll og potensiell eskalering av privilegier i DeepSeek-miljøet, uten noen autentiserings- eller forsvarsmekanisme til omverdenen," forklarer Wizs rapport.

Ifølge Wired, som opprinnelig publiserte forskningen, selv om Wiz ikke mottok svar fra DeepSeek, så det ut til at databasen ble tatt ned innen 30 minutter etter at Wiz varslet selskapet. Det er uklart hvor lenge den var tilgjengelig eller om noen annen enhet oppdaget den før den ble tatt ned.

Selv uten denne alarmerende utviklingen, DeepSeeks personvernerklæringhever noen røde flagg. Den sier: "Personopplysningene vi samler inn fra deg kan lagres på en server som ligger utenfor landet der du bor. Vi lagrer informasjonen vi samler inn på sikre servere lokalisert i Folkerepublikken Kina."

Retningslinjene skisserer at DeepSeek samler inn mye informasjon, inkludert, men ikke begrenset til:

  • IP-adresse, unike enhetsidentifikatorer og informasjonskapsler
  • Fødselsdato (der det er aktuelt), brukernavn, e-postadresse og/eller telefonnummer og passord
  • Tekst- eller lydinndata, spørsmål, opplastede filer, tilbakemeldinger, chattelogg eller annet innhold du gir til modellen og tjenestene våre
  • Bevis på identitet eller alder, tilbakemeldinger eller henvendelser om din bruk av tjenesten [Hvis du kontakter DeepSeek]

Retningslinjene fortsetter: «Når vi overfører personopplysninger ut av landet der du bor, inkludert for ett eller flere av formålene som er angitt i disse retningslinjene, vil vi gjøre det i samsvar med kravene i gjeldende databeskyttelseslover.» Retningslinjene nevner ikke GDPR-samsvar.

"Brukere må være klar over at alle data som deles med plattformen kan være underlagt myndighetstilgang i henhold til Kinas cybersikkerhetslover, som krever at selskaper gir tilgang til data på forespørsel fra myndighetene," sa Adrianus Warmenhoven, medlem av NordVPNs sikkerhetsrådgivende styre, til ZDNET via e-post.

Ifølge noen observatører betyr det faktum at R1 er åpen kildekode økt åpenhet, slik at brukere kan inspisere modellens kildekode for tegn på personvernrelatert aktivitet.

DeepSeek ga imidlertid også ut mindre versjoner av R1, som kan lastes ned og kjøres lokalt for å unngå bekymringer om at data sendes tilbake til selskapet (i motsetning til å få tilgang til chatboten på nettet).

Alle chatbots, inkludert ChatGPT, samler inn en viss grad av brukerdata når de spørres via nettleseren.

Er DeepSeek AI trygt?

AI-sikkerhetsforskere har lenge vært bekymret for at kraftige åpen kildekode-modeller kan brukes på farlige og uregulerte måter når de er ute i naturen. Testerav AI-sikkerhetsfirmaet Chatterbox fant at DeepSeek R1 har "sikkerhetsproblemer over hele linja."

I varierende grad ansetter amerikanske AI-selskaper et slags sikkerhetstilsynsteam. DeepSeek har ikke offentliggjort om de har et sikkerhetsforskningsteam, og har ikke svart på ZDNETs forespørsel om kommentar til saken.

"De fleste selskaper vil fortsette å konkurrere om å bygge den sterkeste AI de kan, uavhengig av risikoen, og vil se forbedret algoritmisk effektivitet som en måte å oppnå høyere ytelse raskere," sa Peter Slattery, en forsker på MITs FutureTech-team som ledet dets Risk Repositoryproject. "Det gir oss enda mindre tid til å ta tak i sikkerhets-, styrings- og samfunnsutfordringene som vil følge med stadig mer avanserte AI-systemer."

"DeepSeeks gjennombrudd i opplæringseffektivitet betyr også at vi snart kan forvente å se et stort antall lokale, spesialiserte 'wrappers' - apper bygget på toppen av DeepSeek R1-motoren - som hver vil introdusere sine egne personvernrisikoer, og som hver kan misbrukes hvis de faller i feil hender," la Ryan Fedasiuk til, direktør for amerikansk AI-styring ved The Future Society, en ideell organisasjon for AI-politikk.

Er DeepSeek mer energieffektiv?

Noenanalytikerebemerker at DeepSeeks databehandlingsmodell med lavere løft er mer energieffektiv enn den til USA-bygde AI-giganter.

"DeepSeeks nye AI-modell bruker sannsynligvis mindre energi til å trene og løpe enn større konkurrenters modeller," sa Slattery. - Jeg tviler imidlertid på at dette markerer starten på en langsiktig trend med lavere energiforbruk. AIs kraft stammer fra data, algoritmer og databehandling - som er avhengige av stadig forbedrede brikker. Når utviklere tidligere har funnet måter å være mer effektive på, har de vanligvis reinvestert disse gevinstene i å lage enda større og kraftigere modeller, i stedet for å redusere det totale energiforbruket.»

"DeepSeek er ikke det eneste AI-selskapet som har oppnådd ekstraordinære gevinster innen beregningseffektivitet. De siste månedene har USA-baserte Anthropic og Google Gemini skrytt av lignende ytelsesforbedringer," sa Fedasiuk.

"DeepSeeks prestasjoner er bemerkelsesverdige ved at de ser ut til å ha uavhengig konstruert gjennombrudd som lover å gjøre store språkmodeller mye mer effektive og rimeligere, raskere enn mange bransjefolk forventet - men i et felt så dynamisk som AI er det vanskelig å forutsi hvor lenge selskapet vil være i stand til å sole seg i rampelyset."

Hvordan vil DeepSeek påvirke AI-industrien?

R1s suksess fremhever en stor endring innen AI som kan gi mindre laboratorier og forskere mulighet til å lage konkurransedyktige modeller og diversifisere alternativene. For eksempel kan organisasjoner uten finansiering eller ansatte i OpenAI laste ned R1 og finjustere den for å konkurrere med modeller som o1. Rett før R1s utgivelse opprettet forskere ved UC Berkeley en åpen kildekode-modellpå nivå med o1-preview, en tidlig versjon av o1, på bare 19 timer og for omtrent $450.

Gitt hvor ublu AI-investeringer har blitt, spekulerer mange eksperter i at denne utviklingen kan sprekke AI-boblen (aksjemarkedet fikk absolutt panikk). Noen ser på DeepSeeks suksess som å avkrefte tanken om at banebrytende utvikling betyr store modeller og utgifter. Den kaster også Stargate, et infrastrukturinitiativ på 500 milliarder dollar ledet av flere AI-giganter, i et nytt lys, og skaper spekulasjoner rundt om konkurransedyktig AI krever energien og omfanget til initiativets foreslåtte datasentre.

DeepSeeks oppstigning kommer på et kritisk tidspunkt for kinesisk-amerikanske teknologirelasjoner, bare dager etter at det lenge tilkjempede TikTok-forbudet trådte i kraft delvis. Ironisk nok legger DeepSeek i klartekst frem fôret for sikkerhetsbekymringer som USA slet med å bevise om TikTok i sin langvarige innsats for å vedta forbudet.

Hvilke land forbyr DeepSeek?

Flere amerikanske byråer, inkludert NASA og marinen, har allerede forbudt DeepSeek på ansattes statlig utstedte teknologi, og lovgivere prøver å forby appen fra alle offentlige enheter, som Australia og Taiwan allerede har implementert. Sør-Korea har forbudt nye nedlastinger av appen på grunn av DeepSeeks nylige manglende overholdelse av lokal databeskyttelse. Italia etterforsker selskapet for bekymringer om GDPR-overholdelse.