
Det som gör DeepSeek speciellt är att det tydligen är mycket billigare. Medan branschledaren OpenAI rapporteras ha spenderat mer än 100 miljoner dollar på utvecklingen av GPT-4, utvecklade DeepSeek sin modell från 6 miljoner dollar. Denna kostnadsfördel uppnåddes genom användning av avancerade Nvidia A100-chips i kombination med andra relativt billigare processorer.
Experter hävdar att denna siffra är missvisande eftersom den inte tar hänsyn till bredare forsknings- och utvecklingskostnader, datainsamling, personalkostnader, infrastrukturkostnader och hårdvaruinvesteringar.
Prestanda och funktioner
Precis som ChatGPT fungerar DeepSeek genom att ge svar på frågor, och det är jämförbart med OpenAI:s o1-modell inom matematik och kodning. Det är en ”resonemangsmodell” som tänker och reagerar som människor gör, vilket gör den särskilt användbar för affärs- och kundtjänständamål.

Performance compared Source: Artificial Analysis Graphic: Jasmine Cui and Joe Murphy / NBC News
Systemet är särskilt bra på att demonstrera sin resonemangsprocess för att lösa ett problem genom att bryta ner sin resonemangsprocess i steg. Den kan också, som en människa som löser ett pussel, spåra tillbaka genom sin logik och korrigera tidigare steg om det behövs.
Detta transparenta tillvägagångssätt gör det möjligt för användare att veta hur det kommer fram till sina rekommendationer.
DeepSeek väcker etiska problem
DeepSeeks framväxt i AI-landskapet väcker viktiga frågor om konsekvenserna av dess teknik, särskilt med tanke på att den tränades på ryggraden i dyr hårdvara som kan ha utvecklats för att bryta de amerikanska exportkontrollerna.
Även om prestandan hos dess R1-modell, som kan replikera funktionaliteten hos OpenAI:s o1 men till en bråkdel av kostnaden, är imponerande, avslöjar den också möjligheten till oövervakade eller oetiska metoder i utvecklingen av AI i resten av världen.
Företagets förmåga att framgångsrikt införliva Nvidia A100-chips, som tidigare var begränsade av amerikanska regler, är en röd flagga för företagets äkthet och hur sådan teknik kan användas för att undergräva den internationella ordningen.
Dessutom är det oroväckande att DeepSeeks svar på känsliga historiska händelser överensstämmer med den kinesiska regeringens censur, eftersom det visar att modellen kan användas för att stödja statskontrollerade narrativ, vilket kan begränsa modellens användbarhet och trovärdighet globalt.
Således, när marknaderna svarar på detta upplevda hot mot amerikansk teknologisk överlägsenhet, måste de bredare konsekvenserna av DeepSeeks strategi – innovativ men ändå moraliskt sund – analyseras noggrant.