DeepSeek ilmoitti merkittävistä hinnanalennuksista API-palveluunsa lauantaina, pian sen jälkeen, kun sen V4-suurkielimalli julkaistiin 24. huhtikuuta 2023. Hinta alentaa pienemmät syöttövälimuistin osumamaksut kymmenesosaan aiemmista maksuistaan ja tarjoaa 75 % alennuksen V4-Pro-mallista 5. toukokuuta 2023 asti.

V4-Pron syöttövälimuistin osumahinta on pudonnut 0,025 juaniin (noin 0,0036 dollaria) miljoonaa merkkiä kohden. Kampanja-ajan vakiohinnat ovat 3 yuania panokselle ja 6 yuania tuotoksille miljoonaa kuponkia kohden. Tämä hinnoittelustrategia alittaa jyrkästi kilpailijat, sillä Anthropicin, OpenAI:n ja Googlen mallit ovat OpenRouterin tietojen mukaan 12–25 dollaria miljoonalta tokenilta.

DeepSeek julkaisi V4-Pron ja V4-Flashin esikatselukapasiteetissa, mikä merkitsee yhtiön ensimmäistä merkittävää mallin julkaisua sen V3.2-version jälkeen joulukuussa 2022. V4-Prossa on 1,6 biljoonaa parametria ja 49 miljardia aktiivista parametria päättelykierrosta kohden, mikä tekee siitä suurimman tällä hetkellä saatavilla olevan avoimen painon mallin. V4-Flashissa on pienempi kokoonpano 284 miljardilla parametrilla.

Jo ennen viimeaikaisia ​​leikkauksia V4-Pron standardihinnat olivat 1,74 dollaria syötteestä ja 3,48 dollaria tuotosta miljoonaa merkkiä kohden, mikä oli noin 98 % alhaisempi kuin OpenAI:n GPT-5.5 Pron hinta. Viimeisimmät alennukset laajentavat tätä kilpailuetua entisestään.

Tekoälysektorin laskentatehokustannusten noustessa DeepSeekin strategia on linjassa alan laajemman hintojen laskutrendin kanssa. Gelonghuin raportin mukaan yhtiö on täysin omaksunut ”AI-hinnan alennuksen” käsitteen.

Erityisesti V4 toimii Huawei Ascend -laitteistolla Nvidia-sirujen sijaan, mikä tarkkailijoiden mukaan voi edistää tekoälyjärjestelmien kotimaista käyttöönottoa. Counterpoint Researchin johtava tekoälyanalyytikko Wei Sun totesi, että tämä kehitys mahdollistaa tekoälyjärjestelmien käyttöönoton turvautumatta yksinomaan Nvidiaan, mikä saattaa nopeuttaa sekä kotimaista että maailmanlaajuista tekoälyn kehitystä.

V4-Pro on erittäin tehokas, sillä se vaatii vain 27 % edeltäjänsä V3.2:n laskentatehosta miljoonan tunnuksen kontekstiikkunaan. Edistymistään huolimatta DeepSeek myöntää, että V4 on edelleen johtavia malleja, kuten GPT-5.4 ja Gemini 3.1 Pro, jälkeen noin kolmesta kuuteen kuukauteen, kuten yhtiön teknisessä asiakirjassa todetaan.


Suositeltu kuva