DeepSeek V3: Jak čínské AI mění poměry na trhu s jazykovými modely

29. ledna 2025

•

DeepSeek V3 je pokročilý jazykový model vyvinutý čínskou společností DeepSeek, který se od svého uvedení v prosinci 2024 stal významným hráčem na poli umělé inteligence. Tento model, postavený na architektuře Mixture-of-Experts (MoE), disponuje celkem 671 miliardami parametrů, přičemž pro každý token je aktivováno 37 miliard parametrů. Byl vyškolen na 14,8 bilionu různorodých a kvalitních tokenů, což mu umožňuje dosahovat výkonu srovnatelného s předními uzavřenými modely, jako jsou GPT-4o a Claude-3.5-Sonnet.

Co je to DeepSeek V3?

DeepSeek-V3 je pokročilý AI asistent vytvořený čínskou společností DeepSeek. Jeho hlavním cílem je poskytovat informace, odpovídat na otázky a pomáhat s nejrůznějšími úkoly a díky strojovému učení a zpětné vazbě od uživatelů se neustále učí a zdokonaluje. Podobně jako jiné modely dokáže DeepSeek V3:

Odpovídat na otázky: Od jednoduchých faktů po složitější témata.
Pomáhat s učením: Vysvětlí látku, pomůže s úkoly nebo připraví studijní materiály.
Generovat texty: Od esejí přes kreativní příběhy až po scénáře.
Překládat texty: Pomůže s překlady, gramatikou, slohovými pracemi nebo konverzací v cizích jazycích.
Poradit s programováním: Vytvoří kód, algoritmy nebo pomůže s debugováním.
Poskytovat tipy a rady: Ať už jde o cestování, vaření, nebo třeba osobní rozvoj.
Asistent v podnikání: Vytvoří strategii, analýzu trhu nebo finanční plán. Poradí s reklamními kampaněmi nebo sociálními sítěmi.

Výhody a vlastnosti DeepSeek V3:

DeepSeek V3 má oproti ostatním modelům několik výhod, které z něj v podstatě přes noc udělaly celosvětové téma. Aplikace je aktuálně číslo jedna v Appstore, v sekci bezplatných aplikací. Tento úspěch vedl k poklesu akcií některých amerických technologických společností.

Efektivita trénování

DeepSeek V3 byl vyškolen za přibližně 55 dní s využitím 2 000 specializovaných čipů H800 od společnosti Nvidia, což je výrazně méně než u konkurence, kteří jich často využívají mnohonásobně více. Celkové náklady na trénink navíc dosáhly přibližně 5,58 milionů dolarů, což je v porovnání s miliardovými náklady amerických technologických gigantů jen zlomek.

Pro představu, společnost Meta vyvíjí model Llama 4, který je trénován na clusteru s více než 100 000 H100, které jsou navíc výkonnější než ty, na kterých byl trénován DeepSeek V3. Meta také v letošním roce plánuje vynaložit na vývoj AI až 65 miliard dolarů

Výkon

Model dosahuje vynikajících výsledků v různých oblastech, včetně kódování, matematiky a obecných znalostí. Například na benchmarku MMLU dosáhl skóre 88,5, což je srovnatelné s nejlepšími uzavřenými modely.

Společnost DeepSeek zveřejnila i další benchmarky na svých stránkách, a to i v porovnání s ostatními konkurenčními modely.

Výsledky testování jsou o to překvapivější, přihlédneme-li k nákladům a podmínkám testování. Konkrétně k dříve zmíněným nízkým nákladům vynaloženým na testování a relativně malému množství čipů, způsobenému mimojiné také americkými sankcemi na vývoz pokročilých čipů do číny.

Dostupnost

Třetí velkou výhodou DeepSeek V3 je fakt, že je k dispozici jako open-source model, což umožňuje široké komunitě vývojářů, výzkumníků a firem přístup k jeho schopnostem a má potenciál dále akcelerovat implementaci AI do každodenních životů každého z nás.

V kontextu aktuálního dění na trhu s umělou inteligencí je tento krok revoluční. Představitelé velkých technologických společností se stále více zaměřují na monopolizaci pokročilých modelů AI a zpoplatnění přístupu k nim. Na druhé straně otevřené modely, jako je DeepSeek V3 nebo Llama, umožňují demokratizaci přístupu k AI technologiím a přispívají ke snížení bariér v tomto dynamickém odvětví.

Úskalí

Objevují se však informace, že DeepSeek V3, i když je vysoce výkonný a přístupný jako open-source, má výrazné cenzurní mechanismy, které odrážejí přísnou kontrolu, jež je charakteristická zemi, v níž byl vytvořen. Když se uživatelé pokusí zeptat na citlivá témata,, model často reaguje stejným způsobem – odmítá odpovědět, přepíná téma a odpovídá vyhýbavě.

Tento způsob cenzury není běžný v západních AI modelech, které se vyhýbají pouze urážlivému a nevhodnému obsahu. Ukazuje to, jak silná může být vládní kontrola nad AI technologiemi, které jsou vyvíjeny a provozovány ve státem řízeném prostředí.

Shrnutí

DeepSeek V3 se tedy během krátké doby etabloval jako významný konkurent na poli umělé inteligence, který nejen že nabízí vysoký výkon za nižší náklady, ale také přispívá k demokratizaci přístupu k pokročilým AI nástrojům prostřednictvím open-source přístupu. Jeho funkcionalita však naráží na bariéry státu, ve kterém byl vytvořen.

DeepSeek V3 si můžete zdarma vyzkoušet na stránkách deepseek.com.

Předchozí článek Co je to GPSR a jak ovlivní české e‑shopy?

Další článek OpenAI zpřístupnilo ChatGPT Search všem uživatelům

Vojtěch Tomášek

Jsem redaktor se zájmem o technologie, grafický design a IT. Je pro mě klíčová zpětná vazba a podněty od čtenářů. Chci tak tvořit obsah, který nejen informuje, ale také inspiruje a obohacuje. Od dokončení vysoké školy se věnuji převážně grafice a IT. Když zrovna nejsem v redakci Intervalu, jsem v přírodě nebo se právě snažím dokončit quest v nejnovějším Zaklínači.