AI Horizons Newsletter

OPENAI

Novým cílem OpenAI je Superinteligence

v kostce:

OpenAI zahájili rok 2025 třemi zásadními novinkami, které napovídají, že z konkurence rozhodně strach nemají. A to v prosinci Google a čínský Deepseek představili nové AI modely, schopnostmi téměř na úrovni těch nejlepších z dílny OpenAI. Přesto považujeme OpenAI za jasného lídra, minimálně díky představenému systému Operátor, který za vás nakoupí v Košíku, porovná zboží, nebo vyplní tabulku v Excelu. Funguje velmi spolehlivě na rozdíl od pokusů konkurence a ukazuje nám budoucnost práce s počítačem.

Projekt Stargate podporovaný vládou nového prezidenta, i přes Muskovy připomínky, je pravděpodobně reálně připraven investovat během příštích několik let 500 miliard dolarů na vybudování masivní AI infrastruktury. Podle všeho je prvních cca 40 miliard dolarů už zajištěno.

Půl roku potom, co se do správní rady OpenAI připojil Paul M. Nakasone, původně z NSA (Národní bezpečnostní agentura USA), se stává dalším členem Adebayo Ogunlesi, zástupce společnosti BlackRock, a k tomu přichází úzká spolupráce s vládou v zájmu bezpečnosti s názvem ChatGPT Gov. Aby toho nebylo málo, Sam Altman veřejně prohlásil, že výzkum společnosti má nyní nový cíl a to vývoj superinteligence, protože cestu k AGI, všeobecné umělé inteligenci, už mají.

podrobnosti:

Operator první funkční autonomní AI agent – může samostatně klikat, scrollovat, psát, a dokonce zadávat různé formuláře bez nutnosti specializovaných API. Na rozdíl od aplikací jako Make tak stačí říct co chcete a agent začne samostatně vykonávat úkol i podle jednoduchého zadání. V Make může trvat i pár hodin, než vytvoříte a odladíte jednu automatizaci, všechny API musíte sami napojit a pracovat pouze s podporovanými aplikacemi. Operátorovi stačí říct objednej mi z Košíku bílé víno a minerálku.

Byl spuštěn 23. ledna 2025, vychází z modelu Computer-Using Agent (CUA), který kombinuje vizuální schopnosti modelu GPT-4o a pokročilého uvažování, schopnosti rozdělit problém na jednotlivé kroky a následně opravovat chyby dle úspěšnosti klikání v reálném čase.
OpenAI tvrdí, že při webovém procházení dosahuje Operator 87% úspěšnosti a zvládá více úkolů zároveň – třeba objednat nákup a u toho provést výzkum a výsledky uložit do tabulky a na pozadí ještě vytvoří třeba aplikaci pro správu projektu.
K dispozici je pouze v USA a pouze těm, kteří mají předplacené ChatGPT Pro za 200 dolarů měsíčně. V Evropě je zatím spuštění odloženo na neurčito.
A co se dat o tom co za vás Operator dělá týká, OpenAI si může ukládat záznamy až 90 dní po jejich smazání, což je o 60 dní déle než u standardních konverzací v ChatGPT.

GPT o3-mini k dispozici a nejspíš hlavně díky čínským modelům Deepseek a Qwen je také zdarma pro všechny. Nový model je rychlejší, lepší a mnohem levnější než o1. V ChatGPT aplikaci zatím neumí pracovat se soubory, ale má přístup k vyhledávání na internetu. Dostupný je také přes API za 4,4 dolaru za 1 milion výstupních tokenů (to je asi 5 knih Harryho Pottera), přitom ještě před půl rokem jste zaplatili 15 dolarů za stejné množství výstupního textu při použití modelu GPT 4o.
Pro platící uživatele je navíc k dispozici model o3-mini-high, jeho výkonnější brácha co déle “přemýšlí”.
Vzhledem k nákladům, rychlosti a schopnostem vám teď ve firmě může zlepšit automatizace různých pracovních procesů a nasadit AI ve více případech.
Na využívání modelů o3-mini jsou stanovené limity pro předplatné Plus a Team:

150 zpráv denně pro o3-mini (3x více než předchozí limit 50 zpráv s o1-mini)
50 zpráv týdně pro o3-mini-high

Projekt Stargate svým velkoolepým plánem na výstavbu datových center v USA dokázal zaujmout veřejnost, naštvat Elona Muska a téměř zastínil další významné události ledna. Projekt podporuje nová Trumpova administrativa, tedy ne finančně, ale i tak to znamená hodně.

Společný podnik OpenAI, SoftBank, Oracle a MGX21 plánuje investici 500 miliard dolarů na výstavbu AI infrastruktury během čtyř let. SoftBank nese hlavní finanční břemeno, OpenAI si ponechává operační kontrolu.
Projekt vede Masayoshi Son, šéf SoftBank a Sam Altman, šéf OpenAI a už nyní se staví první datové centrum v texaském Abilene. V plánu je až 20 dalších, každé o rozloze 50.000 metrů čtverečních.
Oficiálně projekt slibuje vytvořit 100.000 nových pracovních míst a zajistit americké prvenství v AI závodech. Část ekonomů upozorňuje, že tato datacentra ve výsledku nahradí desítky milionů pracovních míst.
Elon Musk se navíc veřejně opřel do Stargate s tím, že „ty peníze prostě nemají,“ zatímco Satya Nadella (CEO Microsoftu) suše konstatoval, že mu stačí “jeho” 80 miliard ročně, které do Azure nasype bez problémů.

Tasks je nová funkce v ChatGPT a umožní vám naplánovat spuštění vámi vytvořených instrukcí na konkrétní den a čas a klidně i opakovaně. Zatím využití příliš nenachází, ale podle nás skrývá velký potenciál, pokud se propojí s Operatorem nebo s GPT asistenty. Chybí také podpora souborů a limit je 10 úkolů současně.
Únik informací o velikosti modelů ze studie Microsoftu ukazuje 2 zásadní věci: modely se zmenšují a zrychluje se jejich vývoj. Mimo to klesá cena za provoz a schopnosti rostou násobně s každou iterací.

1. GPT 3.5 vyšlo na veřejnost 30.11.2022 přes chatovací aplikaci ChatGPT, velikost neurální sítě 137 miliard parametrů
2. GPT 4 - březen 2023, 1,7 bilionů parametrů
3. GPT 4o - květen 2024, 200 miliard parametrů
4. GPT o1 - prosinec 2024, 300 miliard parametrů, reasoning model (“přemýšlení” před odpovědí)
5. GPT o3-mini - leden 2025, reasoning model, spekuluje se o 8 miliardách parametrů (⚠️kdyby to byl opensource model, už by nám to všem běhalo zadarmo na mobilu)

ChatGPT Gov, spuštěný 28. ledna 2025, má vládním agenturám a úřadům zajistit specializované prostředí pro používání ChatGPT. Jak rozumné je, aby vláda používala jeden model, uzavřený, nad kterým nemá kontrolu, se teprve ukáže.

Důraz se ve verzi Gov klade na bezpečnost, soulad s přísnými standardy typu IL5, CJIS či FedRAMP High a možnost samostatného hostování na Azure Government cloudu.
OpenAI uvádí, že už přes 90 000 vládních zaměstnanců využilo ChatGPT Gov k překladu dokumentů, kódování, přípravě strategií nebo vývoji aplikací.
Platforma by měla brzy získat FedRAMP certifikace a umožnit nasazení i v dalších, vysoce chráněných prostředích.

Na konec měsíce nám konečně v EU přibyla novinka, která už od prosince funguje v USA, a to je sdílení obrazovky či kamery přímo do ChatGPT. V konverzacích v hlasovém režimu tak můžete snáze “ukázat” co potřebujete a čeho se to týká.

proč je to důležité:

OpenAI v lednu dále upevňuje pozici klíčového lídra v AI závodech a ukazuje všem, kam se bude AI dále vyvíjet. Představte si, jak obrovský výkon plánuje projekt Stargate pro OpenAI, když za cca 8 miliard dolarů postavil Elon Musk aktuálně největší datacentrum na světě, Colossus, se 100 tisíci chipy H100 od Nvidia. Evidentně se očekává, že poptávka po výpočetním výkonu nadále poroste geometrickou řadou. Tempo jakým klesají náklady na provoz modelů a rostou jejich schopnosti umožňuje spolehlivě nasadit AI na větší množství úkolů.

Právě proto bude podle odborníků zapotřebí stále větší množství výkonných datacenter a energetické infrastruktury. A zdá se, že OpenAI v tom bude hrát klíčovou roli. Jak říkal strýček Ben ve filmu Spiderman, “s velkou mocí přichází i velká odpovědnost”, tak snad je Sam Altman skutečně na straně dobra.

S příchodem Operatora všem, kdo ho viděli v akci, došlo, co to ten AI agent je, i proč mluví o tom, že budou agenti hlavním tématem letošního roku. Zatím se to nemusí zdát jako přelomová věc, ale v druhé a třetí iteraci bude Operator schopen nahradit většinu rutinní práce na počítači. O připravenosti lidí a firem by se dalo polemizovat, ale člověk s Operatorem po boku bude pracovat, jako by se naklonoval.

NVIDIA

Nvidia umožní lokální AI

v kostce:

NVIDIA byla na letošním CES 2025 jednoznačně nejlepším vystavovatelem a ukázala, že kdo chce AI využívat, bude potřebovat jejich čipy. Mimo nových čipů pro datová centra představili novou řadu grafických karty GeForce RTX 50 s architekturou Blackwell. To je skvělá zpráva nejen pro hráče, ale i pro AI nadšence a firmy, které chtějí provozovat menší AI modely lokálně. Revoluční novinkou je projekt Digits, malý superpočítač s obrovským výkonem, který můžete spojovat do větších celků a postavit si doma nebo ve firmě malé datové centrum. Se dvěma zařízeními Digits rozběhnete i reasoning model Deepseek R1 lokálně. Digits je tak malé zařízení, že by se vám vešlo i do větší kapsy.

Ohromující bylo i představení platformy Cosmos, která umožňuje simulaci reálného prostředí s fyzikálními zákony. To firmám umožní třeba simulaci celé továrny včetně všech výrobních procesů a pohybu lidí i robotů. Díky tomu budou moci efektivněji rozmístit jednotlivá stanoviště, předcházet úrazům i předvídat poruchy. Cosmos také umožní generování dat pro trénink a vývoj fyzické AI a autonomních systémů.

podrobnosti:

Project DIGITS – možná největší překvapení pro všechny, kdo chtějí vyvíjet a provozovat AI modely mimo datová centra. Za cenu 3 000 dolarů slibuje NVIDIA v květnu 2025 dodat na trh kompaktní mini desktop, v němž se ukrývá GB10 Grace Blackwell Superchip. Za pár desítek tisíc dolarů si tak dnes můžete doma na stole postavit supervýkonné datacentrum. Tak výkonné, že na něm můžete trénovat vlastní modely a provozovat je lokálně a rychlostí blesku.

Jde o kombinaci 20 jádrového Arm CPU Grace a Blackwell GPU, doplněnou o 128 GB sdílené paměti. Systém dosahuje 1 petaflopu, takže zvládne modely o velikosti až 200 miliard parametrů. Dvě propojené jednotky si troufnou na 405 miliard parametrů a to už jsou dnešní vlajkové modely.
Vše v balení jen něco o málo větším než Mac Mini!
Projekt DIGITS se zaměřuje na rychlé prototypování, inferenci (to je to přemýšlení modelu před odpovědí) a edge AI (například robotiku či zdravotnictví). Díky předinstalovaným softwarovým stackům lze modely následně nasadit v cloudu či datovém centru bez dalších úprav.

Série grafických karet GeForce RTX 50 – nové karty postavené na Blackwell architektuře, zvládnou až 3.352 bilionů AI operací za vteřinu (AI TOPS). To znamená přibližně dvojnásobný nárůst výkonu oproti předchozímu top modelu RTX 4090 a za téměř poloviční cenu.

Na RTX 5090 s 32 GB VRAM rozběhnete lokálně třeba Llama-3.3-70B od Meta nebo R1 Distil Qwen 32B reasoning model od Alibaba.
S DLSS 4 se výkon ve hrách může znásobit – technologie totiž generuje až tři snímky na každý renderovaný snímek a za chodu tak vylepšuje stabilitu obrazu a zvýší fps.
Nové RTX karty rovněž zvládnou Neural - Shaders, Faces a Mega Geometry. To ve hrách i v reálných aplikacích umožní zobrazovat materiály a osvětlení na úrovni filmových efektů, větší detailnost prostředí a postav a v reálném čase generovat detailní lidské tváře jen z jednoduché rasterizace a 3D pozice.

Nástroje pro tvůrce obsahu NVIDIA Broadcast umí nově díky AI funkcím vylepšit zvuk mikrofonu i osvětlení tváře při livestreamu. Streamlabs přidává Intelligent Streaming Assistant, který se chová jako asistent a režisér v jednom – navrhuje témata, hlídá technickou stránku vysílání a pomáhá udržet diváky v napětí.
AI blueprints s NIM mikroslužbami - Předpřipravené nástroje pro rozpoznávání řeči nebo třeba analýzu videa. Lze je kombinovat do komplexních workflow, jako je převod PDF na podcast nebo např. detekce anomálií v kamerových záznamech. Blueprints umožňují vývojářům používat pokročilé AI agenty bez nutnosti programování a tím snáze vytvářet pokročilé systémy a aplikace.
NVIDIA Cosmos – platforma, která firmám umožní rychlejší a spolehlivější vývoj „fyzické AI“ - roboty, drony, autonomní auta atd. Je totiž docela logické, že nemůžeme nechat roboty učit se dělat chyby v reálném prostředí, kde mohou způsobit reálné škody. Ve virtuálním prostředí můžete simulovat miliony různých situací na jednou a chyba nikoho nezabije.

Cosmos umožňuje generovat realistická videa (3D-to-Real) včetně popisu obsahu, a ty lze následně použít jako syntetická data pro trénink AI modelů.
Firmám Cosmos umožní tzv. prediktivní inteligenci – dokáže odhadnout, co se stane za pár sekund, a tomu přizpůsobit rozhodování.
Dokáže paralelně generovat komplexní simulace, a tím pomoci škálovat testování AI agentů, robotů i celých továren v nekonečně mnoho různých scénářích.
Ve spojení s NVIDIA Omniverse se tak nabízí ucelený ekosystém pro návrh, trénink a nasazení autonomních systémů v naprosto realistických virtuálních prostředích. To umožní rychlejší a bezchybné nasazení v reálném světě a ještě urychlí celkový vývoj.

proč je to důležité:

Nové čipy pro velká datová centra a roboty, s násobně vyšším výkonem i nižší spotřebou, jsou klíčové pro masivní nasazení umělé inteligence. Pokud by dnes chtěli využívat AI všichni lidé ve vyspělých zemích a všechny firmy, chybí aktuálně dostatečné zdroje energie a výpočetní výkon. Možná to za pár let vyřeší jaderná fúze a kvantové počítače, ale stavba elektráren a datových center určitě pár let zabere a spolkne asi více než 500 miliard dolarů, které plánuje investovat projekt OpenAI StarGate.

V prosincovém vydání jste si mohli přečíst, jak Ilja Sutskever (spoluzakladatel OpenAI a přední vědec v AI) prohlásil, že jsme vyčerpali všechna dostupná data a dalším krokem jsou data syntetická. To mají vyřešit právě nástroje Cosmos a Omniverse, které firmám umožní simulovat fyzický svět a generovat syntetická data.

Ve všem bude v nejbližších letech hrát klíčovou roli právě Nvidia, potažmo TSMC (Taiwan Semiconductor Manufacturing Company), kde se Nvidia čipy skutečně vyrábí. Jedním z hlavních faktorů proč věříme, že Nvidia bude nadále lídrem a pokles jejich akcií je pouze dočasný, je Cuda. Cuda je v podstatě API a softwarová vrstva, která umožňuje snadnou práci s desítkami tisíc GPU. Má ji jen Nvidia a nahradit Cuda je tak komplikované, že se o to ani nikdo nesnaží a tím si společnost drží klíčové postavení. V Deepseek se podařilo vytvořit vlastní vylepšenou verzi Cuda a to je největší celosvětový úspěch. Jediné co by tedy mohlo společnost zpomalit jsou nové omezení na export top čipů mimo USA, nebo problémy na Taiwanu.

DEEPSEEK

Nová čínská hvězda na poli AI

v kostce:

DeepSeek, mladá čínská společnost založená v roce 2023 Liangem Wenfengem a financovaná jeho vlastním hedge fondem High-Flyer, v poslední době vzbuzuje pozornost celého AI světa. Jejich jazykové modely jsou na úrovni těch nejlepších close-source modelů OpenAI před cca 9 měsíci, ale o cca 95% levnější na provoz (také před 9 měsíci). To je o to pozoruhodnější, že Čína čelí omezením dovozu výkonných amerických čipů, takže musí těžit z potenciálně „osekaného“ hardwaru typu Nvidia H800.

Kvůli spekulacím o nákladech na vytvoření modelů V3 (konkurence GPT 4o) a reasoning modelu R1 (konkurence GPT o1-mini), a uvedení ve verzi open-source dokonce způsobili největší propad akcií Nvidia za jediný den. Předpokládalo se totiž, že tím pádem nebude potřeba, aby Nvidia produkovala takové množství čipů. Brzy se ukáže, zda podle Jevanova paradoxu poptávka naopak poroste a reakce investorů byly přehnané. Vzhledem ke spuštění projektu Stargate v USA a novým zjištěním o skutečných nákladech na vytvoření Deepseek modelů je to velmi pravděpodobné.

Spekulovalo se, zda nemá DeepSeek tajně k dispozici desetitisíce výkonnějších H100 GPU dovezených přes třetí země. A také zda skutečně porušili smluvní podmínky OpenAI a z jejich modelů “distilovali” data pro ty své. Americké úřady proto spustily vyšetřování, jestli DeepSeek neobchází restrikce a nevyužívá mezinárodní „kličky“ k získání čipů, které by v Číně oficiálně být neměly.

Realita je mnohem jednodušší, hedge fond High-Flyer nakoupil už v roce 2021 cca 10.000 chipů A100, tedy ještě před restrikcemi. Jejich využití bylo původně na algoritmické obchodování a od roku 2023 jich většina slouží k tréninku AI. Reálné náklady na vytvoření modelu Deepseek V3 tak rozhodně nebyly 6 mil. dolarů jak se spekulovalo, ale mnohem více. Jedna A100 (předchůdce současných H100, které dnes pohání moderní datová centra), vyšla v roce 2021 na cca 15.000 dolarů. To máme 150 milionů dolarů jen za čipy, přičtěte platy vědců, náklady na provoz a na vytvoření dat (pravděpodobně distilace GPT 4o přes OpenAI API).

podrobnosti:

DeepSeek-R1 reasoning model – nový model R1 před odpovědí přemýšlí tak jako o1 nebo o3 od OpenAI, a k tomu využívá techniku „chain-of-thought“. Model úkol rozdělí na kroky a postupuje krok za krokem, místo aby “slepě” generoval slovo za slovem.

V testech Arc AGI je na tom o trochu lépe než o1-mini a o3-mini low od OpenAI. Cena za používání API je 2,04 dolaru za milion výstupních tokenů v případě R1 a 4,4 dolaru v případě o1-mini i o3-mini. Ušetříte tak více než 50 % nákladů ve vašich aplikacích a automatizacích.
Bezpečné používání Deepseek modelů dnes můžete zajistit snadno - mají velký úspěch a jsou open-source, proto je už hostují americké firmy. V Perplexity Pro si můžete pro vyhledávání zvolit model R1, a platformy jako Groq nebo Together.ai poskytnou čínské modely přes API na vlastních serverech s rychlou odezvou i produkcí tokenů za sekundu.
Model je open-source tzn. že ho může kdokoliv použít nebo jakkoliv upravovat i pro komerční účely a je také k dispozici zdarma v chatbotu Deepseek, stačí kliknout na ikonku “DeepThink (R1)”.
V chatbotu navíc můžete pracovat s textovými a datovými soubory i s tímto reasoning modelem, to v zatím ChatGPT nejde. Jen pozor na citlivá data a co v konverzacích prozradíte.
Novinkou je také využití pouze tzv. učení s posilováním (Reinforcement Learning), díky kterému dnes žádný člověk nedokáže porazit AI ve hrách jako šachy, Go, nebo StarCraft. Model se tak v podstatě “sám” naučil přemýšlet o úkolu komplexně, a krok za krokem ho zpracovat.
Během tréninku se objevilo několik zajímavých jevů, například když se model spontánně naučil revidovat svůj vlastní postup, pokud narazil na nejistotu.
Vylepšená architektura MoE (Mixture of Agents), kterou už více než před rokem představil Google, stojí za úspěchem modelů Deepseek. Vylepšená architektura umožňuje používat vždy jen malou část z celé neuronové sítě. Z celkových 671 miliard parametrů neuronové sítě se tak vždy používá jen 37 miliard. Jsou tak mnohem levnější na provoz a přesnější v odpovědích, protože se odlišným úkolům věnují specializovaní “agenti”.

Výkonné datacentrum společnosti čítající 10 tisíc Nvidia A100 nyní také používá čipy od Huawei Ascend 910C optimalizované pro “inference”. Inference je v podstatě “přemýšlení” modelu a tedy samotný provoz. Díky tomu jsou schopni s nízkými náklady na provoz konkurovat OpenAI. Pokud se Huawei podaří vyrobit čipy na úrovni těch od Nvidia, budou v Číně schopni postavit AI infrastrukturu, přes všechny omezení dovozu čipů, mnohem rychleji než v USA.
DeepSeek-Coder je nový open source model, podporuje přes 80 programovacích jazyků a je samozřejmě zaměřen na programátory. V různých testech (HumanEval, MBPP) se umístil jako jeden z nejlepších otevřených modelů pro tvorbu a doplňování kódu.
Deepseek Janus generátor obrázků je samozřejmě také open-source, jako mají být do budoucna všechny modely společnosti. Na Midjourney samozřejmě nemá, ale je výjimečný tím, že je malý - 7 mld. parametrů (to rozběhnete i lokálně), rychlý a perfektně dodržuje zadání. Lidi ale moc generovat neumí a rozlišení zatím zvládá jen 384x384 pixelů.
V lednu unikla data 1 mil. uživatelů kvůli chybně zabezpečené databázi. Konkrétně konverzace, API klíče, nahrané soubory a technické detaily. Data nebyla zabezpečená po dobu 23 dní a díra v zabezpečení byla objevena náhodou až při rutinní kontrole.

proč je to důležité:

Je nad slunce jasné, že DeepSeek přinesl novou dynamiku do AI závodů a díky nim dnes máme všichni k dispozici lepší a levnější modely i nové funkce od lídra OpenAI. Protože jsou jejich modely plně open-source a méně náročné na provoz, nasazují je firmy do svých aplikací na vlastních serverech. Spousta AI aplikací tak dnes funguje lépe, protože mohou využívat chytřejší modely levněji a tak se vyplatí je do procesů nasadit. Někteří nadšenci dokonce přišli na to, jak spojením 7 M4 Mac-mini rozběhnout tu největší verzi Deepseek R1 (671B) lokálně.

Z technologického hlediska je tu další velký posun ve snižování nákladů na trénování a potenciálně efektivnější rozhraní než Nvidia Cuda. DeepSeek dokázal, že s chytřejšími algoritmy a mravenčí prací na aplikační a komunikační vrstvě se dá i na „pomalejších“ GPU vytrénovat obří model relativně levně. Pro menší firmy a výzkumné týmy to znamená možnost vlastního výzkumu a vývoje i rychlého prototypování. Provoz je samozřejmě stránka druhá, pokud chcete nakonec poskytovat služby stovkám milionům lidí nebo dokonce miliardám, bez obřího datacentra se neobejdete.

Možná že Číně naopak restrikce na dovoz čipů pomáhají najít jinou cestu - musejí přijít s inovacemi a to se jim daří. Tahle čínská firma dokázala v rekordním čase vytvořit modely schopné konkurovat těm nejlepším americkým. Pro koncové zákazníky i firmy je to skvělá zpráva a všem prospěje zdravá kvalitní konkurence. Vědecká komunita si také chválí způsob uvedení všech modelů nejen plně open-source, ale také s velmi kvalitní dokumentací. Ta umožňuje vědcům po celém světě navázat na jejich práci a modely vylepšovat či přizpůsobit vlastním potřebám.

ALIBABA

Další čínský drak v AI závodech

v kostce:

Alibaba, největší e-commerce hráč v Číně, se do AI závodů zapojil s novou generací rodiny jazykových modelů Qwen 2.5. Díky několika inovacím se nové modely dostaly na světovou špičku a v nečem i překonávají konkurenci. Po vzoru čínského Deepseek to zvládají levněji a efektivněji. Kromě vylepšené architektury Mixture-of-Experts (MoE), se jim podařilo vyřešit několik dalších problémů a Qwen Max dokonce dokáže sám opravovat svůj postup a zvýšit správnost odpovědí o 22%. Modelů uvedli celou stovku, od malých, které rozběhnete i na notebooku, až po ty, na jejichž provoz potřebujete výkonné datacentrum. Tím Alibaba disponuje a po konkurenčním Deepseek Alibaba potvrzuje, že v Číně nešlo o náhodu a jsou schopni konkurovat i po vědecké stránce.

podrobnosti:

Qwen 2.5 MAX je podle některých testů aktuálně lepší než Deepseek V3 nebo OpenAI GPT 4o. Je přitom jen o trochu dražší než V3 a sklízí na internetu pochvaly za kvalitu výstupů i rychlost.

64 specializovaných „expertů“ (MoE) je jako u Deepseek základem jejich úspěchu. MoE nepoužívá celý model, ale vždy aktivuje jen ty části, které jsou relevantní pro konkrétní úkol. Tím se šetří výpočetní výkon, takže je i provoz velkého modelu výrazně levnější.
„Self-correction“ mechanismy v modelu Qwen 2.5-Max, umožní modelu se během generování zastavit, zhodnotit svůj postup a případně opravit chybu v řetězci logických kroků.
Problém „lost in the middle“ vyřešen — tedy tendence LLM zaměřit se jen na začátek a konec promptu — řeší zejména sparse attention, která umožňuje udržet pozornost i na informace skryté uprostřed dlouhého textu.
Plně multimodální - simultánní zpracování textu, obrázků, zvuku a videa. Dokáže analyzovat videa až do délky 20 minut a generovat vizuální prvky např. pomocí SVG kódu.
Qwen 2.5 MAX je jako modely od OpenAI uzavřený a proto zatím dostupný jen přes API například na Alibaba Cloud (Čína) nebo AWS (USA).

Alibaba zveřejnila přes 100 variant Qwen 2.5 s podporou 29 jazyků, modely zaměřené na generování textu, obrázků, práci s videem nebo na matematiku. Modely Qwen můžete bezpečně používat pokud jsou hostované na amerických serverech přes společnosti jako Together.ai a OpenRouter, ale najdete je i v AWS.
Výpočetní zázemí Alibaba zůstává částečně utajené, ale i tak je zřejmé, že k tréninku modelů na této úrovni byla potřeba robustní GPU infrastruktura, stejně jako v případě Deepseek.

proč je to důležité:

V čínském AI ekosystému rostou soupeři jako houby po dešti a pro zbytek světa to znamená více muziky za méně peněz. Náklady na provoz AI modelů tak během několika let nejspiš poklesnou natolik, že bude umělá inteligence skutečně dostupná kdekoliv a komukoliv podobně jako internet. Tedy pokud nepočítáme cca miliardu lidí, která má zcela jiné starosti, jako například stabilní zdroj elektřiny či pitné vody. Čína navíc exceluje v robotice, dronech a elektromobilech a tam doteď chyběl chytrý mozek, aby mohly být plně autonomní.

Další modely vyvíjejí hráči jako Baidu a Tencent, a čínská scéna začíná šlapat na paty americkým i evropským výzkumníkům a startupům. Také jsou aktivnější a pracovitější v reálném nasazení AI řešení a tak mohou náskok Google a OpenAI brzy dorovnat.

Rok agentů začal se superinteligencí na obzoru

stručné shrnutí

obsah

novinky

OPENAI

Novým cílem OpenAI je Superinteligence

v kostce:

podrobnosti:

proč je to důležité:

NVIDIA

Nvidia umožní lokální AI

v kostce:

podrobnosti:

proč je to důležité:

DEEPSEEK

Nová čínská hvězda na poli AI

v kostce:

podrobnosti:

proč je to důležité:

ALIBABA

Další čínský drak v AI závodech

v kostce:

podrobnosti:

proč je to důležité:

bleskovky

AI tools

případová studie

Vytváření popisků pro e-shop

Prompt měsíce

děkujeme za pozornost