Hero Image
nechte si přečíst newsletter od AI

Rok agentů začal se superinteligencí na obzoru

Milí AI nadšenci,

děkuji, že jste si našli čas na přečtení našeho newsletteru. V záplavě denních AI novinek není snadné udržet přehled o tom, co je opravdu důležité. Našim cílem je usnadnit vám to a přinést vám užitečné tipy pro vaše projekty i byznys.

Budu rád za vaše nápady a zpětnou vazbu pro příští vydání. A pokud vám newsletter přinese užitečné informace, sdílejte ho s přáteli. Sdílená radost je totiž dvojnásobná radost.

Příjemné čtení přeje,
Libor Kovář - šéfredaktor.

stručné shrnutí

V lednu se v reakci na čínské modely a poprask na burze diskutuje ve vědecké komunitě tzv. Jevonsův paradox – čím je technologie výkonnější a levnější, tím víc ji využíváme a tím rychleji po ní roste poptávka. Proto už v USA připravují masivní výstavbu datacenter v projektu OpenAI s názvem Stargate, který má během několika let investovat 500 miliard dolarů a zajistit dostatečnou infrastrukturu. Pro představu je to asi 6 českých státních rozpočtů.

Nový rok sotva začal a už jistě víme, že 2025 bude rokem autonomních AI agentů. Loni se podařilo otestovat 1.000 spolupracujících agentů ve hře Minecraft, kteří byli schopni vytvořit společenskou hierarchii i vlastní fungující ekonomiku. Čeká nás tedy pravděpodobně rok “rojů” agentů. OpenAI to stvrzuje tím, že představili Operator, jejich první funkční agent, který sám kliká, vyplňuje tabulky a zvládne za vás i nakoupit online a slibují další agenty. S konkurenčním nástrojem Browser-Use, ale ve verzi open-source, přišel švýcarský startup, takže se rozhodně máme na co těšit.

Nvidia vám umožní provozovat AI modely lokálně s novým mini-superpočítačem Digits. A Čína opět šokovala efektivitou svých AI modelů – DeepSeek a Qwen ukazují, že se dá vytvořit špičková AI i na menších datacentrech.

OpenAI sice stále vede, ale čínské AI modely se dostávají na vrchol benchmarků a jsou open-source. Na provoz jejich modelů pro všechny obyvatele v Číně zatím nemají dostatečnou infrastrukturu. To se ale může rychle změnit, pokud se v Huawei podaří vyrobit AI čipy na úrovni Nvidia. Víme totiž, že když se do toho pustí s podporou vlády, dokáží stavět neuvěřitelně rychle.

Z bleskovek určitě nepřehlédněte Perplexity AI asistent a vyhledávač a jak ho získat na rok zdarma. A v případové studii se mrkneme na zoubek automatizaci vytváření popisků produktů pro eshop. A v promtech tohoto měsíce pro vás máme tipy jak promptovat AI vyhledávač Perplexity.

🌟 Lednové vydání si také můžete poslechnout v angličtině ve formě podcastu

EN

obsah

1️⃣ OpenAI - Autonomní AI agent Operator ovládá počítač a vývoj superinteligence je oficiálním cílem.

2️⃣ Nvidia - Lokální AI je tady: mini-superpočítač Digits běží i na stole.

3️⃣ DeepSeek - Čínská AI poprvé překonává OpenAI v některých oblastech.

4️⃣ Alibaba - Modely Qwen 2.5 posouvají hranice AI za nízkou cenu.

Bleskovky - Trump ruší AI regulace, Perplexity AI zdarma pro T-Mobile uživatele, Microsoft generuje nové materiály s AI.

🛠️ AI Tools - ElevenLabs Reader (čtení textů), Gamma (prezentace), Descript (editace videí), Make (automatizace), Riffusion (AI hudba).

📩 Případová studie - Jak AI pomohla eshopu automatizovat popisky produktů.

Prompt měsíce - 3 praktické prompty pro Perplexity AI.

novinky

OPENAI

Novým cílem OpenAI je Superinteligence

Novým cílem OpenAI je Superinteligence
v kostce:

OpenAI zahájili rok 2025 třemi zásadními novinkami, které napovídají, že z konkurence rozhodně strach nemají. A to v prosinci Google a čínský Deepseek představili nové AI modely, schopnostmi téměř na úrovni těch nejlepších z dílny OpenAI. Přesto považujeme OpenAI za jasného lídra, minimálně díky představenému systému Operátor, který za vás nakoupí v Košíku, porovná zboží, nebo vyplní tabulku v Excelu. Funguje velmi spolehlivě na rozdíl od pokusů konkurence a ukazuje nám budoucnost práce s počítačem.

Projekt Stargate podporovaný vládou nového prezidenta, i přes Muskovy připomínky, je pravděpodobně reálně připraven investovat během příštích několik let 500 miliard dolarů na vybudování masivní AI infrastruktury. Podle všeho je prvních cca 40 miliard dolarů už zajištěno.

Půl roku potom, co se do správní rady OpenAI připojil Paul M. Nakasone, původně z NSA (Národní bezpečnostní agentura USA), se stává dalším členem Adebayo Ogunlesi, zástupce společnosti BlackRock, a k tomu přichází úzká spolupráce s vládou v zájmu bezpečnosti s názvem ChatGPT Gov. Aby toho nebylo málo, Sam Altman veřejně prohlásil, že výzkum společnosti má nyní nový cíl a to vývoj superinteligence, protože cestu k AGI, všeobecné umělé inteligenci, už mají.

podrobnosti:
  • Operator první funkční autonomní AI agent – může samostatně klikat, scrollovat, psát, a dokonce zadávat různé formuláře bez nutnosti specializovaných API. Na rozdíl od aplikací jako Make tak stačí říct co chcete a agent začne samostatně vykonávat úkol i podle jednoduchého zadání. V Make může trvat i pár hodin, než vytvoříte a odladíte jednu automatizaci, všechny API musíte sami napojit a pracovat pouze s podporovanými aplikacemi. Operátorovi stačí říct objednej mi z Košíku bílé víno a minerálku.
    • Byl spuštěn 23. ledna 2025, vychází z modelu Computer-Using Agent (CUA), který kombinuje vizuální schopnosti modelu GPT-4o a pokročilého uvažování, schopnosti rozdělit problém na jednotlivé kroky a následně opravovat chyby dle úspěšnosti klikání v reálném čase.
    • OpenAI tvrdí, že při webovém procházení dosahuje Operator 87% úspěšnosti a zvládá více úkolů zároveň – třeba objednat nákup a u toho provést výzkum a výsledky uložit do tabulky a na pozadí ještě vytvoří třeba aplikaci pro správu projektu.
    • K dispozici je pouze v USA a pouze těm, kteří mají předplacené ChatGPT Pro za 200 dolarů měsíčně. V Evropě je zatím spuštění odloženo na neurčito.
    • A co se dat o tom co za vás Operator dělá týká, OpenAI si může ukládat záznamy až 90 dní po jejich smazání, což je o 60 dní déle než u standardních konverzací v ChatGPT.
  • GPT o3-mini k dispozici a nejspíš hlavně díky čínským modelům Deepseek a Qwen je také zdarma pro všechny. Nový model je rychlejší, lepší a mnohem levnější než o1. V ChatGPT aplikaci zatím neumí pracovat se soubory, ale má přístup k vyhledávání na internetu. Dostupný je také přes API za 4,4 dolaru za 1 milion výstupních tokenů (to je asi 5 knih Harryho Pottera), přitom ještě před půl rokem jste zaplatili 15 dolarů za stejné množství výstupního textu při použití modelu GPT 4o.
  • Pro platící uživatele je navíc k dispozici model o3-mini-high, jeho výkonnější brácha co déle “přemýšlí”.
  • Vzhledem k nákladům, rychlosti a schopnostem vám teď ve firmě může zlepšit automatizace různých pracovních procesů a nasadit AI ve více případech.
  • Na využívání modelů o3-mini jsou stanovené limity pro předplatné Plus a Team:
    • 150 zpráv denně pro o3-mini (3x více než předchozí limit 50 zpráv s o1-mini)
    • 50 zpráv týdně pro o3-mini-high
  • Projekt Stargate svým velkoolepým plánem na výstavbu datových center v USA dokázal zaujmout veřejnost, naštvat Elona Muska a téměř zastínil další významné události ledna. Projekt podporuje nová Trumpova administrativa, tedy ne finančně, ale i tak to znamená hodně.
    • Společný podnik OpenAI, SoftBank, Oracle a MGX21 plánuje investici 500 miliard dolarů na výstavbu AI infrastruktury během čtyř let. SoftBank nese hlavní finanční břemeno, OpenAI si ponechává operační kontrolu.
    • Projekt vede Masayoshi Son, šéf SoftBank a Sam Altman, šéf OpenAI a už nyní se staví první datové centrum v texaském Abilene. V plánu je až 20 dalších, každé o rozloze 50.000 metrů čtverečních.
    • Oficiálně projekt slibuje vytvořit 100.000 nových pracovních míst a zajistit americké prvenství v AI závodech. Část ekonomů upozorňuje, že tato datacentra ve výsledku nahradí desítky milionů pracovních míst.
    • Elon Musk se navíc veřejně opřel do Stargate s tím, že „ty peníze prostě nemají,“ zatímco Satya Nadella (CEO Microsoftu) suše konstatoval, že mu stačí “jeho” 80 miliard ročně, které do Azure nasype bez problémů.
  • Tasks je nová funkce v ChatGPT a umožní vám naplánovat spuštění vámi vytvořených instrukcí na konkrétní den a čas a klidně i opakovaně. Zatím využití příliš nenachází, ale podle nás skrývá velký potenciál, pokud se propojí s Operatorem nebo s GPT asistenty. Chybí také podpora souborů a limit je 10 úkolů současně.
  • Únik informací o velikosti modelů ze studie Microsoftu ukazuje 2 zásadní věci: modely se zmenšují a zrychluje se jejich vývoj. Mimo to klesá cena za provoz a schopnosti rostou násobně s každou iterací.
    • 1. GPT 3.5 vyšlo na veřejnost 30.11.2022 přes chatovací aplikaci ChatGPT, velikost neurální sítě 137 miliard parametrů
    • 2. GPT 4 - březen 2023, 1,7 bilionů parametrů
    • 3. GPT 4o - květen 2024, 200 miliard parametrů
    • 4. GPT o1 - prosinec 2024, 300 miliard parametrů, reasoning model (“přemýšlení” před odpovědí)
    • 5. GPT o3-mini - leden 2025, reasoning model, spekuluje se o 8 miliardách parametrů (⚠️kdyby to byl opensource model, už by nám to všem běhalo zadarmo na mobilu)
  • ChatGPT Gov, spuštěný 28. ledna 2025, má vládním agenturám a úřadům zajistit specializované prostředí pro používání ChatGPT. Jak rozumné je, aby vláda používala jeden model, uzavřený, nad kterým nemá kontrolu, se teprve ukáže.
    • Důraz se ve verzi Gov klade na bezpečnost, soulad s přísnými standardy typu IL5, CJIS či FedRAMP High a možnost samostatného hostování na Azure Government cloudu.
    • OpenAI uvádí, že už přes 90 000 vládních zaměstnanců využilo ChatGPT Gov k překladu dokumentů, kódování, přípravě strategií nebo vývoji aplikací.
    • Platforma by měla brzy získat FedRAMP certifikace a umožnit nasazení i v dalších, vysoce chráněných prostředích.
  • Na konec měsíce nám konečně v EU přibyla novinka, která už od prosince funguje v USA, a to je sdílení obrazovky či kamery přímo do ChatGPT. V konverzacích v hlasovém režimu tak můžete snáze “ukázat” co potřebujete a čeho se to týká.
proč je to důležité:

OpenAI v lednu dále upevňuje pozici klíčového lídra v AI závodech a ukazuje všem, kam se bude AI dále vyvíjet. Představte si, jak obrovský výkon plánuje projekt Stargate pro OpenAI, když za cca 8 miliard dolarů postavil Elon Musk aktuálně největší datacentrum na světě, Colossus, se 100 tisíci chipy H100 od Nvidia. Evidentně se očekává, že poptávka po výpočetním výkonu nadále poroste geometrickou řadou. Tempo jakým klesají náklady na provoz modelů a rostou jejich schopnosti umožňuje spolehlivě nasadit AI na větší množství úkolů.

Právě proto bude podle odborníků zapotřebí stále větší množství výkonných datacenter a energetické infrastruktury. A zdá se, že OpenAI v tom bude hrát klíčovou roli. Jak říkal strýček Ben ve filmu Spiderman, “s velkou mocí přichází i velká odpovědnost”, tak snad je Sam Altman skutečně na straně dobra.

S příchodem Operatora všem, kdo ho viděli v akci, došlo, co to ten AI agent je, i proč mluví o tom, že budou agenti hlavním tématem letošního roku. Zatím se to nemusí zdát jako přelomová věc, ale v druhé a třetí iteraci bude Operator schopen nahradit většinu rutinní práce na počítači. O připravenosti lidí a firem by se dalo polemizovat, ale člověk s Operatorem po boku bude pracovat, jako by se naklonoval.

NVIDIA

Nvidia umožní lokální AI

Nvidia umožní lokální AI
v kostce:

NVIDIA byla na letošním CES 2025 jednoznačně nejlepším vystavovatelem a ukázala, že kdo chce AI využívat, bude potřebovat jejich čipy. Mimo nových čipů pro datová centra představili novou řadu grafických karty GeForce RTX 50 s architekturou Blackwell. To je skvělá zpráva nejen pro hráče, ale i pro AI nadšence a firmy, které chtějí provozovat menší AI modely lokálně. Revoluční novinkou je projekt Digits, malý superpočítač s obrovským výkonem, který můžete spojovat do větších celků a postavit si doma nebo ve firmě malé datové centrum. Se dvěma zařízeními Digits rozběhnete i reasoning model Deepseek R1 lokálně. Digits je tak malé zařízení, že by se vám vešlo i do větší kapsy.

Ohromující bylo i představení platformy Cosmos, která umožňuje simulaci reálného prostředí s fyzikálními zákony. To firmám umožní třeba simulaci celé továrny včetně všech výrobních procesů a pohybu lidí i robotů. Díky tomu budou moci efektivněji rozmístit jednotlivá stanoviště, předcházet úrazům i předvídat poruchy. Cosmos také umožní generování dat pro trénink a vývoj fyzické AI a autonomních systémů.

podrobnosti:
  • Project DIGITS – možná největší překvapení pro všechny, kdo chtějí vyvíjet a provozovat AI modely mimo datová centra. Za cenu 3 000 dolarů slibuje NVIDIA v květnu 2025 dodat na trh kompaktní mini desktop, v němž se ukrývá GB10 Grace Blackwell Superchip. Za pár desítek tisíc dolarů si tak dnes můžete doma na stole postavit supervýkonné datacentrum. Tak výkonné, že na něm můžete trénovat vlastní modely a provozovat je lokálně a rychlostí blesku.
    • Jde o kombinaci 20 jádrového Arm CPU Grace a Blackwell GPU, doplněnou o 128 GB sdílené paměti. Systém dosahuje 1 petaflopu, takže zvládne modely o velikosti až 200 miliard parametrů. Dvě propojené jednotky si troufnou na 405 miliard parametrů a to už jsou dnešní vlajkové modely.
    • Vše v balení jen něco o málo větším než Mac Mini!
    • Projekt DIGITS se zaměřuje na rychlé prototypování, inferenci (to je to přemýšlení modelu před odpovědí) a edge AI (například robotiku či zdravotnictví). Díky předinstalovaným softwarovým stackům lze modely následně nasadit v cloudu či datovém centru bez dalších úprav.
  • Série grafických karet GeForce RTX 50 – nové karty postavené na Blackwell architektuře, zvládnou až 3.352 bilionů AI operací za vteřinu (AI TOPS). To znamená přibližně dvojnásobný nárůst výkonu oproti předchozímu top modelu RTX 4090 a za téměř poloviční cenu.
    • Na RTX 5090 s 32 GB VRAM rozběhnete lokálně třeba Llama-3.3-70B od Meta nebo R1 Distil Qwen 32B reasoning model od Alibaba.
    • S DLSS 4 se výkon ve hrách může znásobit – technologie totiž generuje až tři snímky na každý renderovaný snímek a za chodu tak vylepšuje stabilitu obrazu a zvýší fps.
    • Nové RTX karty rovněž zvládnou Neural - Shaders, Faces a Mega Geometry. To ve hrách i v reálných aplikacích umožní zobrazovat materiály a osvětlení na úrovni filmových efektů, větší detailnost prostředí a postav a v reálném čase generovat detailní lidské tváře jen z jednoduché rasterizace a 3D pozice.
  • Nástroje pro tvůrce obsahu NVIDIA Broadcast umí nově díky AI funkcím vylepšit zvuk mikrofonu i osvětlení tváře při livestreamu. Streamlabs přidává Intelligent Streaming Assistant, který se chová jako asistent a režisér v jednom – navrhuje témata, hlídá technickou stránku vysílání a pomáhá udržet diváky v napětí.
  • AI blueprints s NIM mikroslužbami - Předpřipravené nástroje pro rozpoznávání řeči nebo třeba analýzu videa. Lze je kombinovat do komplexních workflow, jako je převod PDF na podcast nebo např. detekce anomálií v kamerových záznamech. Blueprints umožňují vývojářům používat pokročilé AI agenty bez nutnosti programování a tím snáze vytvářet pokročilé systémy a aplikace.
  • NVIDIA Cosmos – platforma, která firmám umožní rychlejší a spolehlivější vývoj „fyzické AI“ - roboty, drony, autonomní auta atd. Je totiž docela logické, že nemůžeme nechat roboty učit se dělat chyby v reálném prostředí, kde mohou způsobit reálné škody. Ve virtuálním prostředí můžete simulovat miliony různých situací na jednou a chyba nikoho nezabije.
    • Cosmos umožňuje generovat realistická videa (3D-to-Real) včetně popisu obsahu, a ty lze následně použít jako syntetická data pro trénink AI modelů.
    • Firmám Cosmos umožní tzv. prediktivní inteligenci – dokáže odhadnout, co se stane za pár sekund, a tomu přizpůsobit rozhodování.
    • Dokáže paralelně generovat komplexní simulace, a tím pomoci škálovat testování AI agentů, robotů i celých továren v nekonečně mnoho různých scénářích.
    • Ve spojení s NVIDIA Omniverse se tak nabízí ucelený ekosystém pro návrh, trénink a nasazení autonomních systémů v naprosto realistických virtuálních prostředích. To umožní rychlejší a bezchybné nasazení v reálném světě a ještě urychlí celkový vývoj.
proč je to důležité:

Nové čipy pro velká datová centra a roboty, s násobně vyšším výkonem i nižší spotřebou, jsou klíčové pro masivní nasazení umělé inteligence. Pokud by dnes chtěli využívat AI všichni lidé ve vyspělých zemích a všechny firmy, chybí aktuálně dostatečné zdroje energie a výpočetní výkon. Možná to za pár let vyřeší jaderná fúze a kvantové počítače, ale stavba elektráren a datových center určitě pár let zabere a spolkne asi více než 500 miliard dolarů, které plánuje investovat projekt OpenAI StarGate.

V prosincovém vydání jste si mohli přečíst, jak Ilja Sutskever (spoluzakladatel OpenAI a přední vědec v AI) prohlásil, že jsme vyčerpali všechna dostupná data a dalším krokem jsou data syntetická. To mají vyřešit právě nástroje Cosmos a Omniverse, které firmám umožní simulovat fyzický svět a generovat syntetická data.

Ve všem bude v nejbližších letech hrát klíčovou roli právě Nvidia, potažmo TSMC (Taiwan Semiconductor Manufacturing Company), kde se Nvidia čipy skutečně vyrábí. Jedním z hlavních faktorů proč věříme, že Nvidia bude nadále lídrem a pokles jejich akcií je pouze dočasný, je Cuda. Cuda je v podstatě API a softwarová vrstva, která umožňuje snadnou práci s desítkami tisíc GPU. Má ji jen Nvidia a nahradit Cuda je tak komplikované, že se o to ani nikdo nesnaží a tím si společnost drží klíčové postavení. V Deepseek se podařilo vytvořit vlastní vylepšenou verzi Cuda a to je největší celosvětový úspěch. Jediné co by tedy mohlo společnost zpomalit jsou nové omezení na export top čipů mimo USA, nebo problémy na Taiwanu.

DEEPSEEK

Nová čínská hvězda na poli AI

Nová čínská hvězda na poli AI
v kostce:

DeepSeek, mladá čínská společnost založená v roce 2023 Liangem Wenfengem a financovaná jeho vlastním hedge fondem High-Flyer, v poslední době vzbuzuje pozornost celého AI světa. Jejich jazykové modely jsou na úrovni těch nejlepších close-source modelů OpenAI před cca 9 měsíci, ale o cca 95% levnější na provoz (také před 9 měsíci). To je o to pozoruhodnější, že Čína čelí omezením dovozu výkonných amerických čipů, takže musí těžit z potenciálně „osekaného“ hardwaru typu Nvidia H800.

Kvůli spekulacím o nákladech na vytvoření modelů V3 (konkurence GPT 4o) a reasoning modelu R1 (konkurence GPT o1-mini), a uvedení ve verzi open-source dokonce způsobili největší propad akcií Nvidia za jediný den. Předpokládalo se totiž, že tím pádem nebude potřeba, aby Nvidia produkovala takové množství čipů. Brzy se ukáže, zda podle Jevanova paradoxu poptávka naopak poroste a reakce investorů byly přehnané. Vzhledem ke spuštění projektu Stargate v USA a novým zjištěním o skutečných nákladech na vytvoření Deepseek modelů je to velmi pravděpodobné.

Spekulovalo se, zda nemá DeepSeek tajně k dispozici desetitisíce výkonnějších H100 GPU dovezených přes třetí země. A také zda skutečně porušili smluvní podmínky OpenAI a z jejich modelů “distilovali” data pro ty své. Americké úřady proto spustily vyšetřování, jestli DeepSeek neobchází restrikce a nevyužívá mezinárodní „kličky“ k získání čipů, které by v Číně oficiálně být neměly.

Realita je mnohem jednodušší, hedge fond High-Flyer nakoupil už v roce 2021 cca 10.000 chipů A100, tedy ještě před restrikcemi. Jejich využití bylo původně na algoritmické obchodování a od roku 2023 jich většina slouží k tréninku AI. Reálné náklady na vytvoření modelu Deepseek V3 tak rozhodně nebyly 6 mil. dolarů jak se spekulovalo, ale mnohem více. Jedna A100 (předchůdce současných H100, které dnes pohání moderní datová centra), vyšla v roce 2021 na cca 15.000 dolarů. To máme 150 milionů dolarů jen za čipy, přičtěte platy vědců, náklady na provoz a na vytvoření dat (pravděpodobně distilace GPT 4o přes OpenAI API).

podrobnosti:
  • DeepSeek-R1 reasoning model – nový model R1 před odpovědí přemýšlí tak jako o1 nebo o3 od OpenAI, a k tomu využívá techniku „chain-of-thought“. Model úkol rozdělí na kroky a postupuje krok za krokem, místo aby “slepě” generoval slovo za slovem.
    • V testech Arc AGI je na tom o trochu lépe než o1-mini a o3-mini low od OpenAI. Cena za používání API je 2,04 dolaru za milion výstupních tokenů v případě R1 a 4,4 dolaru v případě o1-mini i o3-mini. Ušetříte tak více než 50 % nákladů ve vašich aplikacích a automatizacích.
    • Bezpečné používání Deepseek modelů dnes můžete zajistit snadno - mají velký úspěch a jsou open-source, proto je už hostují americké firmy. V Perplexity Pro si můžete pro vyhledávání zvolit model R1, a platformy jako Groq nebo Together.ai poskytnou čínské modely přes API na vlastních serverech s rychlou odezvou i produkcí tokenů za sekundu.
    • Model je open-source tzn. že ho může kdokoliv použít nebo jakkoliv upravovat i pro komerční účely a je také k dispozici zdarma v chatbotu Deepseek, stačí kliknout na ikonku “DeepThink (R1)”.
    • V chatbotu navíc můžete pracovat s textovými a datovými soubory i s tímto reasoning modelem, to v zatím ChatGPT nejde. Jen pozor na citlivá data a co v konverzacích prozradíte.
    • Novinkou je také využití pouze tzv. učení s posilováním (Reinforcement Learning), díky kterému dnes žádný člověk nedokáže porazit AI ve hrách jako šachy, Go, nebo StarCraft. Model se tak v podstatě “sám” naučil přemýšlet o úkolu komplexně, a krok za krokem ho zpracovat.
    • Během tréninku se objevilo několik zajímavých jevů, například když se model spontánně naučil revidovat svůj vlastní postup, pokud narazil na nejistotu.
    • Vylepšená architektura MoE (Mixture of Agents), kterou už více než před rokem představil Google, stojí za úspěchem modelů Deepseek. Vylepšená architektura umožňuje používat vždy jen malou část z celé neuronové sítě. Z celkových 671 miliard parametrů neuronové sítě se tak vždy používá jen 37 miliard. Jsou tak mnohem levnější na provoz a přesnější v odpovědích, protože se odlišným úkolům věnují specializovaní “agenti”.
  • Výkonné datacentrum společnosti čítající 10 tisíc Nvidia A100 nyní také používá čipy od Huawei Ascend 910C optimalizované pro “inference”. Inference je v podstatě “přemýšlení” modelu a tedy samotný provoz. Díky tomu jsou schopni s nízkými náklady na provoz konkurovat OpenAI. Pokud se Huawei podaří vyrobit čipy na úrovni těch od Nvidia, budou v Číně schopni postavit AI infrastrukturu, přes všechny omezení dovozu čipů, mnohem rychleji než v USA.
  • DeepSeek-Coder je nový open source model, podporuje přes 80 programovacích jazyků a je samozřejmě zaměřen na programátory. V různých testech (HumanEval, MBPP) se umístil jako jeden z nejlepších otevřených modelů pro tvorbu a doplňování kódu.
  • Deepseek Janus generátor obrázků je samozřejmě také open-source, jako mají být do budoucna všechny modely společnosti. Na Midjourney samozřejmě nemá, ale je výjimečný tím, že je malý - 7 mld. parametrů (to rozběhnete i lokálně), rychlý a perfektně dodržuje zadání. Lidi ale moc generovat neumí a rozlišení zatím zvládá jen 384x384 pixelů.
  • V lednu unikla data 1 mil. uživatelů kvůli chybně zabezpečené databázi. Konkrétně konverzace, API klíče, nahrané soubory a technické detaily. Data nebyla zabezpečená po dobu 23 dní a díra v zabezpečení byla objevena náhodou až při rutinní kontrole.
proč je to důležité:

Je nad slunce jasné, že DeepSeek přinesl novou dynamiku do AI závodů a díky nim dnes máme všichni k dispozici lepší a levnější modely i nové funkce od lídra OpenAI. Protože jsou jejich modely plně open-source a méně náročné na provoz, nasazují je firmy do svých aplikací na vlastních serverech. Spousta AI aplikací tak dnes funguje lépe, protože mohou využívat chytřejší modely levněji a tak se vyplatí je do procesů nasadit. Někteří nadšenci dokonce přišli na to, jak spojením 7 M4 Mac-mini rozběhnout tu největší verzi Deepseek R1 (671B) lokálně.

Z technologického hlediska je tu další velký posun ve snižování nákladů na trénování a potenciálně efektivnější rozhraní než Nvidia Cuda. DeepSeek dokázal, že s chytřejšími algoritmy a mravenčí prací na aplikační a komunikační vrstvě se dá i na „pomalejších“ GPU vytrénovat obří model relativně levně. Pro menší firmy a výzkumné týmy to znamená možnost vlastního výzkumu a vývoje i rychlého prototypování. Provoz je samozřejmě stránka druhá, pokud chcete nakonec poskytovat služby stovkám milionům lidí nebo dokonce miliardám, bez obřího datacentra se neobejdete.

Možná že Číně naopak restrikce na dovoz čipů pomáhají najít jinou cestu - musejí přijít s inovacemi a to se jim daří. Tahle čínská firma dokázala v rekordním čase vytvořit modely schopné konkurovat těm nejlepším americkým. Pro koncové zákazníky i firmy je to skvělá zpráva a všem prospěje zdravá kvalitní konkurence. Vědecká komunita si také chválí způsob uvedení všech modelů nejen plně open-source, ale také s velmi kvalitní dokumentací. Ta umožňuje vědcům po celém světě navázat na jejich práci a modely vylepšovat či přizpůsobit vlastním potřebám.

ALIBABA

Další čínský drak v AI závodech

Další čínský drak v AI závodech
v kostce:

Alibaba, největší e-commerce hráč v Číně, se do AI závodů zapojil s novou generací rodiny jazykových modelů Qwen 2.5. Díky několika inovacím se nové modely dostaly na světovou špičku a v nečem i překonávají konkurenci. Po vzoru čínského Deepseek to zvládají levněji a efektivněji. Kromě vylepšené architektury Mixture-of-Experts (MoE), se jim podařilo vyřešit několik dalších problémů a Qwen Max dokonce dokáže sám opravovat svůj postup a zvýšit správnost odpovědí o 22%. Modelů uvedli celou stovku, od malých, které rozběhnete i na notebooku, až po ty, na jejichž provoz potřebujete výkonné datacentrum. Tím Alibaba disponuje a po konkurenčním Deepseek Alibaba potvrzuje, že v Číně nešlo o náhodu a jsou schopni konkurovat i po vědecké stránce.

podrobnosti:
  • Qwen 2.5 MAX je podle některých testů aktuálně lepší než Deepseek V3 nebo OpenAI GPT 4o. Je přitom jen o trochu dražší než V3 a sklízí na internetu pochvaly za kvalitu výstupů i rychlost.
    • 64 specializovaných „expertů“ (MoE) je jako u Deepseek základem jejich úspěchu. MoE nepoužívá celý model, ale vždy aktivuje jen ty části, které jsou relevantní pro konkrétní úkol. Tím se šetří výpočetní výkon, takže je i provoz velkého modelu výrazně levnější.
    • „Self-correction“ mechanismy v modelu Qwen 2.5-Max, umožní modelu se během generování zastavit, zhodnotit svůj postup a případně opravit chybu v řetězci logických kroků.
    • Problém „lost in the middle“ vyřešen — tedy tendence LLM zaměřit se jen na začátek a konec promptu — řeší zejména sparse attention, která umožňuje udržet pozornost i na informace skryté uprostřed dlouhého textu.
    • Plně multimodální - simultánní zpracování textu, obrázků, zvuku a videa. Dokáže analyzovat videa až do délky 20 minut a generovat vizuální prvky např. pomocí SVG kódu.
    • Qwen 2.5 MAX je jako modely od OpenAI uzavřený a proto zatím dostupný jen přes API například na Alibaba Cloud (Čína) nebo AWS (USA).
  • Alibaba zveřejnila přes 100 variant Qwen 2.5 s podporou 29 jazyků, modely zaměřené na generování textu, obrázků, práci s videem nebo na matematiku. Modely Qwen můžete bezpečně používat pokud jsou hostované na amerických serverech přes společnosti jako Together.ai a OpenRouter, ale najdete je i v AWS.
  • Výpočetní zázemí Alibaba zůstává částečně utajené, ale i tak je zřejmé, že k tréninku modelů na této úrovni byla potřeba robustní GPU infrastruktura, stejně jako v případě Deepseek.
proč je to důležité:

V čínském AI ekosystému rostou soupeři jako houby po dešti a pro zbytek světa to znamená více muziky za méně peněz. Náklady na provoz AI modelů tak během několika let nejspiš poklesnou natolik, že bude umělá inteligence skutečně dostupná kdekoliv a komukoliv podobně jako internet. Tedy pokud nepočítáme cca miliardu lidí, která má zcela jiné starosti, jako například stabilní zdroj elektřiny či pitné vody. Čína navíc exceluje v robotice, dronech a elektromobilech a tam doteď chyběl chytrý mozek, aby mohly být plně autonomní.

Další modely vyvíjejí hráči jako Baidu a Tencent, a čínská scéna začíná šlapat na paty americkým i evropským výzkumníkům a startupům. Také jsou aktivnější a pracovitější v reálném nasazení AI řešení a tak mohou náskok Google a OpenAI brzy dorovnat.

bleskovky

Trump ruší Bidenův exekutivní příkaz ohledně AI rizik okamžitě po nástupu do úřadu. Nařízení mělo donutit vývojáře rizikových AI systémů sdílet bezpečnostní testy s vládou. Podle Nvidia to ohrozí technologický pokrok USA a sníží jejich konkurenceschopnost, protože vláda ztrácí kontrolu nad kritickými technologiemi.

Bílý dům omezujeprodej nejvýkonnějších GPU pro AI vybraným státům, ale výjimku mají spojenci a organizace s objednávkami pod 1700 GPU. Překvapivě chybí Izrael, ačkoliv NVIDIA nedávno koupila tamní firmu, a sama společnost kritizuje omezení jako brzdu pokroku pod záminkou boje s Čínou.

Perplexity AI asistent pro Android a Sonar API - Asistent využívá kontext obrazovky pro akce jako shrnutí článku nebo doporučení při nakupování, jako výběr podle kritérií. Dokáže napsat email nebo SMS nebo vytvořit upomínku podobně jako Google Assistant. Sonar API umožňuje integrovat schopnost vyhledávání na internetu do aplikací a automatizací a to včetně odkazů na zdroje. Pokud jste zákazníci T-Mobile můžete si do května tohoto roku zařídit předplatné Perplexity pro zdarma na 12 měsíců! Pokud nemáte T-mobile, můžete využít podobné nabídky k platebnímu účtu Revolut.

Microsoft open-source MatterGen generuje nové materiály s požadovanými vlastnostmi. AI model dokáže navrhnout nové materiály např pro baterie, magnety nebo palivové články a to jen na základě promptu. Byl vytrénován na 68 000 stabilních materiálech a funguje podobně jako generátory obrázků, ale místo pixelů upravuje chemické prvky a krystalické mřížky. Model je dostupný na Githubu a mohl by urychlit vývoj v energetice i průmyslu a nahradit současné metody typu pokus-omyl.

Google „Daily Listen“ generuje podcasty na základě vašich zájmů a historie článků které, jste četli přes Google zprávy. Jde o další krok k personalizované automatizované tvorbě obsahu na míru.

Microsoft představil Large Action Model (LAM) – AI, která dokáže efektivně generovat přesné akční plány, autonomně ovládat programy ve Windows a vykonávat běžné akce jako klikat, zadávat text či manipulovat s dokumenty. V testech LAM dosáhl 71 % úspěšnosti splnění úkolu a úkoly dokončil v průměru za 30,42 sekund. Více ve studii Microsoftu.

AI tools

Reader od ElevenLabs přečte jakýkoliv text i e-knihu, kterou do mobilní aplikace nahrajete. Hlasem dle vašeho výběru vám pak texty perfektně přečte a umí skvěle Česky. ElevenLabs jsou dlouhodobým lídrem v oblasti generování realistického hlasu. Aplikaci si stáhnete pro Android i Apple a je zdarma.

Gamma AI na pár kliknutí generuje nádherné prezentace, dokumenty i webové stránky z textového popisu. Nabízí šablony, drag-and-drop úpravy a export do PPT/PDF. Vyzkoušet si ji můžete zdarma a předplatné začíná na 8 dolarech za měsíc.

Descript AI video editor dokáže editovat video jako když upravujete dokument ve Wordu. Můžete mazat text v transkriptu videa a vystříhne se patřičná část. Na pár kliknutí také vystříhnete všechny promlky nebo “eeeeeh” apod. Ušetří vám spoustu času s finalizací vašich videí a zvládnete to sami. Vyzkoušet si to můžete zdarma a předplatné začíná na 19 dolarech měsíčně.

Make je velmi jednoduchá no-code aplikace pro automatizaci procesů jako je například třídění emailů, doplňování dat do tabulek v excelu, ale v podstatě téměř čehokoliv. V Make se můžete napojit na tisíce aplikací jako CRM systémy, messengery, aplikace Google Workspace. Pak stačí jen načíst data z jedné aplikace (např. Gmail), pomocí AI je upravit a vložit do jiné aplikace (např. Tabulky Google).

Riffusion je generátor hudby a konkurence známých aplikací jako Suno a Udio. Jejich poslední model Fuzz dokáže generovat 3-4 minutové skladby na základě vašeho promptu, klidně s nazpívaným textem, nebo vytvořit cover verzi vašeho audio souboru. A to nejlepší, je zcela zdarma a můžete si generovat tolik skladeb než se jim uvaří servery.

případová studie

Vytváření popisků pro e-shop

O jaký problém šlo?

E-commerce společnost se potýkala s časově náročným procesem manuální tvorby a aktualizace produktových popisků. S více než 5.000 produkty v nabídce a pravidelnou sezónní obměnou sortimentu bylo nutné vytvářet stovky popisků měsíčně. Copywriteři museli ručně přepisovat technické specifikace a přizpůsobovat jazyk jednotlivým kategoriím produktů. Výsledkem byly nekonzistentní texty různých autorů a časté chyby v parametrech. Navíc trvalo 3–5 dní, než se nové produkty dostaly do prodeje.

Řešení pomocí AI:

Nasadili jsme jednoduchého AI agenta, kterého jsme vytvořili v no-code nástroji Make a integrovali ho s WordPress a WooCommerce. S pomocí vlastních doplňků přes API jsme celou automatizaci ještě vylepšili a vytvořili jednoduché rozhraní pro zadání úkolu pro agenta. AI nyní generuje konzistentní popisky podle předem definovaných šablon a automaticky optimalizuje obsah pro vyhledávače. Texty jsou následně předány redakčnímu týmu k rychlé kontrole a schválení. Celý proces probíhá v reálném čase, což umožňuje publikovat nové produkty během několika hodin.

Výsledky (přínos pro SME):

Automatizace zkrátila čas tvorby popisků z 2 hodin na produkt na 15 minut, čímž se ušetřilo 30 člověkohodin měsíčně. Roční úspora nákladů dosáhla 210 000 Kč. Počet chyb v popiscích klesl o 90 % a nové produkty jsou nyní online do 24 hodin. Zaměstnanci se mohou věnovat kreativnějším úkolům, což zvýšilo efektivitu celého týmu. Investice do AI se vrátila za 4 měsíce a systém je připraven na budoucí expanzi na zahraniční trhy.

Prompt měsíce

Tentokrát to nebude o jednom promptu, ale máme pro vás inspiraci jak využívat Perplexity jako superuživatel a získat cenná data pro váš byznys. Ideálně využijte “Pro” vyhledávání, máte jich 5 denně zdarma ve free verzi a vyberte model DeepSeek R1 (malá šipka vedle přepínače “Pro”).

Nezapomeňte nahradit text v hranatých závorkách!

děkujeme za pozornost

Váš Libor Kovář

AI našeptávač, šéfredaktor a zakladatel AI Inovace s.r.o. | www.aiinovace.cz

Napište nám: aihorizons@aiinovace.cz

Aktuální newsletter naleznete také na síti LinkedIn

Návody a tipy najdete na Youtube kanále Umělá inteligence pro každého