#74: Apple vyměnilo auta za AI
Jak jsou na tom české firmy s AI? Pár zkušeností vám s tím zprostředkuji. Nvidia má nový superčip a Apple se tlačí do AI, kde sice trošku zaspinkal, ale standardy jistě nastaví.
Dobrý den,
vítejte u mého březnového newsletteru. Budete se divit, ale zase se bude věnovat převážně umělé inteligenci 😇
🇨🇿 AI v českých firmách
Ale nejdříve pár zkušeností o AI z českých firem. Musím říct, že si svůj workshop, který pro firmy pořádám, užívám. Nejdříve jsem to bral jako takovou osvětu. Uklidnit emoce, nabídnout firmám hlubší seznámení s tím, co AI umí a expertní úvahu, jak se jich dotkne. Abych v tom měl řád, zavázal jsem se dělat právě dva workshopy měsíčně - víc nestíhám. A musím říct, že mě posouvá vidět rozmanitost a dotek praxe. Asi nejdrsnější zážitek byl, když jsem dorazil do firmy, povyprávěl o tom, jak AI ohrožuje místa středního juniorního personálu, abych zjistil, že těch osm lidí na workshopu jej dostalo jako součást rozlučkového balíčku, neboť je právě vyhodili, když jejich práci AI již nahradila. Nakonec z toho byla zajímavá diskuse, ale od té doby se významně více přeptávám, kdo na workshopu bude.
Asi nejvíce firmy uklidňuje, když jim říkám, že ačkoliv AI jde rychle kupředu, není nutné teď hned dělat prudké pohyby. Že je především třeba tlačit vnitřní připravenost, která firmě umožní naskočit do dění v momentě, kdy se objeví příležitost.
Co je vnitřní připravenost? Řada firem nemá vlastní datové sklady, čili vlastně neví, kde má data - jsou rozstrkaná po různých discích různých počítačů. Nemají procesy, čili není zřejmé, jak se data mají držet aktuální poté, co se jednou pořídí, pokud to jejich povaha vyžaduje. Data prostě nejsou samoorganizovatelná a pokud na nich AI má stát, je třeba je dát do pucu. To znamená zmapovat si firemní procesy, přesně si říct, kdo kam dává firemní projekty, prezentace, fotky, dokumenty, jak se třídí a jak se aktualizují. Pak, jednou, až přijde úžasný nástroj s AI, který by z těch dat dělal nějaký zázrak, jen vytáhnete platební kartu, nástroj zaplatíte a zázrak nastane napojením na váš datový sklad. Jasně, tohle je rada vhodná pro běžné české firmy, tyhle rozumy nechodím vykládat do Google nebo OpenAI.
Asi největší zájem je o průřez konkrétními nástroji, kdy si podle povahy firmy vybereme nástroje, jaké by jí mohly pomoci a ty si společně projdeme. Když si ukazujeme konkrétní workflow, které dnes s AI funguje. Nejčastěji doporučuji začít u vlastních dětí, tedy u toho, jak používat AI při probírání učiva s dětmi, protože to je něco, co dospělí potřebují a tím se přirozeně naučí používat AI pro úkoly, které jsou nakonec totožné s tím, co by s AI dělali ve firmě.
Zároveň vnímám rostoucí poptávku po programátorských firmách, které by u měly ohýbat či připravovat AI řešení a dělat datové konzultace. Tady musím říct, že plavu. Pár firem znám, ale vlastně málo - kdybyste měli doporučení na někoho, klidně mi pište (reply na tenhle email), nemyslím tím IBM...
Nové pojmy? "Pocukrovat produkt AI" - jakýkoliv způsob propojení produktu s AI, o který se může opřít firemní PR a prohlásit produkt za AI produkt a tím jej propašovat do médií jako něco lepšího.
Reklamní vsuvka: pořádám workshopy o AI ve firmách
Ukazuji firmám, jakou změnu pro ně představuje AI. Můj workshop AI ve firmách je společná interaktivní SWOT analýza toho, jak na vaši firmu dopadne umělá inteligence. Pojďme se nad tím společně zamyslet…
(Web jsem samozřejmě nechal vygenerovat AI 🤖)
🍎 Co Apple a umělá inteligence?
Společnost Apple provedla v poslední době několik zajímavých a pro budoucnost důležitých obratů, u kterých stojí za to se zastavit. Tak především zřejmě poslala k vodě projekt automobilu. Spálila na něm miliardu dolarů, zlanařila spoustu lidí a stejně to nevedlo k ničemu, co by firmu uspokojilo. Lidi z projektu autonomního vozu přesunula do AI.
V průběhu března představilo Apple svůj nový AI model jednoduše nazvaný MM1. To je model, který drží prst na tepu doby a v něčem ji i posouvá dále. Je multimodální, tj. umožňuje různé vstupy a výstupy, jak textové, tak obrazové. Používá Mixture of Experts MoE, tedy zkoumání kontextu. Líbí se mi to na následujícím příkladě, kde uživatel vyfotil stůl v restauraci, jídelní lístek a zeptal se, kolik bude účet. MM1 správně odpověděla.
To také znamená, že počty natrénovaných parametrů nejsou všechno. Ostatně, v parametrech MM1 nevyniká. GPT-4 má bilion parametrů, Claude 3 Opus 2 biliony. Oproti tomu MM1 od společnosti Apple s 30 miliardami parametrů bledne. I starší GPT-3 mělo 175 miliard parametrů!
V současné době přední modely umělé inteligence vydané OpenAI a Anthropic neobsahují možnosti generování videa. Naproti tomu MM1 vyniká schopností trénovat různé formáty, včetně obrázků, videa, zvuku a textových dat. Vize společnosti Apple je tedy dosti odvážná a zjevně stojí právě na té multimodalitě.
Tahle zpráva je důležitá ze dvou pohledů. Za prvé Apple přichází sice se zpožděním, ale také s novými přístupy a otevřeností vůči ostatním, protože své postupy hned publikuje. A za druhé, jeho vlastní LLM zřejmě není připraveno pro světla ramp. A s tím také koreluje pár dní stará zpráva, podle které Apple vyjednává se společností Google o tom, že by prozatím ve svých zařízeních používala jeho model Gemini podobně, jako například používala jeho mapy nebo vyhledávání. Apple by tak mohlo přijít na trh s dobrou AI již v další verzi iOS 18, což se po pravdě řečeno hodně čeká a bylo by zklamáním, kdyby to nebylo. Pro Apple by bylo podstatné představit LLM model fungující v zařízení, tedy bez toho, aby probíhala komunikace se serverem přes internet. Což Gemini Nano zvládá. Přehled Gemini modelů najdete zde.
Jak to změní rozložení sil v LLM se ještě uvidí. Bude záležet na tom, kolik úsilí do LLM Apple vrhne, například vytvoření jeho vlastních map trvalo Apple pět let. Jenže v LLM společnost usnout chtít nebude. Alespoň to tak vypadá.
Jak to bude s AI v iOS18?
Zde jsou některé zvěsti o nových funkcích umělé inteligence v systému iOS 18:
Nová verze Siri, která je inteligentnější a založená na technologii LLM, podobně jako platformy ChatGPT a Gemini společnosti Google - ale s plynulým napojením na hlasový vstup a výstup.
Nové funkce umělé inteligence pro Apple Music, které uživatelům umožňují automaticky vytvářet seznamy skladeb.
Integrace umělé inteligence do aplikací Pages, Keynote a Numbers pro shrnutí, tvorbu obsahu a další funkce.
Funkce AI pro Xcode, které umí doplňovat bloky kódu, pomáhají testovat aplikace a další.
Vylepšená verze vyhledávání Spotlight, která je poháněna generativní AI a dokáže provádět složitější úlohy.
Funkce wellness koučinku poháněná AI, která je integrovaná do Apple Health a Apple Watch.
Nové funkce AI pro aplikaci Zprávy, které umí automaticky doplňovat zprávy, odpovídat na otázky a shrnovat příchozí textové zprávy, navíc propojená se Siri, takže když Siri přikážete, aby se zeptala mámy, zda nepotřebuje s něčím pomoci, Siri odešle kvalitně natextovanou zprávu v tónu, jakým s mámou mluvíte.
🤖Nvidia má nový superčip a další novinky
V době, kdy byla Nvidia známá svými grafickými procesory pro hry a kryptografii, nebyla její konference NVIDIA GPU Technology Conference (GTC) tak velkou událostí. Ale teď, když je vedoucí společností na poli AI, jako by se všechno změnilo. Dnes je tato akce hlavní událostí pro inovátory, vývojáře a nadšence v oblasti umělé inteligence.
Nvidia dnes dodává přes 70% čipů pro AI a ještě silnější postavení má v dodávkách čipů pro trénování generativní AI. Dnes je jakýkoliv posun v AI nemyslitelný bez společnosti Nvidia. A ta také naplnila, co se od ní očekávalo.
Čipy H100 a H200 se staly hlavními procesory pro aplikace umělé inteligence a v posledních několika čtvrtletích pomohly zvýšit příjmy společnosti Nvidia z datových center. Jen v posledním čtvrtletí společnost vykázala příjmy z datových center ve výši 18,4 miliardy dolarů. Cena akcií společnosti Nvidia vzrostla pětinásobně a celkové tržby se více než ztrojnásobily od doby, kdy koncem roku 2022 odstartoval boom umělé inteligence projekt OpenAI ChatGPT.
Generální ředitel společnosti Nvidia Jensen Huang představil na konferenci nejnovější AI čipy společnosti: grafický procesor Blackwell B200 a "superčip" GB200 Grace Blackwell.
Čipy Blackwell společnosti Nvidia, pojmenované po matematikovi Davidu Haroldovi Blackwellovi, nabízejí oproti svým předchůdcům, čipům H100, výrazné zvýšení výkonu.
Huang uvedl, že čipy Blackwell jsou výrazně rychlejší než H100, jejich rychlost se pohybuje od sedmi do třicetinásobku, přičemž spotřebovávají jen zlomek energie - přesněji asi 25krát méně.
Nový grafický procesor B200 poskytuje výkon až 20 petaflopsů FP4, přičemž využívá svých 208 miliard tranzistorů.
Konfigurace GB200, která kombinuje dva grafické procesory B200 s jedním procesorem Grace, může poskytnout 30násobný výkon pro úlohy odvozování LLM a zároveň je potenciálně výrazně efektivnější. Nvidia tvrdí, že tato konfigurace může snížit náklady a spotřebu energie až 25krát ve srovnání s H100.
Huang zmínil, že v benchmarku GPT-3 LLM se 175 miliardami parametrů dosahuje GB200 přibližně sedminásobného výkonu oproti H100 při čtyřnásobné rychlosti trénování.
Podle společnosti Nvidia by v minulosti trénování modelu s 1,8 bilionu parametrů vyžadovalo 8 000 grafických procesorů Hopper a 15 megawattů energie. Nyní však tvrdí, že s 2 000 grafickými procesory Blackwell lze stejný úkol zvládnout s využitím pouhých čtyř megawattů energie.
Ačkoli společnost NVIDIA zatím nezveřejnila ceny čipů Blackwell, pozorovatelé v oboru předpokládají vysokou cenu, která je zpřístupní jen několika organizacím.
Společnost Nvidia také později oznámila projekt GR00T, novou iniciativu na vytvoření univerzálního základního modelu pro učení humanoidních robotů. Nvidia také dělá pokroky v oblastech, jako je robotika a partnerství v oblasti kvantových výpočtů.
Nvidia pokračuje v krasojízdě. A to tak razantně, že se u ní budeme muset někdy příště zastavit.
Reddit je na burze a prodá data do cizí AI
Ve čtvrtek Reddit úspěšně vstoupil na newyorskou burzu s tickerem "RDDT". Reddit u nás není tak známý, spíše mezi nerdy, v USA je označovaný za "titulní stránku internetu". Umožňuje sdílet a sledovat obsah témat, která vás zajímají. A dobře. Reddit je první významnou platformou sociálních médií, která vstoupila na burzu od roku 2019, kdy se to podařilo Pinterestu. Akcie této sociální platformy při svém obchodním debutu posílily o 48 % z ceny 34 dolarů při primární veřejné nabídce a chvílemi se obchodovaly i přes 50 dolarů za akcii, což byla krásná prémie. Otázka samozřejmě je, jak to bude dál.
Reddit totiž svůj obchodní model už několik měsíců nestaví na tom, že prodává reklamu. Za tu vloni utržil 800 milionů dolarů, ale také 90 milionů výsledné ztráty. Jenže z reklamy by nemohl růst slibovaných 20% ročně. Kde ten nárůst tržeb vezme? Z prodeje dat firmám, které se zabývají trénováním LLM modelů. On totiž Reddit má poměrně dosti pečlivě a dlouho (19 let) shromažďovaný a spravovaný obsah, miliony rad, návodů a dokumentů, které je skvělé použít pro trénink LLM. Jenže Reddit za to požaduje peníze, brání se tomu, abyste si jen tak nastahovali jeho data. A mimo jiné kvůli tomu schytává kontroverzi, protože řadě uživatelů to zase nevoní. Neměli dojem, že vkládají své rady a názory proto, aby na nich vyrostla umělá inteligence. Ale smůlu mají, to zase jo, podmínky to Redditu umožňují.
Drobky
Midjourney umí používat stejnou tvář ve více fotkách. Tohle byl častý požadavek - aby Midjourney umělo jednu osobu používat na více fotkách. Tak už umí. Funkce se jmenuje Consistent Charakter a používá se tak, že si vezmete URL vygenerovaného obrázku s tváří, kterou chcete použít a dáte tohle URL za parametr --cref a celý návod je třeba tady.
Elon Musk opensourcuje Grok! Co by to bylo za newsletter, aby v něm nebyl Elon Musk. Muskův startup xAI se chystá otevřít zdrojový kód LLM Grok jako open source. Což je zajímavé, ale vcelku očekávané - Muskův Grok zatím nezaujal svými výkony (ne pozitivně) a být otevřeným by mu pomohlo v boji o tržní podíl. Dlužno dodat, že zatím se mezi OOS modely prosazuje především LLAMA společnosti Meta a Mixtral od francouzského Mistral AI.
Umělá inteligence v Pulitzerově ceně! Pulitzerova cena za žurnalistiku poprvé vyžadovala, aby účastníci ve svých příspěvcích zveřejnili použití umělé inteligence. Pět ze 45 finalistů přiznalo, že umělou inteligenci ve svém výzkumu nebo zpravodajství použilo.
Videomodel Sora od OpenAI, který vzbudil tolik diskuse o budoucnosti Hollywoodu, zatím veřejně dostupný nebude. Uvedl to šéf vývojového týmu Aditya Ramesh. Projekt je v současné době ve fázi výzkumu bez definitivního časového plánu pro vydání produktu.
Neuralink, startup Elona Muska zaměřený na mozkové čipy, živě přenášel svého prvního pacienta, kvadruplegika Nolanda Arbaugha, který prostřednictvím zařízení Neuralink hrál počítačové hry výhradně svou myslí. Na záběrech je vidět, jak Arbaugh ovládá kurzor počítače pouze pomocí svých myšlenek a hraje hry, jako jsou šachy a Civilization VI.
Google představuje VLOGGER. Je to nový framework pro syntézu lidí ze zvuku. Při zadání jednoho vstupního obrázku, jako jsou ty zobrazené v prvním sloupci, a vzorového zvukového vstupu generuje naše Vlogger fotorealistická a časově koherentní videa mluvící a živě se pohybující osoby. Jak je vidět na syntetizovaných snímcích v pravých sloupcích, generujeme pohyb hlavy, pohled, mrkání, pohyb rtů a na rozdíl od předchozích metod i gesta horní části těla a rukou. Zatím o Vloggeru vyšel jen článek, služba není online dostupná.
Zajímavé nové služby
Heardly - nabízí patnáctiminutový výcuc z audioknih tak, abyste dostali ty nejdůležitější myšlenky v mobilní apce. Aplikace umí knihy načítat v nejrůznějších jazycích, tváří se, že i čeština, ale nějak mi to nefachá. Snad to opraví. Pokud jste OK s angličtinou, tak už teď je to super. Cena 350 Kč měsíčně, sleva na rok.
AI Subtitle od RecCloud umí samo dodělat titulky do vašeho videa a případně je přeložit do jiného jazyka. Pokud děláte s videem, vyplatí se RecCloud služby si projít.
Suno - vytvoří vám písničku hudbu podle zadání, tedy včetně naspívané lyriky. Pro všechny uživatele byla uvolněna třetí generace, která je opravdu dobrá. Takhle jsem si vytvořil písně ke Špiclovi páně jako chorus, tedy je druhá varianta.
Tak a to je pro dnešek všechno!
Vše nejlepší do nového týdne přeje
Patrick Zandl
PS: Newsletter byl rozeslán na 3086 adres.