#90 🍏 Apple to s AI stále neumí. Jaro přineslo nové LLM modely. Jaké jsou?
Apple Inteligence nabírá zpoždění, přijde spíše v roce 2027, než letos. Proč? A jaké jsou novinky v AI modelech? Jak si vybrat ten nejlepší?
Dobrý den,
vítejte u březnového newsletteru. Světem hýbe Donald Trump - o tom se dočtete v mém ebooku. A pak umělá inteligence, o tom se dočtete dále :)
eBook Technoelity a nástup broligarchie
Vydal jsem konečně ebook Technelity a nástup broligarchie. Pokud jste si ho předplatili, přišel vám již odkaz ke stažení, pokud byste se chtěli dozvědět, jak je to s dnešními šéfy technologických firem, kteří jsou přesvědčeni o své neomylnosti, podporují Trumpa a dělají další zajímavé věci, můžete si jej za 280 Kč koupit zde.
Vystoupení ve Standa show
Byl jsem pozván do Standa Show, video a odkaz na plnou verzi rozhovoru najdete zde. Téma bylo původně AI a technologie, ale se mnou to vždycky sklouzne, tu a tam k politice, tu k něčemu jinému. Ukázku najdete zde, po přihlášení plná verze.
Technologická závislost Evropy
Běží debata, jak moc je Evropa technologicky závislá na USA a jak se to může dotýkat armády. Tak dvě rychlé srovnání:
Projevy a přednášky zajímavých lidí
Relativně často překládám nějaké zásadnější veřejné projevy. Udělal jsem pro ně nyní na Marigold.cz rubriku, abyste je snadno našli (a ještě jsem ji nedal do menu). Výběr posledních projevů a přednášek:
Surya Ganguli - Může se umělá inteligence vyrovnat lidskému mozku?
Victor Riparbelli - Stane se z nás poslední generace, která bude umět číst a psát?
Ed Newton-Rex - Jak modely umělé inteligence kradou tvůrčí práci - a co s tím
John Tasioulas - Proč je umělá inteligence hrozbou a jak ji využít pro dobro věci
Alice Delorme Benites - Jak ovládnout umění psaní s umělou inteligencí
Ray Kurzweil - Posledních šest desetiletí umělé inteligence - a co bude dál
🍏 AI v mobilech: zpoždění (ano, mluvím o tobě, Apple)
V Barceloně právě probíhal Mobile World Congress 2025 - kde jsou ty doby, když jsem tam každý rok zvědavě jezdil. Jenže pořád je tam co vidět, mobilní firmy zde představovaly své nové vize soužití mobilů a AI. Samsung zde představil Galaxy S25, které nabízí pokročilé funkce umělé inteligence, jako je Gemini pro integraci aplikací, Circle to Search pro inteligentní vyhledávání nebo Gemini Live pro personalizaci fotoaparátu. Střední řada Galaxy A pak zpřístupňuje AI širšímu publiku, přičemž klíčovou funkcí je například nástroj Object Eraser a dlouhodobá softwarová podpora.
Musím říct, že jsem se na tyhle funkce v Androidu díval, abych zjistil, proč je jejich používanost relativně malá. Nejde jen o to, že je dosud nabízely jen dražší modely, ale také o to, že to nefunguje nijak zásadně dobře. Object Eraser na Pixelu odstraní ptáka z oblohy, ale na náročnější úkoly si nastartujte počítač.
Po pravdě, podobně to má zjevně Apple. A ještě hůř. Dlouhodobě se totiž očekává, kdy Apple doplní AI do iPhone a obecně do svého ekosystému. Nějaké drobky Apple již pustil, například vyříznout postavy z fotky umí už docela dlouho, ale větší úkoly ohlášené před nějakou dobou Apple stále odsouvá. Dosti to kontrastuje s nedávno představeným Alexa+ od Amazonu. Alexa+ je asistentka, kterou pohání umělá inteligence a se kterou si můžete normálně povídat. Zatímco původní Alexa uměla jen pár úkolů, Alexa+ je normální LLM s hlasovým rozhraním. Podobné rozhraní nabízí již OpenAI nebo i Google, jen Apple stále ne. Navíc se ukazuje, že odklad půjde daleko za stávající verzi iOS 18 - pravděpodobně se Siri s AI nedostane do mobilů před rokem 2027, neboť byla odložena na iOS 20. Ano, omezená Siri je plánována na květen 2025, tedy skoro rok od oznámení (ale může za to zlá EU, pamatujete?), o rok později přijde rozšířená Siri, ale něco podobného Alexa+ přijde až spíše 2027. Apple pociťuje několik limitů: tím prvním je, že nemá dostatek AI čipů pro trénování a testování, tím horším je, že nemá dostatek AI specialistů. Ti odcházejí ke konkurenci. Důvody nejsou jen finanční, jakkoliv startupové bonusy v začínajících firmách jsou velkým táhlem. Jsou tu také pochybnosti o efektivním vedení Apple AI týmu. S AI to v Apple vypadá podobně, jako kdysi s jeho automobilovým týmem: pálí se hromada peněz, ale výsledky se nedostavují.
Tím třetím důvodem je přístup Apple, který chtěl řadu věcí zpracovávat v malém LLM přímo na mobilu a jen ty větší úkoly předávat do cloudu ke zpracování. Jenže i malé LLM vyžaduje hromadu paměti a tu iPhone tradičně nemají, 16GB je i pro menší úlohy relativně málo. Jenže Apple by zase rádo tvrdilo, jak dbá na bezpečnost dat a jak je lokální zpracování lepší a bezpečnější. Inu, bylo by, kdyby se dařilo. Zatím nedaří.
Oficiálně nicméně nebylo oznámeno nic. V každém případě, pokud jste natěšení na to, že vám váš iPhone podá souhrn o došlých emailech, ideálně hlasově, zatímco si čistíte zuby, letos s tím nepočítejte.
Ani příští rok.
🤖 Nové AI modely - není to přelom, je to posun!
Všichni se předháněli v tom, aby napsali o GPT-4.5 a Claude Sonet 3.7 a dalších nových umělointeligenčních modelech. Já jsem jen krátce referoval pro sociální sítě a pustil se do testování.
Především je třeba říct, že k průlomu nedošlo. Všechny nově představené LLM jsou skvělé, ale pro běžného člověka začíná být situace nepřehledná. Máte použít o1, o3-mini, o3-mini-high nebo 4o či snad 4.5, pokud používáte ChatGPT? Jistě, pokud je používáte přes API, liší se modely cenou, ale jinak? Za prvé jsem vám k tomu udělal přehledovou tabulku, na co jsou vhodné nejdůležitější modely - najdete ji na Marigold.cz v rubrice AI nebo přímo zde.
Ne každému se bude chtít v každý moment studovat tabulku. Je zřejmé, že vše spěje k postupné integraci, kdy po zadání promptu dojde nejprve k rychlé analýze, podle níž se rozhraní rozhodne, jaký model je pro tento prompt nejlepší. OpenAI o tom již mluví, zatím to ale není a je zbytečné se tím teď zabývat.
Deep Research má Google, Anthropic, Perplexity i OpenAI
A jaké jsou inovace? Tak zaprvé je skvělá konkurence v Deep Research, tedy v Hlubokém průzkumu. Je to skvělá funkce, když chcete něco méně známého vyzkoumat. Jestli chcete vědět, zda se do halušek dávají brambory nebo pomeranče, na to je Deep Research poněkud overkill, ale jestli chcete prozkoumat náročnější téma, je super. Například já jsem pomocí někoho připravil tu tabulku srovnávající AI a velmi rád Deep Research používám pro zkoumání všech větších pracovních témat. Jenže není Deep Research všude stejný. U modelu Claude je patrné, že to tam Anthropic dotlačil na sílu, není to moc dobré a komplexní, Perplexity je mnohem dále a podle mého názoru, minimálně v češtině, vede OpenAI.
Nové LLM - krátké představení
Od února 2025 bylo představeno několik nových velkých jazykových modelů (LLM), které přinesly pokroky v oblasti generativní AI.Vezmu jen ty významné pro náš trh nebo globálně, vynechám novinky v čínských modelech jako alibabácký QwQ-32B, nemají žádné excelentní výsledky pro češtinu a míchají zatím jen čínským trhem.
GPT-4.5
Vývojář: OpenAI
Datum vydání: 27. února 2025
Počet parametrů: Neznámý
Velikost kontextového okna: 128 000 tokenů
Popis: GPT-4.5 je největší model OpenAI k dnešnímu dni, který překonává GPT-4o v mnoha testech. Není však zaměřen na hluboké uvažování, ale na široké znalosti získané z masivního datasetu. Je dostupný prostřednictvím API a je považován za poslední model před očekávaným GPT-5. Pětka má být uvedena v nejbližších týdnech, údajně.
Claude 3.7 Sonnet
Vývojář: Anthropic
Datum vydání: 24. února 2025
Počet parametrů: Odhadem přes 200 miliard
Velikost kontextového okna: 200 000 tokenů
Popis: Claude 3.7 je hybridní model, který kombinuje běžné funkce LLM s "rozšířeným myšlením". Uživatelé mohou nastavit čas pro jeho "myšlenkový proces", což zvyšuje kvalitu odpovědí. Model je oblíbený pro kreativní úkoly a programování.
Grok-3
Vývojář: xAI
Datum vydání: 17. února 2025
Počet parametrů: Neznámý (Grok-1 měl 314 miliard)
Velikost kontextového okna: 128 000 tokenů
Popis: Grok-3 je integrovaný do platformy X (dříve Twitter) a nově má i samostatný web zdarma - grok.com. Exceluje v práci s aktuálními informacemi díky přístupu v reálném čase. Nabízí režimy "Big Brain" a "Deep Search" pro hlubší analýzu dat.
Gemini 2.0 Flash-Lite a Gemini 2.0 Pro
Vývojář: Google DeepMind
Datum vydání: 5. února 2025
Počet parametrů: Neznámý
Velikost kontextového okna: Flash-Lite: 128 000 tokenů, Pro: až 2 miliony tokenů
Popis: Tyto modely jsou zaměřeny na pokročilé multimodální úkoly a jsou optimalizovány pro dlouhé vstupy díky velkým kontextovým oknům.
Mám-li nové modely hodnotit, tak musím říct, že OpenAI stále obecně vede a stále platí, že pro kvalitní češtinu a programování je nejlepší Sonet 3.7. Grok je opravdu nabušený, ale stříká to z něj, s jeho výstupy jsem nikdy nebyl spokojen, vyžadovaly příliš mnoho úprav, ačkoliv fakticky byly správné. Plus se musím přiznat, že v poslední době mi firmy Elona Muska nevoní, nakonec kvůli tomu musím odložit i nákup nového vozu, protože Tesla to nebude - a u ostatních značek si zjevně musím ještě počkat.
A jak jsem s kvalitou nových LLM spokojen?
V první moment jsem žádné změny nevnímal, ale postupem času, při rutinním používání vidíte, jaký pokrok byl učiněn. Letošní generace velkých modelů nabrala odhadem dalších dest bodů IQ. Jasně, pokud jste dříve LLM používal pro setřídění seznamu jmen podle abecedy, zásadního rozdílu si nevšimnete, ale já je používám pro pomoc při psaní a tam je rozdíl mezi OpenAI 4o nebo 4.5 dosti rozpoznatelný.
Pro řadu projektů ale začíná být problém najít nějaký sweet spot, optimum mezi cenou a moderností a na to se používají staré modely.
🐞Claude Code - programování bez programování
Na tuhle funkci musím upozornit. Ona je to spíše aplikace. Minule jsem tu psal o vibe coding a Antrhopic, jehož modely jsou tradičně pro programování nejlepší, na tuhle vlnu naskakuje. Vytvořil aplikaci Claude Code, která se integruje do Terminálu a prostě s vámi vyvíjí. Vy jí v terminálu říkáte, co má dělat a ona to dělá. Jenže: přihlásí se k vašemu Claude účtu a inkasuje za dotazy. Za den práce jsem utratil 6 dolarů, není to mnoho, ale ani málo oproti ostatním.
Co jsem vyvíjel? Potřeboval jsem naprogramovat script, který stáhne z Youtube videonahrávku zasedání zastupitelstva, převede ji do textu a z tohoto textu mi udělá souhrny témat, o kterých se hovořilo a jak se k tomu kdo stavěl. Kdysi nemyslitelná věc, před dvěmi lety extrémně obtížná, vloni dost práce. Teď cinklo na kartě šest dolarů a mám ten Python script hotový…
Důležité je, že Claude Code se umí integrovat s Githubem, čili deployment a veškerá práce s kódem jsou najednou velmi jednoduché, už žádné kopírování z okna do okna, jen koukáte na obrazovku, kde se míhají stavové informace a tu a tam jste dotázáni, zda s postupem souhlasíte.
Osobně doporučuju vyzkoušet i lidem, kteří sami kódu nerozumí. Musím se přiznat, že v Claude Code jsem se do toho kódu ani nedíval, nechal jsem to všechno na Claude.
Tohle je Budoucnost vývoje aplikací!
vše nejlepší do nového týdne přeje
Patrick Zandl
PS: Newsletter byl zaslán na 3672 adres.