#75: Jak na zápisy ze schůzek a porad pomocí AI aplikací (plus Tesla a Apple novinky)
Praktický návod, jak pořizovat pomocí AI zápisy ze schůzek. A pár novinek Apple i Tesly - Tesla získala příslib spuštění FSD v Číně a Apple se pere s umělou inteligencí.
Dobrý den,
vítejte u květnového vydání Patrickova newsletteru.
Co nového ve světě techniky? Bílý šum. Takový ten šum, který naznačuje, že se něco děje, ale nic z toho není tolik pro koncového uživatele podstatné.
Pro mě nejdůležitější nakonec bylo obnovení mého webu Marigold.cz. Vloni jsem jej přestal provozovat, ale fakt je, že řada materiálů už chyběla i mě, takže jsem jej převedl na Github Pages, nahrál tam články za posledních pět let a postupně budu přidávat i starší články. Přeci jen to za dvacet let byla kronika technologií a i nadále to chci používat jako rozcestník na moji práci.
💡Workshopy AI ve firmách
Pokračují moje workshopy AI ve firmách, kde řešíme, jak se jednotlivých firem dotkne AI a co mají dělat pro to, aby její nástup zachytily. Ještě mám volný termín v květnu. Detaily o workshopu jsou zde.
✅ Co nového ve světě techniky?
Nejvíce excitující je čekání na květnové uvedení nových Apple produktů, tady zřejmě půjde o nové iPady, které budou rychlejší, lepší, hezčí - a to je to, co bychom čekali, to je zbytečné zmiňovat.
🍏 Apple se pere s umělou inteligencí
Samo vyvíjí vlastní AI řešení, vydalo několik vědeckých zpráv o technologiích, které umožňují rychlejší trénování nebo lepší chod AI v rámci zařízení s omezenými zdroji, typicky v mobilu. A všichni napnutě vyčkávají, jak to bude s iOS 18 - a jestli tam Apple nic z AI nepředstaví, tak jej upálí. Apple si to zjevně uvědomuje, takže podle zpráv vyjednává s Google i OpenAI o možnosti použití jejich AI v rámci Apple technologií. K čemu, s kým a jak, to se zatím samozřejmě neví. Ale jejich nové uživatelské rozhraní nazvané Ferret nevypadá špatně (zde vydaná výzkumná zpráva o něm).
Novinkou ze strany Apple je pak vydání otevřeného LLM nazvaného OpenELM. Ten využívá strategii škálování po vrstvách k efektivnímu přidělování parametrů v rámci každé vrstvy transformačního modelu, což vede ke zvýšení přesnosti. Zjednodušeně řečeno má být trénink takového modelu levnější a výstup z něj rychlejší i přesnější. Pro zájemce je model na GitHubu a k dalšímu hraní na Hugging Face.
Nervy trhu na pochodu dokladuje údajné uvolnění GPT-5 do betaprovozu v rámci jedné služby, kde se objevil model nazvaný GPT2-Chatbot - a prý je to tajně testované GPT-5. Model sám říká, že je založený na GPT-4 technologiích. Sice jsou jeho výsledky pozoruhodné, spíše se ale také přikláním k názoru, že jde o nějakou zkušební verzi modelu vyvíjeného OpenAI a uvolněné v rámci zvyšování paniky, ale ne o testované GPT-5. Velmi názorné je vynechání onoho lomítka - mohlo by jít o druhou generaci GPT, ne o druhou verzi z roku 2019… Ale nepředbíhejme, uvidíme :)
Github uvolnil Copilot Workspace, což je nástroj pro vývojáře, který jim umožňuje dokončovat funkce a řešit chyby pomocí AI.
OpenAI uvolnilo funkci Memory, která umožňuje zapamatovat si data a přenášet je přes jednotlivé relace, čili rozhovory. Můžete ji tak nechat si zapamtovat třeba vaše oblíbené zvíře nebo kusy textů. Zatím to ale nefunguje v EU a Korei, jinak byste si to mohli povolit v nastavení.
Společnost Meta vydala model Llama 3 8B a 70B s výrazně vyšším výkonem, zejména v oblasti argumentace, délky kontextu a kódu. Stále trénuje model s parametry 400B, který se výkonem vyrovná modelu Opus. Tyto modely jsou nejvýkonnějšími dostupnými open source modely a za týden od vydání mají přes milion stažení. Pokud potřebujete použít model u sebe, vyplatí se podívat na Llamu (a ještě Mixtral).
Boston Dynamics vydal nové humanoidní roboty, které si nikdy nekoupíte, ale je zajímavé vidět je na videu a jsou dalším výrazným posunem na poli robotiky. Zlom to ale opět není.
A protože se v dubnu jinak nestalo v technice nic tak podstatného, podíváme se na moje stěžejní téma, které se probírá snad na všech mých firemních workshopech věnovaných umělé inteligenci. Čím by vám konkrétně AI mohla pomoci? Třeba tím, že za vás udělá zápis z porady.
🚘 Tesla získala příslib spuštění FSD v Číně
Elon Musk se velmi překvapivě zjevil v Číně, kde se setkal s nejvyššími vládním představiteli. Jeho rychlá cesta souvisela s vyjednáváním o umožnění provozu autonomního řízení v automobilech Tesla nazývaného FSD. Tesla sice nabízí systém FSD v Číně již čtyři roky za předplatné, ale s omezeným souborem funkcí, které systém omezují na operace, jako je automatická změna jízdního pruhu. Nově má Musk příslib schválení FSD v Číně do provozu, reportuje WSJ. Jen tak mimochodem, datové podklady dodá Baidu, potvrdila Tesla…
Klíčovou překážkou plného rozšíření byly problémy se zabezpečením dat. Musk se snaží získat oficiální souhlas s přenosem dat shromážděných v zemi do zahraničí, aby mohl trénovat algoritmy pro své technologie autonomního řízení, což je v rozporu s čínskou legislativou. Podle ní tato data zemi opustit nesmí. A tak od roku 2021 Tesla ukládá veškerá data shromážděná svou čínskou flotilou v zemi, jak vyžadují čínské regulační orgány, a žádná nepřevádí zpět do Spojených států.
Na znamení pokroku, který by mohl vést ke spuštění neomezeného FSD v Číně, se vozy Tesla Model Y a 3 dostaly na seznam 76 modelů automobilů, u nichž přední čínská automobilová asociace zjistila, že splňují čínské požadavky na zabezpečení dat.
✍️ Zápis z porady či jednání pomocí umělé inteligence
Jednou z aplikací umělé inteligence, kterou používám prakticky rutinně, je zápis ze schůzky, porady či jednání. Pojďme se podívat na to, jak to funguje.
V poslední době totiž nastal boom aplikací, které službu shrnutí či zápisu umožňují a řadu z těchto aplikací lze prakticky používat i v češtině. A tím je třeba začít: nebudu zmiňovat aplikace, jako je Otter, dnešní leader trhu, ten ale podporuje jen angličtinu a s jinými jazyky u něj neuspějete.
V českém prostředí jsem vyzkoušel Wave AI, Summie, Lush a MinutAI, u ostatních jako Osmo nebo Otter jsem neviděl podporu češtiny. A pozor, aplikace jsou pro iOS a iPhone, pro Android jsem jejich verzi neviděl.
Jde o mobilní aplikace. Nainstalujete si je do svého mobilu a na začátku schůzky prostě spustíte nahrávání, po konci jej ukončíte a data se odešlou do cloudu. Proto je třeba dát si pozor na to, zda jste na WiFi a případně přenos odložit, data nebývají příliš komprimovaná a z jedné hodinové schůzky odešlete větší desítky megabitů dat, pokud máte ostřejší limit dat na mobilu, můžete být rychle na dně. Je potřeba si to hlídat a případně data ke zpracování odesílat až z wifiny.
Jak je to s cenami?
Jak je to s kvalitou rozpoznávání?
Aplikace zjevně využívají jeden STT kromě Lugh. Jeho schopnost přepsat češtinu mi přišla nejhorší, záhy jsem ho přestal používat. Schopnost rozpoznat český hovor u ostatních aplikací mi přišla velmi podobná s tím, že nejlepší bylo subjektivně Summie, pak MinutAI a mírně slabší Wave AI. Do jisté míry bylo zajímavé, jak se AI vyrovnala s překřikováním a situací, kdy lidi mluvili najednou. V zásadě vždy to AI nějak přepsala, ale v analýze potlačila, zřejmě pod dojmem toho, že taková pasáž nebyla důležitá a sloužila jen k ujasnění východisek, které byly později znovu řečeny ve větším klidu.
Bylo pro mě překvapující, že když jsem se u aplikace podíval do kompletního přepisu, ten mi nebyl příliš k užitku a prakticky nikdy jsem ho nepoužíval.
A co schopnosti?
Aplikace s podporou češtiny jsou většinou dost jednoduché a umožní jen nahrání schůzky, její analýzu a export dat. Nejkomplexnější je Summie, to dokonce rozpoznává mluvčí a také se můžete expost doptat na to, co ze schůzky vyplývá. Rozpoznání mluvčího vypadá jako stěžejní funkce, ale nepřijde mi to tak podstatné v případě, že ze schůzky potřebujete hlavně zaznamenat závěry. Ty nezáleží na mluvčím. Pokud potřebujete zapisovat argumentaci, stejně budete potřebovat si zápis projít a pro jistotu zkontrolovat a doplnit, kdo je mluvčí kterého argumentu.
Aplikacím jsem mírně přizpůsobil průběh jednání - hlavně ve slovníku. Například v momentě, kdy se dohodneme na dalším postupu, pro jistotu ještě jednou zopakuje, že jsme si tedy dohodli další akční bod nebo úkol a zopakuji jej. Jenže ono to nepomáhá jen AI, ale i lidem na jednání…
Summie nově přidalo možnost záznam ze schůzky udělat v rapperské verzi, musím přiznat, že poprvé mě to docela šokovalo, protože jsem do toho zápisu koukal a nějak jsem nepobíral, o co jde.
Zatím to není tak, že zápis by byl zcela bezúdržbový. A ani není vhodný jako přepis jednání slovo od slova. Ale jako soupis důležitých řečených věcí to začíná fungovat velmi dobře a rozhodně se vyplatí to vyzkoušet.
Tak a to je prozatím všechno. Líbil se vám newsletter? Dejte mu lajk a doporučte jej kamarádům 🥰
Vše nejlepší do nového týdne přeje
Patrick Zandl