Jak AI skutečně sleduje vaše kalorie: Pohled do zákulisí

3. května 2025 Tým Crumpeat
AI analyzuje jídlo pomocí počítačového vidění
Moderní AI dokáže z obyčejné fotky jídla získat detailní nutriční informace
Když v Crumpeatu vyfotíte své jídlo, aplikace jako by zázračně poznala, co jíte, a během pár vteřin vám ukáže přesné nutriční hodnoty. Co se ale skrývá za tímto bezproblémovým zážitkem? Pojďme nahlédnout do zákulisí sofistikované AI technologie, která pohání moderní rozpoznávání jídel a sledování kalorií.

Vývoj technologií rozpoznávání jídel

Ještě nedávno bylo přesné rozpoznání jídla z fotky téměř nemožné. První systémy používaly jednoduché počítačové vidění a zvládly jen omezený počet jídel za ideálních podmínek. Pokud bylo špatné světlo nebo více jídel na talíři, často selhaly.

Zlom nastal s příchodem pokročilých multimodálních velkých jazykových modelů (LLM) – AI systémů trénovaných na obrovských datech z textů i obrázků. Tyto modely nejen „vidí“ vaše jídlo, ale chápou ho v kontextu, podobně jako zkušený nutriční poradce.

Věděli jste? Moderní modely rozpoznávání jídel jsou trénovány na milionech fotek z celého světa, takže poznají pokrmy z různých kuchyní a kultur.

Jak multimodální AI „vidí“ vaše jídlo

Když vyfotíte svůj talíř, během vteřin proběhne několik složitých procesů:

Krok 1: Analýza obrázku

AI nejprve zpracuje surové pixely fotky, identifikuje tvary, barvy, textury a prostorové vztahy. Díky tomu rozliší jednotlivé položky na talíři.

Krok 2: Detekce objektů

Model rozdělí obrázek na oblasti a identifikuje jednotlivé potraviny, i když se překrývají nebo nejsou celé vidět. Pozná rozdíl mezi burritem, wrapem a enchiladou.

Krok 3: Rozpoznání detailů

AI si všímá detailů, které by člověku unikly – například zbarvení chleba prozradí celozrnnou variantu, textura masa způsob přípravy, lesk zeleniny množství oleje.

Krok 4: Odhad porce

Díky prostorovému vnímání a referenčním bodům AI odhadne objem a hmotnost každé položky. Moderní systémy dokážou zohlednit perspektivu a hloubku pro překvapivě přesné odhady.

Krok 5: Nutriční databáze

Rozpoznaná jídla jsou spárována s rozsáhlými databázemi, aby se určil obsah kalorií, makro- i mikroživin podle odhadnuté porce.

Krok 6: Kontextové uvažování

Model využívá znalosti kuchyní, způsobů přípravy a typických kombinací, aby doplnil chybějící informace a zpřesnil odhady.

Síla „neurčitého“ uvažování

Skutečnou revolucí v AI rozpoznávání jídel je schopnost pracovat s nejistotou – tzv. fuzzy reasoning. Na rozdíl od tradičního softwaru s pevnými pravidly dokážou velké jazykové modely:

  • Dělat kvalifikované odhady i při neúplných informacích
  • Propojovat vizuální stopy s textem, který zadáte
  • Využívat kontextové znalosti o typických ingrediencích v jídlech
  • Přizpůsobovat jistotu podle kvality fotky
  • Zlepšovat se díky zpětné vazbě od uživatelů

Toto „neurčité“ uvažování je velmi podobné tomu, jak pracuje lidský odborník. Nutriční poradce nemusí analyzovat těstoviny v laboratoři, aby věděl, že obsahují sacharidy, a odhadne porci i bez vážení. AI se této úrovni porozumění konečně přiblížila.

Tradiční počítačové vidění (dříve)

  • Pozná jen omezený počet jídel
  • Má problém se smíšenými nebo složitými pokrmy
  • Vyžaduje ideální světlo a úhel
  • Nerozumí kontextu
  • Binární „správně/špatně“ rozpoznání

Multimodální LLM (dnes)

  • Pozná téměř jakékoliv jídlo z jakékoliv kuchyně
  • Zvládne složitá, vícekomponentní jídla
  • Funguje i za různých světelných podmínek
  • Chápe kontext a způsob přípravy
  • Pracuje s pravděpodobností, ne jen s jistotou

Když se text spojí s obrazem: Multimodální výhoda

Skutečný průlom nastal, když se AI naučila zpracovávat obrázky i text zároveň – tzv. multimodální učení. Díky tomu AI chápe jídlo způsobem, který byl dříve nemožný.

Například když vyfotíte misku polévky a dopíšete „domácí kuřecí nudlová“, AI nevidí jen tekutinu s plovoucími objekty – chápe, že jde o kuřecí polévku s nudlemi, a použije znalosti typických ingrediencí a nutričních hodnot, i když některé nejsou na fotce vidět.

Toto propojení textu a obrazu vytváří tzv. „smyčku doplňujících informací“. Vizuální data pomáhají upřesnit text a text zase pomáhá interpretovat nejasné vizuální prvky. Výsledkem je systém mnohem přesnější a užitečnější než ten, který by se spoléhal jen na fotky.

„Nejmocnější AI systémy nejen vidí, co je na obrázku – ale chápou, na co se dívají, v bohatém kontextu.“

Dr. Fei-Fei Li, AI výzkumnice

Výzvy a limity

Přestože AI rozpoznávání jídel udělalo obrovský pokrok, je dobré znát jeho limity:

AI nepozná neviditelné ingredience jako sůl, cukr nebo olej, který se vsákl. Dělá kvalifikované odhady podle běžných postupů, ale ty se mohou lišit.

Nutriční hodnoty domácích jídel se mohou výrazně lišit od databázových průměrů. Babiččina lasagne může být úplně jiná než „průměrná“ lasagne v databázi.

Přestože se to rychle zlepšuje, většina AI stále lépe poznává západní jídla než pokrmy z jiných kultur – odráží to složení trénovacích dat.

Podobně vypadající průmyslové potraviny mohou mít zcela odlišné složení. Dva stejné energetické tyčinky mohou mít úplně jiné ingredience i kalorickou hodnotu.

Tyto limity ukazují, že AI je nejlepší v roli chytrého asistenta, ne neomylné autority. Nejlepší systémy přiznávají nejistotu a umožňují uživateli odhady upřesnit.

Rovnováha mezi přesností a použitelností

Hlavní výzvou AI rozpoznávání jídel není jen absolutní přesnost – ale najít správnou rovnováhu mezi přesností a jednoduchostí. Jak jsme rozebrali v našem článku o jednoduchosti v počítání kalorií, systém, který je sice na 99 % přesný, ale složitý na používání, je méně užitečný než ten, který je na 90 % přesný, ale používáte ho každý den.

Moderní AI proto záměrně volí kompromisy a upřednostňuje:

  • Rychlost před detailní analýzou – Výsledky během vteřin, ne minut
  • Intuitivní ovládání před technickou přesností – Stačí fotka místo složitých dotazníků
  • Konzistenci před občasnou dokonalostí – Lepší pravidelné sledování než občasná preciznost

Platí totiž jednoduchá pravda: Nejlepší výživový deník je ten, který opravdu používáte každý den.

Budoucnost AI rozpoznávání jídel

Co nás čeká dál? Několik vzrušujících novinek je na obzoru:

Personalizované nutriční modely

Budoucí AI se naučí váš metabolismus a upraví odhady podle toho, jak vaše tělo reaguje na různé potraviny – třeba díky kontinuálnímu měření glukózy a dalším biometrickým údajům.

Pokročilé 3D odhady objemu

Nové počítačové vidění využije hloubkové snímání nebo více úhlů k vytvoření 3D modelu jídla, což výrazně zpřesní odhady porcí – a to i bez speciálního hardwaru.

Nutriční „cestování v čase“

AI dokáže zpětně odhadnout, co jste jedli, i z fotek pořízených s odstupem – třeba podle metabolických markerů. Umožní tak doplnit záznamy, i když jste jídlo zapomněli zaznamenat v reálném čase.

Integrace s rozšířenou realitou

AR brýle budou zobrazovat nutriční informace v reálném čase přímo při pohledu na jídlo – pomohou vám rozhodnout se ještě před jídlem a odpadne nutnost fotit.

Lidský faktor zůstává klíčový

Přes všechny technologické pokroky zůstává lidský faktor v oblasti výživy zásadní. AI je nejlepší jako chytrý pomocník, který zjednodušuje sledování a dává doporučení – ne jako náhrada lidského úsudku.

Nejefektivnější systémy budoucnosti spojí špičkovou AI s lidskou zkušeností a intuicí. Poznají, kdy nabídnout přesný odhad a kdy je lepší přibližná hodnota. Uvědomí si, že dokonalé sledování, které způsobuje úzkost, je horší než nedokonalé, které podporuje zdravý vztah k jídlu.

Největší přínos AI pro sledování výživy není jen v přesnosti – ale v dostupnosti. Díky jednoduchosti, kterou umožňuje, může výživový deník vést opravdu každý a rozvíjet tak zdravější vztah k jídlu.

Vyzkoušejte AI sledování výživy na vlastní kůži. Vyfoťte si příští jídlo a zjistěte, jak přesně ho Crumpeat zanalyzuje – bez odměřování nebo vážení.

Proč na jednoduchosti záleží? Přečtěte si náš článek o tom, proč většina aplikací na počítání kalorií selhává kvůli zbytečné složitosti.

Sdílet článek:

Přihlaste se k odběru novinek

Zadejte platný e-mail.