Umělá inteligence a její dopad na počítačové vidění

-- 14.07.17

Použití umělé inteligence se systémy počítačového vidění umožní umělé inteligenci uvažovat více jako lidé, tedy s využitím metod hlubokého učení a dalších funkcí, které lidé používají pro rozvoj svého mozku. 

Když se v 50. letech minulého století objevila koncepce „myslících strojů“, brzy se začaly ozývat hlasy varující před tímto novým oborem umělé inteligence (AI). Strach ze vzestupu strojů se od té doby odráží i v populární kultuře, od kultovního filmu „2001: Vesmírná odysea“ z roku 1968 až po film „Ex Machina“.

I když zatím umělá inteligence společnost neovládla, technologický pokrok v oblasti ukládání dat a výpočetního výkonu umožnil vývoj kognitivních systémů, jako je IBM Watson, které mají zbavit člověka nutnosti rozhodovat. Většina současných aplikací umělé inteligence se však spokojuje se skromnějšími úkony, k nimž patří např. rozpoznávání objektů. 

Od AI si mnozí slibují, že dovolí počítačovému vidění pustit se do náročnějších aplikací, tj. nad rámec možností dnešních řešení. Je ale tato technologie připravena pro použití v průmyslových aplikacích? 

Testování vod umělé inteligence

Použití AI v počítačovém vidění se opírá o příbuzné obory počítačového učení a především hlubokého učení (deep learning). Obecně vzato je umělá inteligence schopností počítače simulovat lidskou inteligenci. Konkrétněji jde o to, že počítačové učení dává počítačům schopnost jednat bez toho, aby byly výslovně programovány. Hluboké učení, dílčí obor počítačového učení, umožňuje počítačům učit se ze zkušeností. 

Díky několika technologickým úspěchům v posledním desetiletí je hluboké učení v systémech počítačového vidění realitou, nikoli pouze možností. „Na základě nových metod v oblasti neuronových sítí, dostatečného výpočetního výkonu grafických výpočetních jednotek a hojnosti dat můžeme až nyní využívat umělou inteligenci pro zpracování obrazu,“ uvedl Olivier Despont z oddělení rozvoje obchodu společnosti ViDi Systems, švýcarského výrobce softwaru pro počítačové vidění na bázi hlubokého učení. 

S hlubokým učením jsou spojena velká očekávání oproti tradičnímu počítačovému vidění, protože na rozdíl od tradičního softwaru pro zpracování obrazu nevyužívá postupy založené na pravidlech. „Umělá inteligence je dalším krokem, kdy obtížně charakterizovatelné nebo nelineární úkony necháme zpracovat počítačům, které zajistí novou úroveň opakovatelnosti,“ uvedl Wallace Latimer, obchodní ředitel divize zakázkových optických systémů společnosti FISBA. „Zatímco lineární algoritmy mají velmi úzký toleranční práh, umělá inteligence nebo hluboké učení rozšiřují toto pole a mohou akceptovat větší variabilitu,“ pokračoval Latimer. „Rozšiřují pásmo přijatelnosti toho, co je dobré nebo špatné, a určují, proč je to dobré nebo špatné. S širším pásmem se můžete zaměřit na to, co nabízí nejvýhodnější výsledek a co omezí změny na vstupech.“ 

V dnešní době je na trhu k dispozici nejméně jeden systém hlubokého učení vhodný pro uživatele počítačového vidění. ViDi Suite od společnosti ViDi Systems je prvním komerčně dostupným průmyslovým softwarem pro analýzu snímků na bázi hlubokého učení. Tento software, který se integruje se standardními knihovnami pro zpracování obrazu, se učí podobně jako dítě. 

„Když chcete dítěti vysvětlit, co je to dům, nepoužijete přístup na základě pravidel,“ zdůraznil Despont. „Na bázi několika příkladů si náš mozek, dokonce už v raném věku, dokáže extrahovat to, co dělá dům domem. A náš systém funguje stejně jako lidský mozek.“ 

ViDi Suite tvoří tři různé nástroje. ViDi Blue dokáže najít a detekovat jeden nebo více prvků ve snímku. Tento nástroj lokalizuje a identifikuje složité prvky a objekty tím, že se učí z anotovaných snímků. Nástroj ViDi Red detekuje anomálie tím, že se naučí, jak vypadá normální vzhled objektu, včetně jeho variací. Nástroj Red rovněž segmentuje určité regiony ve snímcích. Nástroj ViDi Green se učí rozlišovat různé třídy na základě kolekce označených snímků za účelem klasifikace objektu. 

Další výhodou hlubokého učení oproti tradičním řešením počítačového vidění je to, že dokáže zkrátit čas potřebný pro vývoj programů počítačového vidění. „U klasické koncepce počítačového vidění je u mnoha aplikací zapotřebí 60 i více dnů na vývoj softwaru a jeho vyladění,“ konstatoval Despont. „Systém ViDi umí dokončit vývoj za půl dne.“ 

„Na rozdíl od systémů umělé inteligence, jež využívají serverové farmy pro zajištění výkonu svého softwaru, například ty, které vyvinuly společnosti Facebook, Google a IBM, systém ViDi využívá jednu špičkovou grafickou jednotku NVIDIA k tomu, aby naučil systém pracovat v řádu minut namísto dnů nebo měsíců, které jsou nutné k programování a parametrizaci s řešením IBM Watson,“ pokračoval Despont. 

„A namísto použití milionů nebo miliard snímků doporučujeme pro učení systému začít s 30 až 50 dobrými reprezentativními snímky,“ navrhl Despont. „Nezasíláme snímky do cloudové serverové farmy, aby provedla zpracování nebo učení. Zákazníci oceňují, že mohou vše provozovat na jediném počítači PC s jednou grafickou jednotkou a zůstávají vlastníky svých snímků.“ 

Příležitosti a výzvy

Hluboké učení je zvlášť slibné v aplikacích, které představují výzvu pro tradiční systémy počítačového vidění. „Umělá inteligence je mimo jiné velmi vhodná pro kontrolu potravin, kde chcete kontrolovat pečivo nebo kusy masa, které se kus od kusu velmi liší,“ objasnil postup Bruno Ménard, manažer softwarového programu společnosti Teledyne Dalsa. 

Přínosy se však neprojeví jen v aplikacích organické inspekce. Ménard jako další příklad uvádí tradiční aplikace detekce vad. „Je obtížné programovat počítač pomocí tradičních algoritmů, aby definoval vadu bez toho, abyste předělávali nastavení pokaždé, když se objeví nová vada. Avšak s použitím umělé inteligence se spoustou příkladů můžete získat skutečně dobrou definici toho, co je dobrý díl a co není,“ dodal Ménard. 

S pronikáním umělé inteligence do počítačového vidění bude tento fenomén nacházet své místo i v dalších inspekčních úkonech a nakonec rozšíří svůj záběr i nad rámec průmyslové automatizace. Wallace Latimer tvrdí, že hluboké učení bude přínosné na trzích, jako je medicína, přírodovědná odvětví, potravinářství, kontrola padělků a klasifikace dřeva. 

„To vše jsou oblasti, kde má rozhodování velmi neostré hranice,“ uvedl Latimer. „Je toto jablko dostatečně dobré, nebo není? Je těžké pro to stanovit lineární pravidlo. Hluboké učení by mělo mnoha aplikacím přinést značně vyšší efektivitu a opakovatelnost.“ 

Olivier Despont ze společnosti ViDi Systems je toho názoru, že hluboké učení se rozšíří do oblastí, jako je lékařská diagnostika, ostraha, autonomní vozidla a chytré zemědělství, kde se uplatní při kontrole nebo analýze map. „Umělá inteligence je budoucností a bude lidem pomáhat řešit složité úkony velice rychle, neboť výpočetní výkon se každého 1,5 roku téměř zdvojnásobuje,“ doplnil Olivier Despont. 

Mnoho odborníků z oblasti počítačového vidění uznává příslib, který s sebou nese umělá inteligence a hluboké učení pro trh s počítačovým viděním, ale tvrdí, že plný potenciál umělé inteligence nebude realizován ještě nejméně 3 až 5 let. A navíc… umělá inteligence nemusí být nutně řešením pro vše, co využívá tradiční počítačové vidění a zpracování obrazu. 

Bruno Ménard upozorňuje na dvě hlavní nevýhody systémů umělé inteligence: „Zaprvé potřebujete spoustu učení a musíte vlastně vytvořit experta, abyste dosáhli nové úrovně klasifikace. Druhou nevýhodou je, že jakmile jeho učení proběhne a klasifikace selže, je obtížné problém napravit. Nemáte možnost jej přeškolit s novým vzorkem.“ 

Dříve než se umělá inteligence stane v počítačovém vidění běžnou záležitostí, bude podle expertů z oboru nutné počkat, až největší kus práce odvedou mnohem větší hráči. „Z našeho okrajového oboru budeme sledovat firmy typu Google z celého světa, jak tuto technologii pomocí obrovských investic uvedou k neuvěřitelné dokonalosti,“ dodal na závěr Latimer. „Naše odvětví nedokáže investovat čas a peníze v potřebném měřítku. Následně ji pak budeme využívat.“ 

Winn Hardin je přispěvatel sdružení AIA. AIA je součástí sdružení Association for Advancing Automation (A3), obsahového partnera vydavatelství CFE Media. Upravil Chris Vavra, redaktor časopisu Control Engineering, CFE Media, cvavra@cfemedia.com.