Nový algoritmus dokáže z ničeho naučit robota chodit přes překážky i hrát různé sporty

Nový algoritmus dokáže z ničeho naučit robota chodit přes překážky i hrát různé sporty

Nový algoritmus dokáže z ničeho naučit robota chodit přes překážky i hrát různé sporty Zdroj: VTM.cz

Nový algoritmus dokáže z ničeho naučit robota chodit přes překážky i hrát různé sporty
Nový algoritmus dokáže z ničeho naučit robota chodit přes překážky i hrát různé sporty
Nový algoritmus dokáže z ničeho naučit robota chodit přes překážky i hrát různé sporty
Nový algoritmus dokáže z ničeho naučit robota chodit přes překážky i hrát různé sporty
Nový algoritmus dokáže z ničeho naučit robota chodit přes překážky i hrát různé sporty
12
Fotogalerie

Vědci vytvořili nový algoritmus, který dokáže robota naučit pohybu v neznámém a náročném prostředí. Robot se díky univerzálnímu algoritmu dokáže naučit i různé sporty, třeba i fotbal. Použití těchto systémů lze očekávat jak ve hrách, tak i u reálných robotů.

 

Vědci z univerzity Britské Kolumbie představili nový algoritmus, který umožňuje struktuře robota či jiného charakteru v simulovaném nebo reálném prostředí, naučit se pohybovat a plnit „cíle“. Může jít tak o průchod prostředím, které má překážky všeho druhu nebo třeba sporty, jako je například fotbal a kopnutí míče do branky.

V minulosti už se objevilo několik systémů umělé inteligence, která díky hlubokým neuronovým sítím dokázaly celkem zdatně zvládat pohyb v náročném simulovaném terénu. Nový vytvořený systém jde ale s univerzálností ještě dále a rozšiřuje možnosti učení i na oblasti, které dříve byly řešené samostatnými algoritmy.

DeepLoco: dvouúrovňové zkoušení a učení

Tým pod vedením profesora Michiela van Panneho na konferenci SIGGRAPH 2017 představil několik let vyvíjený systém DeepLoco, který dokáže řešit pohyb a úkoly v komplexním prostředí. Místo toho, aby chování bylo předem naprogramované, algoritmus s využitím umělé inteligence dokáže daný úkol vyřešit sám pouhým zkoušením a zpětnou vazbou. Díky tomuto učení tak například dokáže udržet stabilitu, posléze i na nerovném a pohybujícím se povrchu a náročnost může dále stoupat – překážky různé velikost, létající narážející předměty a podobně.

DeepLoco navíc řeší to, aby pohyb daného charakteru – může jít o simulaci lidské postavy, robota, zvířete a podobně, byl v prostoru přirozený. To je důležité pro cílový segment, kterým jsou například filmy nebo počítačové hry. Právě u nich je většinou vše velmi pevně naprogramováno a pokud různé postavy a objekty interagují s okolím, vypadá to obvykle dost podivně. Jistě to zná každý hráč – postavy zkrátka „plavou“ nad nebo v nejhorších případech i pod virtuálním povrchem a nemají tak žádný „fyzikální“ styk s daným prostředím.

Video placeholde
Nový algoritmus dokáže z ničeho naučit robota chodit přes překážky i hrát různé sporty • Živě.cz

Vědci u DeepLoco použili dvě úrovně řízení, které se starají o učení a ovládání. Nižší ovládací jednotka se stará o samotné ovládání končetin a vyvažování (motorika), vyšší jednotka pak obstarává zpracování cíle v podobě směru nebo analýzu prostředí (například dle prezentovaných výškových bodů na mapě). Obě části využívají k učení hluboké neuronové sítě.

Komplexnější inteligentní systémy

Jak je vidět na tomto systému, s rozvojem jejich schopností přichází architektura podobná našemu mozku, která rovněž využívá několik úrovní abstrakce a každá má své „cíle“. Zjednodušeně řešeno – pokud sáhnete na rozpálený předmět, zareagujete velmi rychle na jednoduchou situaci (nízká úroveň), ale to, že chcete zhubnout do plavek, už je opravdu velmi abstraktní úkol, který vyžaduje splnění spousty úkolů s velkým časovým plánováním.

Vědci chtějí do budoucna ještě více prozkoumat právě využívání tohoto víceúrovňového systému abstrakce, kdy by roboti dokázali řešit ještě komplexnější výzvy a vytvořená umělá inteligence by dokázala v rámci systémů nižší úrovně nalézt efektivnější řešení pro splnění cíle vyšší úrovně.

Typickým příkladem může být plánované použití dvou charakterů, které budou mezi sebou interagovat. Jeden samotný charakter například nedokáže přelézt virtuální zeď, ale pokud by mu druhý pomohl, bylo by to možné. Takové systémy nejsou žádnou vědeckofantastickou představou, ale jen otázkou času. S příchodem těchto komplexních systémů ale jde ruku v ruce i příchod komplexnějších superinteligencí, které nelze nikdy zcela kontrolovat.