Umělá inteligence Uberu překonává problematické hry s novou …

Videohry se staly testovacím polem pro umělou inteligenci a Uber ukázal, jak nové druhy učení o posílení uspějí tam, kde ostatní selhaly.

Některé z nejsložitějších her lidstva, jako je Go, nedokázaly napadnout umělou inteligenci, jako je DeepMind. Výuka posilování trénuje algoritmy opakovaným používáním scénářů s „odměnou“ za úspěchy, často se zvyšováním skóre.

Dvě klasické hry z 80. let: Pomsta a pád Montezumy! – dosud imunní vůči tradičnímu přístupu k učení se posilováním. Je to proto, že hry získaly několik pozoruhodných cen až později.

Procvičování tradičního posilovacího učení často nemá za následek žádný pokrok v první místnosti hry Montezuma’s Revenge, zatímco je v pasti! zcela neúspěšný

Jedním ze způsobů, jak se vědci snaží poskytnout odměny potřebné k podpoře umělé inteligence, je přidat je k objevu nazvanému „vnitřní motivace“. Tento přístup má však své nevýhody.

“Předpokládáme, že hlavní slabinou současných algoritmů vnitřní motivace je divergence,” napsali vědci z Uber. „Kde algoritmy zapomínají na slibné oblasti, které navštívili, což znamená, že se k nim nebudou vracet, aby zjistili, zda vedou k novým situacím.“

Výzkumný tým AI společnosti Uber v San Francisku vyvinul nový typ posilovacího učení, aby se s touto výzvou vypořádal.

Vědci nazývají svůj přístup „Go Explore“; Tímto způsobem se AI vrátí k předchozímu úkolu nebo poli, aby posoudila, zda přináší lepší výsledek. Jeho doplnění lidskými znalostmi o orientaci v pozoruhodných oblastech významně urychlilo jeho pokrok.

Pokud nic jiného, ​​výzkum nám poskytuje určitou útěchu. Slabí lidé ještě nejsou úplně nadbyteční a nejlepších výsledků dosáhnete při práci ruku v ruce s našimi virtuálními pány.

Máte zájem diskutovat o podobných tématech a jejich případech použití od lídrů v oboru? Připojte se ke společnému místu AI a veletrh velkých dat Události s nadcházejícími přehlídkami v Silicon Valley, Londýně a Amsterdamu, kde najdete další informace. Stejné místo s IoT Tech Expo, Blockchain Faira Cyber ​​Security and Cloud Fair.