Razvijte i usporedite algoritme za učenje pomoću ovog alata.
Ako ne možete izraditi model strojnog učenja od nule ili vam nedostaje infrastruktura, jednostavno povezivanje vaše aplikacije s modelom koji radi popravlja prazninu.
Umjetna inteligencija je tu kako bi je svi mogli koristiti na ovaj ili onaj način. Što se tiče OpenAI Gyma, postoji mnogo terena za vježbanje kojima možete nahraniti svoje agente za dodatno učenje.
Što je OpenAI Gym, kako radi i što možete izgraditi pomoću njega?
Što je OpenAI Gym?
OpenAI Gym je Pythonic API koji pruža simulirana okruženja za obuku za agente učenja za pojačanje da djeluju na temelju opažanja okoline; svaka radnja dolazi s pozitivnom ili negativnom nagradom, koja se skuplja u svakom vremenskom koraku. Dok agent ima za cilj maksimizirati nagrade, biva kažnjen za svaku neočekivanu odluku.
Vremenski korak je diskretni vremenski otkucaj za prijelaz okoline u drugo stanje. Zbraja se kako akcije agenta mijenjaju stanje okoline.
Kako funkcionira OpenAI Gym?
OpenAI Gym okruženja temeljena su na Markovljevom procesu odlučivanja (MDP), dinamičkom modelu donošenja odluka koji se koristi u učenju s potkrepljenjem. Dakle, slijedi da nagrade dolaze samo kada okolina promijeni stanje. A događaji u sljedećem stanju ovise samo o sadašnjem stanju, jer MDP ne uzima u obzir prošle događaje.
Prije nego krenemo dalje, zaronimo u primjer za brzo razumijevanje primjene OpenAI Gyma u učenju s potkrepljenjem.
Pod pretpostavkom da namjeravate trenirati automobil u trkaćoj igrici, možete pokrenuti trkaću stazu u OpenAI Gymu. U učenju za potkrepljivanje, ako vozilo skrene udesno umjesto ulijevo, moglo bi dobiti negativnu nagradu od -1. Trkaća staza se mijenja u svakom vremenskom koraku i može postati kompliciranija u sljedećim stanjima.
Negativne nagrade ili kazne nisu loše za agenta u učenju s potkrepljenjem. U nekim slučajevima potiče ga da brže postigne svoj cilj. Tako automobil s vremenom uči o stazi i svladava svoju navigaciju koristeći nizove nagrada.
Na primjer, pokrenuli smo Zaleđeno jezero-v1 okruženje, gdje agent biva kažnjen za upadanje u ledene rupe, ali nagrađen za vraćanje poklon kutije.
Naše prvo izvođenje generiralo je manje kazni bez nagrada:
Međutim, treća iteracija proizvela je složenije okruženje. Ali agent je dobio nekoliko nagrada:
Gore navedeni ishod ne znači da će se agent poboljšati u sljedećoj iteraciji. Iako bi sljedeći put mogao uspješno izbjeći više rupa, možda neće dobiti nagradu. Ali izmjena nekoliko parametara mogla bi poboljšati njegovu brzinu učenja.
Komponente OpenAI Gym
OpenAI Gym API vrti se oko sljedećih komponenti:
- The okruženja gdje obučavate agenta. Možete ga pokrenuti pomoću teretana.napraviti metoda. OpenAI Gym također podržava okruženja s više agenata.
- The omoti za modificiranje postojeće okoline. Iako je svako osnovno okruženje unaprijed omotano prema zadanim postavkama, možete ga promijeniti s parametrima kao što su max_actions, min_actions i max rewards.
- An akcijski; definira što agent radi dok promatra promjene u svojoj okolini. Svaka radnja u okruženju je korak koji definira agentov odgovor na opažanja. Dovršetak koraka vraća opažanje, nagradu, informacije i skraćenu ili prekidnu vrijednost.
- The promatranje; definira agentovo iskustvo u okruženju. Nakon što postoji opažanje, slijedi radnja sa svojim informacijama. Parametar info je zapisnik izvršenja koji je zgodan za otklanjanje pogrešaka. Nakon što korak završi, okolina se resetira n puta, ovisno o broju navedenih ponavljanja.
Što možete napraviti s OpenAI Gymom?
Budući da vam OpenAI Gym omogućuje razvijanje prilagođenih okruženja za učenje, evo nekoliko načina za njegovu upotrebu u stvarnom životu.
1. Simulacija igre
Možete iskoristiti okruženja za igranje OpenAI Gyma za nagrađivanje željenog ponašanja, stvaranje nagrada za igranje i povećanje složenosti po razini igre.
2. Prepoznavanje slike
Tamo gdje postoji ograničena količina podataka, resursa i vremena, OpenAI Gym može biti zgodan za razvoj sustava za prepoznavanje slika. Na dubljoj razini, možete ga skalirati kako biste izgradili sustav za prepoznavanje lica, koji nagrađuje agenta za točnu identifikaciju lica.
3. Obuka robota
OpenAI Gym također nudi intuitivne modele okruženja za 3D i 2D simulacije, gdje možete implementirati željena ponašanja u robote. Roboškola je primjer skaliranog softvera za simulaciju robota izgrađenog pomoću OpenAI Gyma.
4. Marketing
Također možete izraditi marketinška rješenja kao što su oglasni poslužitelji, botovi za trgovanje dionicama, botovi za predviđanje prodaje, sustavi za preporuku proizvoda i još mnogo toga koristeći OpenAI Gym. Na primjer, možete izgraditi prilagođeni OpenAI Gym model koji kažnjava oglase na temelju stope pojavljivanja i klikova.
5. Obrada prirodnog jezika
Neki načini primjene OpenAI Gyma u obrada prirodnog jezika su pitanja s višestrukim izborom koja uključuju dovršavanje rečenice ili izrada klasifikatora neželjene pošte. Na primjer, možete obučiti agenta da nauči varijacije rečenica kako bi izbjegao pristranost tijekom označavanja sudionika.
Kako započeti s OpenAI Gymom
OpenAI Gym podržava Python 3.7 i novije verzije. Da biste postavili okruženje OpenAI Gym, instalirat ćete gimnazija, račvasta kontinuirano podržana verzija za teretanu:
pip instalirati gimnaziju
Zatim zavrtite okruženje. Međutim, možete stvoriti prilagođeno okruženje. Ali počnite tako što ćete se poigrati s postojećim kako biste svladali koncept OpenAI Gym.
Kod u nastavku pokreće Zaleđeno jezero-v1. The okruženje.resetirati metoda bilježi početno opažanje:
uvoz gimnazija kao teretana
env = gym.make('Zaleđeno jezero-v1', render_mode="ljudski")
promatranje, info = env.reset()
Neka okruženja zahtijevaju dodatne biblioteke za rad. Ako trebate instalirati drugu biblioteku, Python to preporučuje putem poruke o iznimci.
Na primjer, instalirat ćete dodatnu biblioteku (gimnazija[igračka-tekst]) za pokretanje Zaleđeno jezero-v1 okoliš.
Izgradite snagu OpenAI Gyma
Jedna od prepreka razvoju umjetne inteligencije i strojnog učenja je nedostatak infrastrukture i skupova podataka za obuku. Ali dok želite integrirati modele strojnog učenja u svoje aplikacije ili uređaje, sada je sve lakše s gotovim AI modelima koji lete internetom. Dok su neki od ovih alata jeftini, drugi, uključujući OpenAI Gym, besplatni su i otvorenog koda.