Kriterijumi za izbor strategije u uslovima rizika. Izbor optimalne strategije za investicioni projekat u uslovima rizika i neizvesnosti. Položaji i radnje

Kriterijum divljaka (minimax kriterijum rizika).

Hurwitzov kriterijum.

Rješenje.

1. Maximin Wald kriterij.max min a ij

Izračunajmo minimalne vrijednosti po redu min a ij , a zatim odaberite maksimum od njih.

Dakle, dobijamo N =max min a ij = 15 i j

Odgovor: optimalna strategija 1. igrača A je

strategija A 4.

Uzmimo Hurwitzov parametar jednak γ =0,6: γ= min a ij +(1-γ) max a ij

5 10 18 255 25 5*0,6+0,4*25=13

A = 8 7 8 23 7 23 7*0,6+0,4*23=13,4

21 18 12 21 12 18 12*0,6+0,4*18=14,4

20 22 19 1515 22 15*0,6+0,4*22=17,8

Dobijamo H =max=17,8

strategija A 4.

Potrebno je izgraditi matricu rizika.

Za ovo:

1) izračunajte maksimalne vrijednosti po kolonama

2) izračunajte matricu rizika: r ij = max a ij - a ij

21-5 22-10 19-18 25-25 16 12 1 0

r ij = 21-8 22-7 19-8 25-23 = 13 15 11 2

21-21 22-18 19-12 25-21 0 4 7 4

21-20 22-22 19-19 25-15 1 0 0 10

3) izračunajte maksimalne vrijednosti po redu i od njih odaberite red s minimalnom vrijednošću:

r ij = 0 4 7 4 7

Dobijamo H =minmax r ij = 7 prilikom primjene strategije A 3.

Odgovor: Optimalna strategija za prvog igrača je

strategija A 3.

4. Laplasov kriterijum. n

Izračunajte aritmetičke prosjeke po redovima [ 1/n ∑ a ij ]

5 10 18 25 0.25 (5+10+18+25)=14.5 j =1

A = 8 7 8 23 0,25 (8+7+8+23)=11,5

21 18 12 21 0.25 (21+18+12+21)=18

20 22 19 15 0.25 (20+22+19+15)=19

Dobijamo H =max [ 1/n ∑ a ij ] =19 prilikom primjene strategije A 4.

Odgovor: Optimalna strategija za prvog igrača je

strategija A 4.

B 1 B 2 B 3 B 4 n

A 1 5 10 18 25 H =max∑P j a ij

A 2 8 7 8 23 i j =1

A 3 21 18 12 21

A 4 20 22 19 15

Vjerojatnosti strategija drugog igrača.

U 1 U 2 U 3 U 4
0.2 0.15 0.35 0.3

5*0.2+10*0.15+18*0.35+25*0.3=16.30

8*0.2+7*0.15+8*0.35+23*0.3=12.35

21*0.2+18*0.15+12*0.35+21*0.3=17.40

20*0.2+22*0.15+19*0.35+15*0.3=18.45

Dobijamo H = 18,45 prilikom primjene strategije A 4.

Odgovor: Optimalna strategija za prvog igrača je

strategija A 4.

PRIMJER br. 2

Preduzeće ima mogućnost da samostalno planira obim proizvodnje sezonskih proizvoda A 1, A 2, A 3. Proizvodi koji se ne prodaju tokom sezone kasnije se prodaju po sniženoj cijeni. Podaci o troškovima proizvoda, prodajnim cijenama i obimu prodaje u zavisnosti od nivoa potražnje prikazani su u tabeli:



Obavezno:

1) dati opisanu situaciju šemu igre, naznačiti prihvatljive strategije strana, sastaviti matricu plaćanja

Bilješka: Da biste smanjili dimenziju matrice plaćanja, pretpostavite da je istovremeno nivo potražnje za sve tri vrste proizvoda isti:

visoka, srednja ili niska.

Igra uključuje 2 igrača: A - proizvođač, B - potrošač.

Igrač A nastoji prodati svoje proizvode na način da ostvari maksimalan profit. Strategije igrača A su:

A 1 - prodajte proizvode kada je potražnja velika

A 2 - prodajte proizvode po prosječnom stanju potražnje

A 3 - prodajte proizvode kada je potražnja mala

Igrač B nastoji kupiti proizvode po minimalnoj cijeni. Strategije igrača B su:

B 1 - kupujte proizvode kada je potražnja velika

B 2 - kupujte proizvode po prosječnom stanju potražnje

B 3 - kupujte proizvode kada je potražnja mala

Interesi igrača A i B su suprotni. Odredimo cijenu proizvoda tokom sezone i nakon sniženja:

Izračunajmo elemente matrice plaćanja

Ponuda Potražnja
strategije Povećana potražnja 14+38+24 Prosječna potražnja 8+22+13 Smanjena potražnja 5+9+7
Povećana potražnja 14+38+24 14*0,8+38*0,5+ 24*1,3=61,4 8*0,8+(14-8) *0,2+ 22*0,5+(38-22)*(-5) +13*1,3+(24-13)*0,2 =29,7 5*0,8+(14-5)*0,2+ 9*0,5+(38-9)*(-5)+ 7*1,3+(24-7)=8,3
Prosječna potražnja 8+22+13 8*0,8+22*0,5+ 13*1,3=34,3 8*0,8+22*0,5+ 13*1,3=34,3 5*0,8+(8-5)*0,2+ 9*0,5+(22-9)*(-5)+ 7*1,3+(13-7)*0,2 =12,9
Smanjena potražnja 5+9+7 5*0,8+9*0,5+7*1,3 =17,6 5*0,8+9*0,5+ 7*1,3=17,6 5*0,8+9*0,5+ 7*1,3=17,6

Matrica plaćanja će poprimiti oblik

Strategije U 1 U 2 U 3 α i =min a ij j
A 1 61.4 29.7 8.3 8.3
A 2 34.3 34.3 12.9 12.9
A 3 17.6 17.6 17.6 17.6
β j =max a ij i 61.4 34.3 17.6

α = max α i = 17,6 β = min β j = 17,6

Jer α = β = ν = 17,6, tada je pronađena točka sedla. To znači optimalno rješenje: A 3; U 3

Proizvođač (igrač A) će dobiti zajamčenu dobit od 17,6 novčanih jedinica ako proda svoje proizvode na smanjenom nivou potražnje u iznosu od 5,9 i 7 jedinica. proizvodi A 1, A 2 i A 3

Kontrolna pitanja:

1. Definirajte konfliktnu situaciju.

2. Kako se zove matematički model konfliktne situacije?

3. Kako se u teoriji igara nazivaju dionici?

4. Koja igra se zove antagonistička? Navedite primjer.

5. Definišite pojam „strategije“.

6.Šta se podrazumijeva pod ishodom sukoba?

7. Definišite pojam “pobjeda”.

8. Na koje se klase igre dijele ovisno o broju igrača?

9. Koji je cilj igrača A pri odabiru strategije?

10. Šta je suština maksiminskog principa optimalnosti i kako se zove dobitak dobijen u skladu sa ovim principom?

11.Zašto se maximin α naziva niža cijena igre?

12.Šta je cilj igrača B pri odabiru strategije?

13.Zašto minimax β naziva najvišom cijenom igre?

14. Zašto je tačna nejednakost α? < β ?

15. Definirajte cijenu igre u čistim strategijama.

16. Koja igra se zove mješovita strateška igra?

17. Kako geometrijski pronaći optimalnu mješovitu strategiju igrača A i cijenu igre 2 x n?

18.Šta se u teoriji igara podrazumijeva pod pojmom "priroda"?

19. Navedite primjere u kojima se odluka donosi u uvjetima neizvjesnosti povezanih sa nesvjesnim prihvatanjem različitih faktora.

20. Kako se izbor optimalnih strategija igrača u igrama s prirodom razlikuje od igara sa nultom sumom?

21.Šta se podrazumijeva pod rizikom igrača u igri s prirodom i kako se formira matrica rizika?

22. Definirajte Waldov kriterij i kako se njime određuje pobjeda?

23. Definirajte Savage kriterij i kako se po njemu određuje pobjeda?

24. Dajte definiciju Laplaceovog kriterijuma i kako se njime određuje pobeda?

25. Definirajte Bayesov kriterij i kako se njime određuje dobit?

26. Koji princip izbora optimalne strategije leži u osnovi Hurwitzovog kriterijuma pesimizma-optimizma u pogledu dobitaka?

8. Predavanje. Sistemi čekanja.

Da bi odabrao strategiju, OS mora biti u stanju procijeniti koliko je dobra ili loša. Pošto se rezultati operacije vrednuju po kriterijumu operacije, na osnovu ove funkcije se zasniva i ocena efektivnosti. Procjene efikasnosti mogu varirati ovisno o informacijama dostupnim OS-u i subjektivnim odlukama OS-a.

U slučaju donošenja odluke u uslovima sigurnosti, kriterijum rada ima oblik f: XR, tj. zavisi samo od kontrolisanih faktora, karakteriše postizanje cilja jednim brojem, a istovremeno maksimalno ostvarenje cilja odgovara maksimalnoj (minimalnoj) vrednosti funkcije f. Tada će optimalna strategija x * X biti ona koja daje maksimum (minimum) funkcije f;

U slučaju kada operacija sadrži nekontrolisane faktore (Y, Z), operativnom sistemu postaje mnogo teže proceniti svoju strategiju. Postoji nekoliko razumnih načina za procjenu strategija i OS mora izabrati jedan od njih ili neku kombinaciju kriterija.

Procjena efikasnosti strategija u uslovima neizvjesnosti

Razmotrimo slučaj kada je Z, odnosno nema slučajnih faktora, a m= 1

Zatim, najčešći načini za procjenu efikasnosti strategija su sljedeći.

Princip najboljeg garantovanog rezultata (Valdov kriterijum). Pretpostavlja se da će za svaku OS strategiju xX biti implementiran neizvjesni faktor yY, koji je najgori za OS. Dakle, ako je cilj OS-a da maksimizira “isplatu” f(x,y), tada se svaka strategija xX procjenjuje vrijednošću

Procjena W 1 (x) (3) se naziva i procjena ekstremnog pesimizma. Dakle, u slučaju koji se razmatra, vrijednost W 1 (x) procjenjuje “isplatu” OS odozdo, odnosno odabirom strategije xX OS će dobiti “isplatu” f(x,y) ništa manje nego W 1 (x), bez obzira što se yY nije materijaliziralo. Drugim riječima, kada se primjenjuje strategija x, operativni sistem će zagarantovano dobiti dobitak ne manji od W 1 (x). Optimalna po ovom kriteriju bit će strategija x 0 koja daje maksimum funkcije W 1 (x) na skupu X.

Primena principa najboljeg garantovanog rezultata opravdana je kada izbor neizvesnog faktora yY vrši razuman protivnik, čiji je cilj da smanji „dobitak“ operativnog sistema.

U slučaju kada OS nastoji da minimizira vrijednost f(x,y), umjesto procjene W 1 (x) (3), primjenjuje se slična procjena

Odnosno

Ako se OS-u ne suprotstavi inteligentni protivnik, primjena principa najboljeg zagarantovanog rezultata može izgledati vrlo “pesimistična”. U tim slučajevima govore o "igranju s prirodom". Nekontrolisane faktore bira „priroda“, na osnovu sopstvenih ciljeva, nepoznatih OS-u. Međutim, nema razloga za pretpostavku da "priroda" pokušava naštetiti OS-u. Najpoznatiji u ovoj situaciji su Laplace, Savage i Hurwitz kriterij.

Laplaceov kriterijum. Ovaj kriterijum se zasniva na sledećem principu nedovoljne opravdanosti. Pošto je distribucija vjerovatnoće na neizvjesne faktore nepoznata, pretpostavljamo da je ova raspodjela uniformna zakonska raspodjela.

Podsjetimo još jednom da se u razmatranim slučajevima OS-u ne suprotstavlja inteligentni protivnik koji bira nekontrolirani faktor kako bi maksimalno pogoršao rezultat operacije za OS.

Laplasov kriterijum procenjuje strategiju xX po vrednosti matematičkog očekivanja pobede operativnog sistema prema uniformnom zakonu distribucije verovatnoće nekontrolisanih faktora. Optimalna strategija prema ovom kriteriju je ona koja daje maksimum (ako je potrebno maksimizirati funkciju cilja) matematičkom očekivanju funkcije cilja.

Ovdje je funkcija gustoće vjerovatnoće uniformnog zakona; p i je vjerovatnoća da će nekontrolisani faktor poprimiti vrijednost y i. Gde

Prva formula se primjenjuje u slučaju kontinuirane slučajne varijable y. Druga formula za konačan skup Y=(y 1 ,…,y m ).

Primjer 3. Kompanija mora odrediti nivo ponude usluga kako bi zadovoljila potrebe kupaca tokom predstojećih praznika. Tačan broj klijenata nije poznat, ali može uzeti jednu od četiri vrijednosti: y 1 =200, y 2 =250, y 3 =300, y 4 =350. Za svaku od ovih mogućih vrijednosti postoji najbolji nivo ponude (x 1, ..., x 4) u smislu minimizacije troškova. Odstupanja od ovih nivoa dovode do dodatnih troškova ili zbog ponude koja premašuje potražnju ili zbog nepotpunog zadovoljenja potražnje (dodatni troškovi zbog potrebe hitne kupovine, izgubljena dobit).

strategijom x 1, tada će se kod najgore opcije za nju y=y 1 troškovi povećati u odnosu na garantovani rezultat za 1%, a kod povoljnije opcije troškovi će iznositi samo 0,9% zagarantovanih troškova, tj. će se smanjiti za 99,1%.

Kriterijum Savage nam omogućava da uzmemo u obzir takve situacije i provedemo izbor strategije koja može dati mali gubitak, ali i značajan dobitak u odnosu na strategiju zajamčenog rezultata. Neka je ciljna funkcija f(x,y) funkcija isplate OS. Stoga OS nastoji maksimizirati funkciju cilja. Kreirajmo funkciju žaljenja:

Vrijednost izražava "žaljenje" OS-a što je za dati neizvjesni faktor y izabrao strategiju x umjesto najbolje strategije

Funkcija se još naziva i funkcija rizika. Tada se na funkciju primjenjuje kriterij najboljeg zajamčenog rezultata, odnosno optimalno x 0 se traži na sljedeći način. Za svaki kontrolirani faktor xX

U slučaju kada je funkcija gubitka specificirana u modelu operacije, funkcija žaljenja će imati oblik

i ponovo izražava OS “žaljenje” što je za dati neizvjestan faktor yY primijenio strategiju x, a ne najbolju strategiju:

Funkcija žaljenja, kako u slučaju funkcije dobitka f (formula (5)), tako iu slučaju funkcije gubitka f (formula (7)), izražava količinu gubitaka OS zbog nekorištenja najbolje strategije. Stoga je kriterij za najbolji zajamčeni rezultat u oba slučaja minimum:

Hajde da napravimo matricu žaljenja za primer dat na početku ovog pasusa. Pošto je funkcija f(i, j) u ovom primjeru funkcija gubitka, onda

Zapisujemo funkciju 2 (i, j) kao matricu S žaljenja:

Sada, iz kriterijuma za najbolji garantovani rezultat za matricu S, dobijamo da će strategija x 1 biti optimalna.

Razmotrimo primjer 3. Pošto je u ovom primjeru specificirana funkcija gubitka, funkcija žaljenja (i, j) se izračunava pomoću formule (7).

2 (1,3)=21-5=16, itd.

Rezultate proračuna zapisujemo u obliku matrice S:

Da bismo pronašli strategiju OS koja je optimalna prema Savageovom kriteriju, koristimo matricu žaljenja S da bismo pronašli strategiju x 0 koja zadovoljava princip najboljeg zajamčenog rezultata. Da biste to učinili, na osnovu (8), potrebno je pronaći maksimalni element u svakom redu matrice S. Označimo ga b 1, b 2, b 3, b 4, respektivno. Zatim morate pronaći najmanji broj b i . Tada će broj i * : b i*= min(b j ) - odrediti optimalnu strategiju. U primjeru 3 b 1 =10, b 2 =8, b 3 =16, b 4 =25. Prema tome, i 0 =2, pošto je b 2 =min(b 1;b 2;b 3;b 4). Stoga je strategija x2 optimalna prema Savage kriteriju u ovom primjeru. Ovaj odgovor se poklapa s odgovorom dobivenim korištenjem Laplaceovog kriterija.

Dakle, za funkciju gubitka datu u primjeru 3, strategija x2 je optimalna i po Laplaceovom kriteriju i po kriteriju Savagea. Međutim, iz gornjeg primjera ne biste trebali zaključiti da će se takva utakmica uvijek izvoditi. Može se navesti primjer gdje će ova dva kriterija različite strategije smatrati optimalnim.

Hurwitzov kriterijum. Da bismo definirali sljedeći kriterij, potreban nam je koncept konveksne kombinacije.

Definicija 13. Broj c naziva se konveksna kombinacija brojeva a i b ako postoji broj [O;1] takav da

Imajte na umu da skup svih takvih brojeva čini segment. Hurwitzov kriterij je konveksna kombinacija kriterija ekstremnog pesimizma W 1 (x, y) i ekstremnog optimizma:

Ovdje pretpostavljamo da je data funkcija isplate f(x, y). Kriterijum ekstremnog optimizma pretpostavlja da neizvesni faktor yY - doprinosi što je više moguće operativnom sistemu u njegovoj želji da poveća svoj dobitak. Dakle, u slučaju kada je data funkcija isplate f(x, y) OS, Hurwitzov kriterij ima oblik:

U ovom slučaju se smatra da je optimalna strategija x 0 X, koja daje maksimum funkcije W 5 (x), tj.

W 5 (x 0) = W 5 (x).

Za funkciju gubitka (x, y), Hurwitzov kriterij je dat jednakošću:

U ovom slučaju se smatra da je optimalna strategija x 0 X kojom se postiže minimum funkcije W 6 (x), tj.

W 6 (x 0)=W 6 (x).

Parametar se naziva indikatorom optimizma: kod =1 Hurwitzov kriterij se pretvara u kriterij ekstremnog optimizma, kod =0 - u kriterij ekstremnog pesimizma. Izbor parametra vrši OS na osnovu svojih pogleda na ovu operaciju, odnosno subjektivan je.

Nađimo rješenje problema iz primjera 3 koristeći Hurwitzov kriterij u slučaju = 0,2. Shodno tome imamo:

W 6 (x 2) = = 19,8, W 6 (x 3) = = 19,2,

W 6 (x 4) = = 27.

Analizirajući ovisnost izbora optimalne strategije od vrijednosti, dobijamo:

(0,5; 1] - optimalna strategija x 1 ;

0,5 - optimalne strategije x 1 i x 2;

(2/7; 0,5) - optimalna strategija x 2 ;

2/7 - optimalne strategije x 2 i x 3;

}