Навчальний посібник Під загальною редакцією Т. А. Васильєвої, Я. М. Кривич Суми двнз "уабс нбу" 2015 (075. 8)



Сторінка22/28
Дата конвертації10.12.2016
Розмір3.5 Mb.
ТипНавчальний посібник
1   ...   18   19   20   21   22   23   24   25   ...   28

5.2 Стратегічні ігри (позиційні ігри)


В основі теорії стратегічних ігор лежить припущення, що інтереси двох гравців протилежні. Кожен з гравців прагне так вибрати свою стратегію, щоб отримати для себе найбільшу вигоду і звести до мінімуму вигоду супротивника. В таких іграх кожний гравець діє активно і прагне по можливості використовувати оптимальну стратегію.

План, згідно з яким гравець робить вибір у будь-якій можливій ситуації і при будь-якій можливій фактичній інформації, називається стратегією.

Природно, що гравець приймає рішення по ходу гри. Однак теоретично можна припустити, що всі ці рішення прийняті гравцем заздалегідь. Тоді сукупність прийнятих рішень становить його стратегію.

Стратегія – набір правил, які визначають, який хід гравцю необхідно здійснити

Залежно від числа можливих стратегій ігри поділяються на скінченні та нескінченні. Завданням теорії ігор є вироблення рекомендацій для гравців, тобто визначення для них оптимальної стратегії.



Оптимальною стратегією називається стратегія, яка при багаторазовому повторенні гри забезпечує даному гравцю максимально можливий середній виграш (або, що те ж саме, мінімально можливий середній програш)

У разі вибору оптимальної стратегії підставою для роздумів є припущення, що суперник не поступається гравцю і робить все для того, щоб завадити йому досягти поставленої мети.

У теорії ігор виділяють чисті та змішані стратегії.

Чиста стратегія дає повну визначеність, яким чином гравець продовжить гру. Зокрема, вона визначає результат для кожного можливого вибору, який гравцеві може доведеться зробити.

Особливості чистої стратегії:

визначає той чи інший спосіб поведінки гравця в конфліктній


ситуації;

є частковим випадком змішаної стратегії, згідно з якою одна стратегія використовується з ймовірністю рівній одиниці, а інші – з ймовірностями, рівними нулю;

перехід від чистих стратегій до змішаних розширює область визначення задачі. Досягнутий максимум цільової функції може при цьому тільки збільшитися, а досягнутий мінімум – тільки зменшитися. Визначення оптимальної змішаної стратегії іноді називають визначенням вирішального розподілу стохастичної задачі;

не всі чисті стратегії входять в її оптимальну змішану стратегію. Чисті стратегії, які входять до її складу, називаються корисними або активними стратегіями.

Змішана стратегія є зазначенням ймовірності кожної чистої стратегії. Це означає, що гравець вибирає одну з чистих стратегій відповідно до ймовірностей, заданих змішаною стратегією. Вибір здійснюється перед початком кожної гри і не міняється до її кінця. Кожна чиста стратегія є окремим випадком змішаної, коли ймовірність однієї з чистих стратегій дорівнює одиниці, а інших можливих чистих стратегій – нулю.

5.3 Статистичні ігри (ігри з природою)


Складовою теорії ігор виступає статистична теорія ігор. Це розділ сучасної прикладної математики, який вивчає методи обґрунтування оптимальних рішень в конфліктних ситуаціях.

У теорії стратегічних ігор передбачалося, що в них беруть участь два гравці, інтереси яких протилежні. Тому дії гравців спрямовані на збільшення виграшу одного гравця і зменшення програшу другого.



Статистичні ігри (моделі) – це гра двох осіб – людини і природи – з використанням людиною додаткової статистичної інформації про стани природи

Однак у багатьох задачах, що прирівнюються до ігрових, невизначеність викликана відсутністю інформації про умови, у яких відбувається дія. Ці умови залежать не від свідомих дій одного гравця, а від об’єктивної дійсності, що прийнято називати природою. Такі ігри називають статистичними.

Прийняття рішення в умовах невизначеності ґрунтується на відсутності інформації у людини, що приймає рішення, щодо ймовірностей настання різних варіантів настання подій. В даному випадку застосування традиційних підходів є недоречним, оскільки відсутність даних про ймовірність настання альтернативних варіантів розвитку подій не дає змогу сформувати об’єктивного висновку щодо вибору однієї з альтернатив.

В таких завданнях вибір рішення залежить від стану об’єктивної дійсності, так званої “природи”, а математичні моделі називаються “ігри з природою”.

Гра, в якій усвідомлено діє лише один з гравців, називається
грою з природою

Природа” – це узагальнене поняття противника, який не має власних цілей в даному конфлікті, хоча таку ситуацію конфліктом можна назвати лише умовно.

Природа може приймати одне зі своїх можливих станів і не має на меті одержання виграшу.

Гра з природою представляється у вигляді платіжної матриці (матриці рішень).



Матриця рішень (функція рішень) – це таблиця, де традиційно зазначаються всі можливі альтернативи розвитку подій (рядки) та можливі результати їх настання (стовпці, графи)

На перетині рядків і граф вказуються результати рішень за визначених умов. Відповідно до економічного значення результатів виділяють матрицю надбань (коли числові значення описують середньорічний прибуток, грошові надходження тощо) та матрицю втрат (коли можливі результати характеризують середньорічні збитки, інвестиційні потоки тощо).



Матрицю рішень у загальному вигляді можна представити наступним чином (табл. 5.1).

Таблиця 5.1 – Матриця рішень вибору з-поміж альтернативних варіантів рішень та їх наслідки

Альтернативи
(Х)


Можливі результати (Y)

Y1

Y2

Y3

Y4

Y5

Y6



Yj

Х1

Q11

Q12

Q13

Q14

Q15

Q16



Q1j

Х2

Q21

Q22

Q23

Q24

Q25

Q26



Q2j

Х3

Q31

Q32

Q33

Q34

Q35

Q36



Q3j



















Хi

Qi1

Qi2

Qi3

Qi4

Qi5

Qi6



Qіj

В даному випадку складність виникає не при визначенні значення кожного з Qіj, а при пошуку тієї альтернативи з конкретним результатом, яку доцільно прийняти за кінцевий результат.

Слід наголосити на тому, що вибір однієї з альтернатив (Хi) доцільно проводити не за якимось одним критерієм (найбільше чи найменше значення, середнє з-поміж множини значень тощо), а використовувати багатокритеріальний підхід, який дозволяє порядково оцінити (для окремого Хi за всіма Yj можливими результатами настання альтернативи), оскільки невідомо, який результат буде реалізований. Це дозволить обрати ту найкращу альтернативу Хi не за якимось одним певним результатом, а за їх сукупністю, оскільки ймовірність настання кожного з результатів невідома.

В даному випадку доцільно застосовувати критерії прийняття рішень, які допомагають приймати рішення в умовах невизначеності.



Критерії прийняття рішення – це функція, яка виражає переваги людини, яка приймає рішення, щодо вибору конкретного рішення з сукупності існуючих альтернатив, а також дозволяє сформувати механізм вибору найбільш прийнятного та оптимального варіанта рішення
До основних критеріїв, які використовуються при прийнятті рішення в умовах невизначеності, відносять наступні:

критерій Вальда (“максимінний” і “мінімаксний” критерії);

критерій домінуючого результату (“максимаксний” критерій);

критерій Севіджа (критерій мінімального жалю або критерій втрат від “мінімаксу”);

критерій Лапласа;

критерій Гурвіца (“альфа-критерій” або критерій “оптимізму-песимізму”).

Для вибору найбільш ефективного варіанта стратегії до всіх можливих варіантів розвитку застосовуються всі критерії оптимальності одночасно: кожен з критеріїв дозволяє відібрати тільки один варіант, оптимальним же буде той з них, на який вказала більшість критеріїв.

Розглянемо більш детально дані критерії та зазначимо специфічні особливості застосування кожного з них на прикладі.

Розглянемо ситуацію вибору одного з ряду альтернативних сегментів ринку для просування нового виробу підприємства-виробника. Виходячи зі специфіки споживчих запитів, ємності сегмента, доступності каналів збуту, прибутковості діяльності тощо, прийнятними є п’ять сегментів. Відомо, що при орієнтації на кожний із сегментів ринку може реалізуватися ряд альтернативних результатів, які відрізняються розмірами одержуваного прибутку. Розходження в результатах пояснюються різними сценаріями розвитку подій на обраних цільових сегментах ринку, розвиток яких заздалегідь вгадати неможливо.

Можливі варіанти рішень (вибору конкретного сегмента) і їх наслідки (результати діяльності – середньорічний прибуток) у формальному вигляді були наведені в табл. 5.1.

Як видно з табл. 5.1, кожен з альтернативних варіантів рішення може привести до певних наслідків. Множина цих наслідків визначена, але який з них реалізується в момент ухвалення рішення – невідомо. У цьому і полягає елемент невизначеності і, відповідно, ризику.

Альтернативи не можна порівнювати за якоюсь однією оцінкою, оскільки невідомо, який результат реалізується. Необхідно оцінити весь набір значень результатів за кожною альтернативою, що в цілому складає рядок матриці. Конкретизуємо задачу числовими даними (табл. 5.2).



Після цього можна порівнювати альтернативи вже за цією комплексною оцінкою. Таким чином можна вибрати альтернативу, кращу не за якимось певним результатом, а за всім набором результатів, тому що невідомо, який з них здійсниться.

Таблиця 5.2 – Альтернативні варіанти вибору цільового сегмента ринку і їх наслідки

Сегменти ринку

Результати (прибуток), тис. грн.

1

2

3

4

5

А

100

85

150

70

60

Б

56

190

120

60

72

В

175

110

45

78

84

Г

90

67

180

78

200

Д

40

185

110

120

45

5.3.1 Критерій Вальда


Критерій Вальда – це критерій найбільшої обережності прийняття рішення в умовах невизначеності, який базується на принципі вибору найкращої з найгірших альтернатив Хi за всіма можливими результатами настання альтернативи Yj. Залежно від різновиду матриці рішень критерій Вальда забезпечує мінімізацію максимального програшу (матриця втрат) або максимізацію мінімального виграшу (матриця надбань).

Критерій Вальда призначений для вибору з розглянутих варіантів стратегій варіанта з найбільшим показником ефективності з мінімально можливих показників для кожного з цих варіантів

Відповідно до критерію Вальда кращою вважається альтернатива Х* з множини Хi, що задовольняє наступні умови:



(5.4)

(5.5)

Формула 5.4 застосовується за потреби знаходження вигоди, тобто найкращого результату з найгірших, а формула 5.5 – збитку, тобто найгіршого результату з множини найкращих.

Даний критерій простий і чіткий, але консервативний у тому розумінні, що орієнтує того, хто приймає рішення, на вкрай обережну лінію поведінки.

Застосування даного критерію доцільне за наступних умов:

по-перше, якщо існує висока ймовірність прояву зовнішніх шоків (наприклад, нестабільна економіко-політична ситуація в країні, можливість появи нормативно-правових обмежень щодо даної діяльності тощо), які можуть напряму вплинути на погіршення результату розвитку подій;

по-друге, якщо рішення можна прийняти лише один раз і людина, яка приймає рішення, не має зацікавленості в отриманні великого виграшу;

по-третє, якщо необхідно виключити один із ризиків, тобто застрахувати себе від неочікуваних програшів і забезпечити успіх за будь-яких умов.

Для умов прикладу в табл. 3.2:

X* = тах I (60, 56, 45, 67, 40) = 67

Видно, що найкращим з найгірших показників володіє альтернатива Г, для неї аij =67 найбільше.

5.3.2 Критерій домінуючого результату (крайнього оптимізму)


Критерій домінуючого результату – це критерій оптимізму, який при прийнятті рішення в умовах невизначеності відповідає найкращому серед найкращих результатів настання події.

Критерій домінуючого результату (крайнього оптимізму) для матриці виграшів – якнайкращим рішенням буде те, для якого виграш виявиться максимальним з усіх максимальних

Людина, яка приймає рішення, не бере до уваги ніякий інший можливий результат, як найкращий, оскільки вона орієнтується на найбільш сприятливі умови. Залежно від різновиду матриці рішень критерій домінуючого результату застосовується по-різному:



  1. за умови, коли вибір пов’язаний з визначенням виграшу (доходів), тобто будується матриця надбань, за критерієм домінуючого результату максимізується максимальний виграш (5.6):

(5.6)

  1. за умови, коли вибір пов’язаний з визначенням програшу (збитків), тобто будується матриця втрат, за критерієм домінуючого результату мінімізується мінімальний розмір збитків (5.7):

(5.7)

Для умов прикладу в табл. 5.2:

X* = тах I (150, 190, 175, 200, 185) = 200

Видно, що найкращим з найкращих показників володіє альтернатива Г, для неї аij =200 найбільше.

5.3.3 Критерій Севіджа (мінімального жалю)


Критерій Севіджа – це критерій найменших втрат, який при прийнятті рішення в умовах невизначеності дозволяє визначити найгірші можливі наслідки для кожної з альтернатив Хi та обрати ту, яка є найкращою.

Критерій Севіджа – вибір стратегії, при якій величина ризику приймає якнайменше значення в найсприятливішій ситуації

На практиці існують такі випадки, коли вплив зовнішніх шоків на розвиток результатів події буде давати кращий ефект, ніж прогнозувалося. Виходячи з цього, прийняття рішення щодо вибору альтернативи може бути засноване на використанні не критерію Вальда, а критерію мінімального жалю.

Даний критерій відрізняється від критерію Вальда побудовою не матриці рішень вибору з поміж альтернативних варіантів рішень та їх наслідків, а матриці ризиків. Для побудови матриці ризиків необхідно визначити його елементи. Для цього матриця вибору рішень трансформується в матрицю ризиків наступним чином:

(5.8)

Отримавши трансформовану матрицю для визначення альтернативного рішення, доцільно визначати за допомогою розрахунку мінімаксного (5.5) чи максимінного (5.4) критерію. Використовується в тих випадках, коли потрібно уникнути великого ризику (гірший із кращих).


Для умов прикладу в табл. 5.2:

1. Розраховуємо 1-й стовпчик матриці ризиків:

r11 = 175 – 100 = 75; r21 = 175 – 56 = 119; r31 = 175 – 175 = 0;
r
41 = 175 – 90 = 85; r51 = 175 – 40 = 135; 

2. Розраховуємо 2-й стовпчик матриці ризиків:

r12 = 190 – 85 = 105; r22 = 190 – 190 = 0; r32 = 190 – 110 = 80;
r
42 = 190 – 67 = 123; r52 = 190 – 185 = 5; 

3. Розраховуємо 3-й стовпчик матриці ризиків:

r13 = 180 – 150 = 30; r23 = 180 – 120 = 60; r33 = 180 – 45 = 135; r43 = 180 – 180 = 0; r53 = 180 – 110 = 70; 

4. Розраховуємо 4-й стовпчик матриці ризиків:

r14 = 120 – 70 = 50; r24 = 120 – 60 = 60; r34 = 120 – 78 = 42;
r
44 = 120 – 78 = 42; r54 = 120 – 120 = 0; 

5. Розраховуємо 5-й стовпчик матриці ризиків:

r15 = 200 – 60 = 140; r25 = 200 – 72 = 128; r35 = 200 – 84 = 116; r45 = 200 – 200 = 0; r55 = 200 – 45 = 155; 

На основі отриманих даних формуємо матрицю жалю (табл. 5.3).

Таблиця 5.3 – Матриця жалю

Сегменти ринку

Результати (прибуток), тис. грн.

1

2

3

4

5

А

75

105

30

70

140

Б

119

0

60

60

128

В

0

80

135

42

116

Г

85

123

0

42

0

Д

135

5

70

0

155


X* = тах (140; 128; 135; 123; 155) = 123

Видно, що найменшим з найкращих показників володіє
альтернатива Г, для неї аij =123.

5.3.4 Критерій Лапласа


Заснований на припущенні, що кожен варіант розвитку ситуації “стану природи” рівноймовірний. Тому для прийняття рішення необхідно розрахувати функцію корисності Li для кожної альтернативи, рівну середньоарифметичному показнику привабливості по кожному “стану природи”:

(5.9)

Обирається та альтернатива, для якої функція корисності максимальна.



Для умов прикладу в табл. 5.2:

Якщо ймовірності станів природи правдоподібні, для їх оцінки використовують принцип недостатньої підстави Лапласа, згідно з якою всі стани природи покладаються рівноймовірними, тобто: q1 = q2 = ... = qn = 1/n.



У нашому прикладі qi = 1/5, відповідно:

А1=100·0,2+85·02+150·0,2+ +70·0,2+60·0,2 = 93

або А1=(100+85+150+70+60)·0,2 = 93

Таблиця 5.4 – Матриця прибутків, сформована за критерієм Лапласа

Сегменти ринку



Результати (прибуток), тис. грн.

1

2

3

4

5

А

93

20

17

30

14

12

Б

99,6

11.2

38

24

12

14.4

В




35

22

9

15,6

16.8

Г




18

13.4

36

15,6

40

Д




8

37

22

24

9


X* = mахі (93; 99.6; 98.4; 123; 100) = 123

Висновок: вибираємо стратегію N = 4 (Г).


5.3.5 Критерій Гурвіца


Критерій Гурвіца – це критерій, який при прийнятті рішення в умовах невизначеності дозволяє врахувати стан між граничними значеннями, які відповідають песимістичним та оптимістичним прогнозам.

Критерій Гурвіца використовується, якщо вимагається зупинитися між лінією поведінки з розрахунку на гіршу і лінією поведінки з розрахунку на кращу

Даний критерій дозволяє врахувати комбінацію найгірших результатів розвитку подій на основі пошуку компромісного значення. Відповідно до цього визначається лінійна комбінація мінімального та максимального виграшу:

(5.10)

де – це коефіцієнт, який розглядається як показник оптимізму, .


Якщо доцільно врахувати максимальний розмір ризику, то =0 і критерій Гурвіца співпадає з максимаксним критерієм. За умови мінімізації ризику доцільно значення коефіцієнта встановлювати на рівні 1 і тоді коефіцієнт Гурвіца буде співпадати з критерієм Вальда.
Для умов прикладу в табл. 5.2:

Припустимо, що для нашого прикладу ОПР досить впевнена в позитивному результаті і оцінює ймовірність максимального успіху в а = 0,5.

Тоді:











X* = тахі (105; 123; 110; 133,5; 112,5) = 133,5

Таким чином, в результаті рішення статистичної гри за різними критеріями частіше за інші рекомендувалася стратегія Г.



Поділіться з Вашими друзьями:
1   ...   18   19   20   21   22   23   24   25   ...   28


База даних захищена авторським правом ©divovo.in.ua 2017
звернутися до адміністрації

войти | регистрация
    Головна сторінка


загрузить материал