Rola trwałOŚci relacji kooperacyjnych oraz skłonności do zapominania zdrad w modelu interakcji opartym na dylemacie więŹnia streszczenie



Pobieranie 133.65 Kb.
Data10.05.2016
Rozmiar133.65 Kb.

ZESZYTY NAUKOWE POLITECHNIKI ŚLĄSKIEJ 2011

Seria: Organizacja i Zarządzanie z. 57 Nr kol. 1847



Tomasz Owczarek

Politechnika Śląska

Wydział Organizacji i Zarządzania

Zakład Ekonomii i Informatyki



ROLA TRWAŁOŚCI RELACJI KOOPERACYJNYCH ORAZ SKŁONNOŚCI DO ZAPOMINANIA ZDRAD W MODELU INTERAKCJI OPARTYM NA DYLEMACIE WIĘŹNIA

Streszczenie. Artykuł prezentuje wieloagentowy model symulacyjny interakcji opartych na dylemacie więźnia. Analizowany jest wpływ, jaki na wyłanianie się kooperacji mają trwałość współdziałania między agentami oraz skłonność do zapomina­nia zdrad.

THE ROLE OF COOPERATION DURABILITY AND DEFECTION FORGETFULNESS IN INTERACTION MODEL BASED ON PRISONER’S DILEMMA



Summary. The article presents agent-based simulation model of interactions based on prisoner’s dilemma. It is used to analyze the influence of cooperation durability and defection forgetfulness on emergence of cooperation between agents.

1.Wstęp


Współpraca pomiędzy przedsiębiorstwami od lat 80. ub.w. stanowi przedmiot wzrastającej liczby badań i publikacji. Zainteresowanie tą tematyką wynika z coraz liczniejszych i coraz bardziej różnorodnych form współdziałania pomiędzy uczestnikami rynku [2], co niewątpliwie skorelowane jest z rozwojem technologii informacyjnych [10, s. 104]. Na skutek tego w za­rzą­dzaniu strategicznym daje się zaobserwować stopniowe przenoszenie zainteresowania z, można by rzec, „tradycyjnej” budowy przewagi konkurencyjnej, opartej na porterowskiej analizie pozycyjnej, na rzecz rozwijania kompetencji relacyjnych [12, s. 188], w tym kształtowaniu pozytywnych relacji partnerskich nawet z konkurentami [6, 8].

Tematyka współpracy jest istotna z punktu widzenia różnych dyscyplin naukowych, a po­dej­mowana była w licznych badaniach empirycznych lub rozważaniach teoretycznych. Wśród tych drugich na szczególną uwagę zasługują prace Roberta Axelroda, który do badań nad zjawiskiem wyłaniania się współpracy w środowisku złożonym z egoistycznych (tj. dbających tylko o własny interes) jednostek wykorzystał teoriogrowy model konfliktu – iterowany dylemat więźnia [1].1 Choć sam dylemat więźnia znany jest od lat 50. ub.w. [18, s. 94] i od tam­tej pory jest wykorzystywany w publikacjach z zakresów m.in. ekonomii, psychologii społecznej, biologii ewolucyjnej czy socjologii [3, 4, 9, 18], to właśnie rezultaty badań Axelroda stanowią, jak do tej pory, najszersze (i zarazem najbardziej ogólne) opracowanie zasad związanych ze zjawiskiem współpracy, których konsekwencje praktyczne rozciągają się na niemal wszystkie aspekty życia.

Niniejszy artykuł stanowi w pewnym sensie rozwinięcie zasugerowanej przez Axelroda koncepcji systemu terytorialnego, w którym występują jedynie lokalne interakcje pomiędzy bezpośrednimi sąsiadami [1, s. 158-168]. Celem artykułu jest prezentacja wieloagentowego modelu symulacyjnego interakcji (zgodnych z zasadami dylematu więźnia) pomiędzy autonomicznymi jednostkami i, za jego pomocą, analiza wpływu, jaki na możliwość wyłaniania się współpracy wywierają trwałość relacji kooperacyjnych oraz zdolność do zapominania („przebaczania”) wcześniejszych zdrad. Podążając za metodologią budowy wieloagentowych modeli symulacyjnych, zaproponowaną w [17], model oparto na wcześniejszych opracowaniach z tej tematyki [14, 7].

Artykuł zorganizowano w następujący sposób: w punkcie drugim zaprezentowano opis gry dylemat więźnia, a także główne rezultaty badań Axelroda oraz opracowane na ich podstawie modele symulacyjne. Z uwagi na cel artykułu pominięto wiele informacji i pojęć dotyczących zarówno dylematu więźnia, jak i ogólnie teorii gier, które nie są bezpośrednio związane z dalszą częścią artykułu (szerokie omówienie wielu wariantów i modyfikacji dylematu więźnia można znaleźć w [18, 19]). W punkcie trzecim zamieszczono opis opracowanego modelu oraz zaprezentowano i omówiono wyniki dwóch serii symulacji. Punkt czwarty zawiera krótkie podsumowanie artykułu.


2.Kooperacja w systemie terytorialnym

2.1.Dylemat więźnia, „wet-za-wet”, strategia zbiorowo stabilna


Dylemat więźnia jest dwuosobową grą o sumie niezerowej, w której każdy z graczy ma do wyboru jedną z dwóch strategii: współpracę (Ccooperation) lub zdradę (Ddefection). Gracze podejmują decyzje jednocześnie (a dokładniej, bez znajomości wyboru drugiego gracza). Kombinacja strategii obu graczy określa wynik gry, tzn. wypłaty dla obu graczy – im wyższa wypłata, tym lepiej dla gracza. Postać ogólną dylematu więźnia przedstawia rys. 1.





gracz 2




C

D

gracz 1

C

(R, R)

(S, T)

D

(T, S)

(P, P)

Rys. 1. Wypłaty w grze dylemat więźnia (pierwszy symbol w nawiasie jest wypłatą gracza 1)

Fig. 1. Payoffs in prisoner’s dilemma game (first symbol in brackets represents player’s 1 payoff)

Wartości wypłat w dylemacie więźnia muszą spełniać następujące warunki:


  1. W1: T > R > P > S,

  2. W2: 2R > T + S.

Pierwszy warunek sprawia, że – niezależnie od decyzji współgracza – bardziej opłacalna jest zdrada (bo T > RP > S)2. Pojawia się jednak dylemat, ponieważ dla obu graczy współpraca jest lepsza od obustronnej zdrady (R > P). Drugi warunek gwarantuje, że jednoczesna współpraca jest bardziej opłacalna niż wartość oczekiwana wypłaty, w sytuacji gdy istnieją takie same szanse uzyskania T lub S.

Wypłaty w dylemacie więźnia dobrane są tak, aby odpowiedź na pytanie o najlepszy rezultat nie była oczywista.3 Z jednej strony, równowagę Nasha stanowi kombinacja strategii (DD). Z drugiej – uzyskany w punkcie równowagi rezultat nie jest paretooptymalny [18, s. 87] i obaj gracze mogą uzyskać lepszy wynik, ale w pojedynczej rozgrywce, bez dodatkowych założeń, nie istnieją żadne przesłanki, które przemawiałyby za wynikiem (CC), tzn. obustronną współpracą.



Inaczej jest w przypadku rozgrywki powtarzalnej, tzn. takiej, w której gracze kilkukrotnie rozgrywają dylemat więźnia i ich decyzje w kolejnych etapach uzależnione mogą być od re­zul­tatów etapów wcześniejszych. Chociaż iterowany dylemat więźnia stanowi mocno uproszczony model interakcji, pomijając wiele czynników (m.in. możliwość komunikacji między graczami, wpływ osób trzecich, niepewność co do rzeczywistego ruchu gracza w przeszłości), pozwala on uchwycić istotę gry i wiele subtelnych niuansów, które w bardziej złożonym modelu mogłyby zostać pominięte [1, s. 19]. Jak twierdzi Axelrod, tak zdefiniowana rozgrywka oraz przyjęte do niej założenia są wystarczająco ogólne, aby stanowiły model szerokiej grupy interakcji, ponieważ [1, s. 17-18]:

  1. nie nakładają rygorystycznych ograniczeń na wartości wypłat – wypłaty obu graczy nie muszą być symetryczne (jak na rys. 1) czy nawet porównywalne, ważne jedynie, żeby spełniały warunki W1 i W2;

  2. nie preferują żadnego z możliwych rezultatów interakcji (tzn. nie istnieje „trzecia strona”, która w jakikolwiek sposób skłaniałaby graczy do podejmowania współpracy);

  3. nie zakładają racjonalności graczy – dążąc do uzyskania jak najlepszego wyniku, gracze mogą postępować w różny sposób, niekoniecznie optymalny czy nawet świadomy.

Wnioski z przeprowadzonych przez Axelroda trzech turniejów, w których różne strategie4 konkurowały ze sobą, wskazują, że trwała współpraca pomiędzy samolubnymi jednostkami jest możliwa (bez jakichkolwiek zewnętrznych umów czy nakazów), o ile tylko istnieje wystarczająco wysoka szansa wystąpienia interakcji pomiędzy tymi jednostkami w przyszłości. Wymaga to jednak tego, aby [1, s. 174-175]:

  • jednostki pamiętały o partnerach (przeciwnikach) i ich wcześniejszych decyzjach,

  • istniały mechanizmy rozprzestrzeniania się strategii odnoszących sukcesy,

  • strategie potrafiły reagować odpowiednio na postępowanie partnerów (natychmiast karać zdradę, ale być także zdolne do przebaczania).

W trzech przeprowadzonych przez Axelroda turniejach najlepszy rezultat (liczony jako średni wynik uzyskany z gry przeciwko wszystkim pozostałym strategiom) uzyskała strategia o nazwie „wet-za-wet” (tit-for-tat). Strategia ta ma wymienione wcześniej cechy, wymagane do pojawienia się współpracy, i można ją opisać dwoma prostymi instrukcjami:

  1. rozpocznij od współpracy,

  2. w każdej następnej rundzie graj to, co przeciwnik zagrał poprzednim razem.

Analiza wyników turnieju oraz sukces strategii „wet-za-wet” pozwolił Axelrodowi na sformułowanie definicji tzw. strategii zbiorowo stabilnej (collectively stable strategy), tzn. takiej, która jest odporna na „inwazję” jakiejkolwiek innej, pojedynczej strategii (tzn. u­zys­ku­je od niej nie gorszy wynik), ale niekoniecznie odporna na inwazję grupy strategii, jeśli tylko interakcje między tymi nowymi strategiami będą wystarczająco częste [1, s. 56 60]. Przykładowo, strategia „zawsze D” jest zbiorowo stabilna – jakakolwiek nowa strategia, która pojawi się w populacji złożonej z osobników grających „zawsze D”, nie ma szansy na uzyskanie lepszego wyniku (w każdej rundzie wynik strategii „zawsze Dto przynajmniej P, pojedyncza nowa strategia może uzyskać co najwyżej P). Jednak jeśli w takiej populacji pojawiłaby się grupa strategii „wet-za-wet” i członkowie tej grupy graliby ze sobą wystarczająco często (uzyskując w interakcjach między sobą w każdej rundzie R), to średni wynik strategii „wet-za-wet” okazałby się wyższy i strategia taka miałaby szansę rozprzestrzenić się na całą populację.5

2.2.Gry przestrzenne, symulacje wieloagentowe


Wcześniejsze rozważania można przenieść na tzw. system terytorialny, w którym przeciwnicy w grze są dobierani nie w sposób całkowicie losowy, ale na podstawie kryterium odległości w pewnej przestrzeni (reprezentującej przestrzeń geograficzną lub też bardziej abstrakcyjnej, np. reprezentację działalności biznesowej). Strategie grają ze swoimi „sąsiadami” w tej przestrzeni (rys. 2), a w kolejnych rundach kopiują zachowanie tego sąsiada, którego średni wynik ze wszystkich interakcji w poprzedniej rundzie był najlepszy [1, s. 158]. Mechanizmem rozprzestrzeniania się strategii jest w tym przypadku imitacja (spotykana często w naturze, ale również w działalności organizacji [15, s. 96]). Okazuje się, że w systemie terytorialnym własność zbiorowej stabilności jest podtrzymana [1, s. 160].


C

C

C

C

C

C

B

B

B

C

C

B

A

B

C

C

B

B

B

C

C

C

C

C

C

Rys. 2. Przykładowy system terytorialny – B stanowią sąsiedztwo A

Fig. 2. Example of territorial system – B are neighbors of A

Szczegółowe badania nad wyłanianiem się kooperacji w systemie przestrzennym, reprezentowanym za pomocą dwuwymiarowego automatu komórkowego, można znaleźć w pracy [14]. W modelu tym każda komórka dwuwymiarowej przestrzeni mogła przyjąć jeden z dwóch stanów: C lub D (odpowiadające strategiom w dylemacie więźnia). Początkowy stan komórek ustalany był w sposób losowy. W każdej iteracji komórka rozgrywała uproszczoną wersję dylematu więźnia (rys. 3) z jej ośmioma sąsiadami6 oraz z samą sobą, a jej wypłata składała się z sumy wygranych z poszczególnych rozgrywek. W następnym pokoleniu stan danej komórki odpowiadał najlepszej strategii, wybieranej spośród strategii ośmiu jej sąsiadów oraz jej samej. Tak zdefiniowane zasady „gry przestrzennej” (spatial game) powodowały, że jej rezultat był w sposób deterministyczny zależny od warunków początkowych oraz od parametru b, odpowiadającego wypłacie za jednostronną zdradę T.





gracz 2




C

D

gracz 1

C

(1, 1)

(0, b)

D

(b, 0)

(0, 0)

Rys. 3. Struktura wypłat w grze wykorzystanej w [14]

Fig. 3. Payoffs’structure used in [14]

Przeprowadzone eksperymenty ujawniły 18 różnych wartości parametru b, dla których działanie całego systemu ulegało zmianie. Zmiany te obejmowały takie elementy, jak: liczba iteracji, po której następuje przejście systemu do stanu stacjonarnego w postaci cyklicznych zmian, długość tych cykli, liczebność komórek typu C oraz różnorodność form skupisk tworzonych przez te komórki. Wykazano w ten sposób, że w modelu w postaci dwuwymiarowej przestrzeni z ograniczoną liczbą lokalnych interakcji nawet minimalna zmiana wypłaty (zgodna z podstawowymi założeniami dylematu więźnia) ma olbrzymie znaczenie dla całego systemu.

Jeszcze bardziej istotny okazał się fakt, że kooperacja w systemie terytorialnym przetrwała nawet bez obecności wszystkich zaproponowanych przez Axelroda warunków. Efekt przestrzenny oraz zasady rozprzestrzeniania się strategii powodowały powstawanie różnego rodzaju skupisk komórek tego samego typu. Te stabilne enklawy kooperujących między sobą komórek pojawiały się nawet pomimo wyraźnej przewagi w wypłatach strategii zdradzającej.

Podobne rezultaty, stosując symulację wieloagentową, uzyskali Ge i Liu [7]. Nowością w ich modelu jest niepełne pokrycie przestrzeni. Dzięki temu strategie (a dokładniej – agenci reprezentujący strategie) miały różną liczbę sąsiadów. W rezultacie, pozwoliło to na wprowadzenie mobilności, mającej wg autorów reprezentować w uproszczony sposób zmiany zachodzące na rynku – w każdej iteracji agent przemieszczał się w losowym kierunku, o ile tylko dane pole było wolne.

Inaczej niż wcześniej, model Ge i Liu nie był modelem deterministycznym – losowy ruch powodował, że powstające skupiska agentów podobnego typu były nietrwałe, a cały system kończył w stanie, w którym wszyscy agenci grali tą samą strategią.


3.Symulacje

3.1.Opis modelu


Poniżej umieszczono szczegółowy opis modelu, którym posłużono się w opisanych w dalszej części artykułu eksperymentach symulacyjnych.

  • Przestrzeń gry stanowiła płaszczyzna o wymiarach 35 x 35 o toroidalnym kształcie (komórki przy górnej krawędzi sąsiadowały z komórkami krawędzi dolnej, a skrajnie lewe – z komórkami skrajnie prawymi).

  • Liczba agentów wynosiła 980, co, podobnie jak w modelu Ge i Liu, dawało stopień pokrycia równy 80% (każdy agent zajmował dokładnie jedną komórką, na każdej komórce w danej iteracji mógł przebywać tylko jeden agent).

  • Każdy z agentów mógł przyjąć jeden z trzech typów:

  • typ C – współpracował ze wszystkim sąsiadami,

  • typ D – zdradzał wszystkich sąsiadów,

  • typ T – stosował strategię „wet-za-wet”.

  • Początkowe typy agentów określane były w sposób losowy, przy czym prawdopodobieństwo, że agent będzie typu C lub T ustalono na 0,9, natomiast prawdopodobieństwo, że agent niebędący typu D będzie miał typ T wynosiło pt.

  • Każda iteracja składała się z następujących kroków:

  1. Agent rozgrywa ze swoimi sąsiadami pojedynczą partię dylematu więźnia i sumuje uzyskane z tych rozgrywek wypłaty.

  2. Agent sprawdza, który z jego sąsiadów uzyskał w tej iteracji najwyższy wynik.

  3. Jeśli wynik ten przewyższa wynik agenta, zmienia on swój typ na typ sąsiada z najwyższym wynikiem.

  4. Agent losuje jedną spośród sąsiadujących z nim komórek. Jeśli wylosowana komórka nie jest zajmowana przez innego agenta, przemieszcza się on na nią.

  • Wypłaty agentów określono w taki sam sposób, jak w [14]:

  • wypłata za wzajemną współpracę wynosiła 1,

  • wypłata za zdradę współpracującego partnera wynosiła b,

  • pozostałe wypłaty wynosiły 0.

  • W modelu uwzględniono dwa typy otoczeń: von Neumanna oraz Moore’a.

Tak zdefiniowany model pozwolił na ograniczenie podstawowej liczby parametrów opisujących warianty symulacji do dwóch: pt oraz b. Implementacji modelu dokonano w programie NetLogo (jest to darmowe środowisko programistyczne do tworzenia modeli wieloagentowych) [20]. Poprawność implementacji zweryfikowano, powtarzając wybrane warianty symulacji z prac [7, 14].

3.2.Opis przeprowadzonych symulacji


Opracowany model posłużyć miał do zbadania, jaki wpływ na wyłanianie się współpracy mają trwałość relacji kooperacyjnych pomiędzy jednostkami oraz zdolność do zapominania wcześniejszych zdrad. Ponieważ model nie był kalibrowany na podstawie jakichkolwiek danych empirycznych, oczekiwane wyniki nie mogły być precyzyjne, a wnioski płynące z dzia­łania modelu miały mieć formę raczej ogólnych zdań, np. „nawet niewielka szansa na przetrwanie współpracy pomiędzy agentami niebędącymi sąsiadami w wyraźny sposób wpływa na działanie całego systemu”. Aby jednak osiągnąć cel, w świetle wcześniejszych badań stwierdzających istotną rolę parametru b, przeprowadzono wiele wstępnych symulacji (wszystkie z pt = 0). W rezultacie ustalono przedziały wartości b, dla których cały model zachowuje się w podobny sposób (tab. 1 oraz rys. 4). Pozwoliło to ograniczyć kolejne symulacje jedynie do tych wariantów, które w sposób istotny różniły się między sobą.

Tabela 1


Zachowanie modelu w zależności od wartości parametru b

Wartości parametru b

Zachowanie modelu

otoczenie von Neumanna

otoczenie Moore’a



1,01 – 1,19

Wszyscy agenci przyjmują typ C

1,01 – 1,33

1,20 – 1,49

Jednoczesne występowanie agentów typu CD

1,34 i więcej

1,5 i więcej

Wszyscy agenci przyjmują typ D

W pierwszej serii symulacji wprowadzono dodatkowy parametr pl. Za każdym razem gdy następowała interakcja pomiędzy dwoma agentami typu C, wartość pl stanowiło prawdopodobieństwo utworzenia trwałej relacji (określanego w modelu jako połączenie) pomiędzy tymi agentami. Połączeni agenci byli traktowani jako sąsiedzi bez względu na swoje aktualne położenie. Relacja znikała w momencie, gdy któryś z agentów zmienił typ na D. W każdej iteracji istniało również prawdopodobieństwo równe (1 – pl), że połączenie przestanie istnieć. Parametr pl określał więc trwałość relacji kooperacyjnych.



Rys. 4. Trzy przykładowe przebiegi symulacji dla różnych wartości b (oś X – numer iteracji, oś Y – liczebność agentów typu C)

Fig. 4. Three examples of simulation runs with different b (X-axis – iteration number, axis – quantity of type-C agents)

W tab. 2 zamieszczono informacje o tym, ile razy symulacje zakończyły się wraz ze wszystkimi agentami typu C (globalna współpraca) lub D (globalna rywalizacja). Sprawdzono następujące trzy warianty:



  • vn-1.34 – otoczenie von Neumanna i b = 1,34,

  • mo-1.20 – otoczenie Moore’a i b = 1,20,

  • mo-1.50 – otoczenie Moore’a i b = 1,50.

We wszystkich wariantach nie występowali agenci typu T (pt = 0).

Każdy wariant powtarzany był 10 razy. Symulację przerywano w momencie, gdy wszyscy agenci byli tego samego typu lub czas jej trwania przekroczył liczbę 1000 iteracji. Analiza uzyskanych rezultatów wskazuje, że dla umiarkowanie dużego b (wariant mo-1.20) wysokie wartości pl istotnie promują agentów typu C. Wpływ pl jest jednak bardzo nikły, jeżeli b jest stosunkowo duże – w wariantach vn-1.34mo-1.50 wysoka wartość wypłaty za zdradę zdecydowanie sprzyjała agentom typu D i to w zasadzie nie uległo zmianie nawet dla stosunkowo wysokich wartości pl. Jedynie dla pl > 0,8 cały system kończył w stanie globalnej współpracy. Tak jak można było oczekiwać, wpływ pl jest większy w środowiskach z otoczeniem von Neumanna – obecność dodatkowych połączeń pomiędzy agentami sprawiła, że cały system znacznie rzadziej kończył w stanie globalnej rywalizacji.

Tabela 2

Rezultaty symulacji dla różnych wartości pl



pl

vn-1.34

mo-1.20

mo-1.50

D

C

D

C

D

C

0,1

6

0

0

0

10

0

0,2

7

0

0

0

10

0

0,3

8

0

0

1

10

0

0,4

9

0

0

0

10

0

0,5

1

0

0

5

10

0

0,6

0

0

0

10

10

0

0,7

0

0

0

10

10

0

0,8

0

0

0

10

0

0

0,9

0

10

0

10

0

10

1

0

10

0

10

0

10

Druga seria symulacji wymagała obecności agentów typu T. Wprowadzono dodatkowy parametr pf, który odpowiadał za łatwość „zapominania” wcześniejszych ruchów pozostałych agentów – w każdej iteracji istniało prawdopodobieństwo równe pf, że agent zapomni poprzedni ruch któregoś ze swoich byłych przeciwników.

Wyniki symulacji przeprowadzonych dla otoczenia Moore’a i pt = 1 (agenci byli jedynie typu T lub D) zamieszczono w tab. 3 (podobnie jak poprzednio, każdy wariant powtarzany był 10 razy, a maksymalny czas trwania symulacji ustawiono na 1000 iteracji). Ich analiza sugeruje, że w przeciwieństwie do parametru pl, którego wyższa wartość promowała globalną współpracę, charakter współczynnika pf jest mniej jednoznaczny. Dla osiągnięcia globalnej współpracy jego optymalna wartość powinna być nieznacznie wyższa od zera. Przy niskim lub umiarkowanie wysokim b brak „zapomnienia” (tzn. pf = 0) nie stanowi przeszkody. Jednak dla b = 2 wszystkie symulacje zakończyły się globalną rywalizacją, podczas gdy dla pf = 0,1 stało się tak tylko w jednym przypadku. Umiarkowane (ale wyższe od zera) wartości pf powodowały też szybszy zanik agentów typu D.

Tabela 3


Wyniki symulacji dla różnych wartości parametru pf

pf

b

średni czas trwania symulacji (w iteracjach)

liczba symulacji, w których wszyscy agenci przyjęli typ T

liczba symulacji, w których wszyscy agenci przyjęli typ D

0

1,19

16,1

10

0

1,2

16,7

10

0

1,49

30,5

10

0

1,5

61,9

10

0

1,99

213,2

10

0

2

28,2

0

10

cd. tabeli 3

pf

b

średni czas trwania symulacji (w iteracjach)

liczba symulacji, w których wszyscy agenci przyjęli typ T

liczba symulacji, w których wszyscy agenci przyjęli typ D

0,1

1,19

12,1

10

0

1,2

12,6

10

0

1,49

27,2

10

0

1,5

37,2

10

0

1,99

959,9

1

0

2

901,1

0

1

0,2

1,19

11,5

10

0

1,2

12,3

10

0

1,49

38

10

0

1,5

65,6

10

0

1,99

999

0

0

2

701,4

0

3

0,3

1,19

13,1

10

0

1,2

13,5

10

0

1,49

50,9

10

0

1,5

217,5

10

0

1,99

999

0

0

2

327,7

0

9

0,5

1,19

14,6

10

0

1,2

14,2

10

0

1,49

652,9

6

0

1,5

999

0

0

1,99

748,9

0

4

2

17,5

0

10

4.Podsumowanie


W artykule zaprezentowano model symulacyjny oparty na pracach [1, 14, 7]. Model ten posłużył do zbadania związku między wyłanianiem się relacji kooperacyjnych a ich trwałością oraz skłonnością do zapominania wcześniejszych zdrad.

Uzyskane rezultaty wskazują, że wzrost trwałości stosunków kooperacyjnych między poszczególnymi partnerami w sposób jednoznaczny pozytywnie wpływa na stopień globalnej współpracy, podczas gdy wpływ skłonności do zapominania poprzednich decyzji partnerów jest mniej oczywisty.



Wyniki symulacji są w pełni zgodne z teoretycznymi rozważaniami Axelroda, stąd też ich wartość poznawcza nie jest zbyt wysoka. Przemawiają one jednak za poprawnością założeń leżących u podstaw modelu oraz jego prawidłowej implementacji w postaci programu komputerowego. W przyszłości planuje się dalszy rozwój modelu oraz uwzględnienie i rozwinięcie dodatkowych mechanizmów zasugerowanych w innych opracowaniach [5, 13].

bibliografia

  1. Axelrod R.: The Evolution of Cooperation. Basic Books, Nowy York 2006.

  2. Czakon W.: Dynamika więzi międzyorganizacyjnych przedsiębiorstwa. Wydawnictwo Akademii Ekonomicznej, Katowice 2007.

  3. Dawkins R.: Samolubny gen. Prószyński i S-ka, Warszawa 2007.

  4. Drabik E.: Elementy teorii gier dla ekonomistów. Wydawnictwo Uniwersytetu w Białymstoku, Białystok 1998.

  5. Droz M., Szwabiński J., Szabó G.: Motion of influential players can support cooperation in Prisoner’s Dilemma. European Physical Journal B, Vol. 71, No. 4, 2009.

  6. Fisher L.M.: Preaching Love Thy Competitor. New York Times, 29 marca 1992, http://www.nytimes.com/1992/03/29/business/preaching-love-thy-competitor.html, 31.08.2010.

  7. Ge Z., Liu J.: Simulation for collaborative competition based on multi-agent, [w:] Y. Shi et al. (eds.): Cuttin Edge Research Topics on Multiple Criteria Decision Making. MCDM, CCIS 35, 2009.

  8. Hamel G., Doz Y.L., Prahalad C.K.: Collaborate with Your Competitors – and Win. Harvard Business Review, 1989.

  9. Hardin G.: The Tragedy of the Commons. Science, No. 162, 1968.

  10. Kaczmarek B.: Współdziałanie przedsiębiorstw w gospodarce rynkowej. Wydawnictwo Uniwersytetu Łódzkiego, Łódź 2000.

  11. Kowalska-Styczeń A.: Symulowanie złożonych procesów ekonomicznych za pomocą automatów komórkowych. Wydawnictwo Politechniki Śląskiej, Gliwice 2007.

  12. Krupski R., Niemczyk J., Stańczyk-Hugiet E.: Koncepcje strategii organizacji. Polskie Wydawnictwo Ekonomiczne, Warszawa 2009.

  13. Nowak M.A., Bonhoeffer S., May R.M.: More Spatial Games. International Journal of Bifurcation and Chaos, Vol. 4, No. 1, 1994.

  14. Nowak M.A., May R.M.: The Spatial Dilemmas of Evolution. International Journal of Bifurcation and Chaos, Vol. 3, No. 1, 1993.

  15. Malawski M., Wieczorek A., Sosnowska H.: Konkurencja i kooperacja. Teoria gier w ekonomii i naukach społecznych. Wydawnictwo Naukowe PWN, Warszawa 1997.

  16. Parkhe A.: Strategic Alliance Structuring: a Game Theoretic and Transaction Cost Examination of Interfirm Cooperation. Academy of Management Journal, Vol. 36, No. 4, 1993.

  17. Richiardi M., Leombruni R., Saam N., Sonnesa M.: A Common Protocol for Agent-Based Social Simulations. Journal of Artifficial Scieties and Social Simulation, Vol. 9, No. 1, 2006.

  18. Straffin P.D.: Teoria gier. Wydawnictwo Naukowe „Scholar”, Warszawa 2004.

  19. Sulejewicz A.: Współpraca konkurencyjna przedsiębiorstw w świetle teorii gier. Oficyna Wydawnicza SGH, Warszawa 1994.

  20. Wilensky, U.: NetLogo. http://ccl.northwestern.edu/netlogo/. Center for Connected Learning and Computer-Based Modeling, Northwestern University, Evanston, IL, 1999.

Recenzent: Dr hab. inż. Ireneusz J. Jóźwiak

Abstract

The article presents agent-based simulation model of interactions based on prisoner’s dilemma. The model is based on Axelrod’s experiments and its further developments using cellular automata and agent-based modeling. Two series of simulation runs are conducted and their results are presented. In the first the influence of cooperation relation durability on emergence of cooperation between agents is tested (table 2). In the second there is introduced a parameter responsible for forgetfulness of other agents’ defection and its impact on the whole system performance (table 3).



1 Pierwsze podsumowanie badań Axelroda wydano w 1984 r. W artykule oparto się na wydaniu z 2006 r.

2 Warto zaznaczyć, że w definicji dylematu więźnia w [15] relacja pomiędzy wypłatami P i S przyjmuje postać słabej nierówności.

3 Na uwagę zasługuje fakt, że struktura wypłat w dylemacie więźnia jest zgodna z postrzeganymi korzyściami lub stratami w aliansach strategicznych [16].

4 W iterowanym dylemacie więźnia strategia rozumiana jest jako odwzorowanie (niekoniecznie deterministyczne) wcześniejszych rezultatów gry na decyzję (tzn. wybór C lub D) w danej rundzie gry.

5 Warto zaznaczyć, że (o ile tylko potencjalne, przyszłe wypłaty są odpowiednio wysokie) nie istnieje jedna najlepsza strategia, niezależna od strategii, z którymi przychodzi jej się zmierzyć [1, s. 15]. Sama strategia „wet-za-wet” nie jest odporna na inwazję mieszaniny dwóch strategii: „podejrzliwy wet-za-wet” oraz „wet-za-dwa-wety” [3, s. 273].

6 W teorii automatów komórkowych ten typ sąsiedztwa określa się mianem otoczenia Moore’a, w odróżnieniu od otoczenia von Neumanna – uwzględniającego tylko cztery sąsiednie komórki [11, s. 16-17].






©absta.pl 2019
wyślij wiadomość

    Strona główna