Nash dengesinin tanımını, saf ve karma strateji durumlarını, bulma yöntemlerini ve klasik örneklerle uygulamalarını öğreneceksiniz. Oyun teorisinin en önemli kavramı olan Nash dengesi, John Nash'in 1950 doktora tezinde ortaya koyduğu devrim niteliğinde bir fikirdir.
Nash dengesi, bir oyunda hiçbir oyuncunun tek başına stratejisini değiştirerek kazancını artıramadığı durumdur. Başka bir deyişle, her oyuncu diğer oyuncuların stratejilerini veri alarak kendisi için en iyi tepkiyi (best response) oynuyorsa, bu strateji profili bir Nash dengesidir.
$u_i$: $i$ oyuncusunun getiri fonksiyonu, $S_i$: $i$ oyuncusunun strateji kümesi.
İki suçlu ayrı odalarda sorgulanıyor. Her biri İtiraf Et (İ) veya Sus (S) stratejilerine sahip. Getiri matrisi (yıl olarak hapis cezası, negatif değerler tercih edilir):
Oyuncu A'nın analizi:
Oyuncu B'nin analizi (simetri): B için de her durumda itiraf etmek daha iyidir.
Nash Dengesi: (İtiraf, İtiraf) → her iki oyuncu da -5 hapis cezası alır.
(Sus, Sus) olsaydı her ikisi de -1 alacaktı (daha iyi toplam sonuç). Ancak bireysel rasyonellik, herkesin itiraf etmesine yol açar. Bu, Nash dengesinin her zaman sosyal olarak optimal olmadığını gösterir.
Bir çift akşam planı yapıyor. İkisi de birlikte olmak istiyor ama farklı etkinlikleri tercih ediyor. A Bale (B)'yi, B Futbol (F)'u tercih ediyor. Birlikte olmak ayrı olmaktan daha iyi.
Adım 1: En iyi tepkiler
Adım 2: Kesişimler
Sonuç: Bu oyunda iki saf strateji Nash dengesi vardır. Ayrıca bir karma strateji Nash dengesi de bulunur (sonraki bölümde).
İki oyuncu aynı anda yazı (Y) veya tura (T) gösterir. Aynı gelirse A kazanır, farklı gelirse B kazanır.
En iyi tepkiler:
Hiçbir hücrede en iyi tepkiler kesişmez. Bu oyunda saf strateji Nash dengesi yoktur. Ancak karma strateji Nash dengesi vardır.
Karma strateji, oyuncunun stratejileri arasında bir olasılık dağılımı kullanmasıdır. 2×2 oyunlarda karma strateji dengesi, beklenen getirileri eşitleme yöntemiyle bulunur.
Adımlar:
▪️ A oyuncusu Y stratejisini $p$ olasılıkla, T stratejisini $1-p$ olasılıkla oynasın.
▪️ B oyuncusu Y stratejisini $q$ olasılıkla, T stratejisini $1-q$ olasılıkla oynasın.
▪️ A'nın beklenen getirisini $q$'ya göre yaz. A'nın $p$'yi $q$'dan bağımsız kılmak için $q$ öyle seçilir ki A'nın iki stratejisinin beklenen getirisi eşit olur.
▪️ Benzer şekilde B için $p$ bulunur.
A oyuncusu Y'yi $p$, T'yi $1-p$ olasılıkla oynasın.
B oyuncusu Y'yi $q$, T'yi $1-q$ olasılıkla oynasın.
A'nın beklenen getirisi:
A'nın karma strateji oynamaya istekli olması için $E_A(Y) = E_A(T)$ olmalıdır:
B'nin beklenen getirisi:
B'nin karma strateji oynaması için $E_B(Y) = E_B(T)$:
Karma Strateji Nash Dengesi: A: $(\frac{1}{2}, \frac{1}{2})$, B: $(\frac{1}{2}, \frac{1}{2})$
Yani her iki oyuncu da yazı ve turayı eşit olasılıkla rastgele seçmelidir. Oyunun değeri: $E = 0$ (beklenen getiri sıfır).
| Özellik | Saf Strateji Nash Dengesi | Karma Strateji Nash Dengesi |
|---|---|---|
| Strateji | Belirli bir aksiyon (Örn: hep İtiraf) | Olasılık dağılımı (Örn: %50 Y, %50 T) |
| Varlık | Her oyunda yoktur | Her sonlu oyunda vardır* (Nash, 1950) |
| Bulma Yöntemi | En iyi tepki kesişimi | Beklenen getiri eşitleme / Doğrusal programlama |
| Örnek | Mahkum İkilemi (İ,İ) | Matching Pennies (½,½) |
*Nash'ın varlık teoremi: Sonlu sayıda oyuncu ve sonlu sayıda saf strateji içeren her oyunda en az bir Nash dengesi (saf veya karma) vardır.
| Oyun | Saf Strateji Nash Dengeleri | Karma Strateji Nash Dengesi |
|---|---|---|
| Mahkum İkilemi | (İtiraf, İtiraf) | Yok (saf denge baskın) |
| Cinsiyet Savaşı | (Bale, Bale) ve (Futbol, Futbol) | Var ($p=\frac{2}{3}, q=\frac{1}{3}$) |
| Matching Pennies | Yok | Var ($p=\frac{1}{2}, q=\frac{1}{2}$) |
| Güven Oyunu | (Güven, Kazanç) | — |
| Tavuk Oyunu (Chicken) | (Y, D) ve (D, Y) | Var |
Nash dengesi = Hiçbir oyuncunun tek başına sapma (strateji değiştirme) isteği duymadığı durum
▪️ John Nash tarafından 1950'de doktora tezinde ortaya konmuştur.
▪️ 1994'te Nash, Harsanyi ve Selten ile birlikte Nobel Ekonomi Ödülü almıştır.
▪️ Nash'ın varlık teoremi: Her sonlu oyunda en az bir Nash dengesi vardır.
▪️ Nash dengesi her zaman Pareto-optimal (sosyal açıdan en iyi) olmak zorunda değildir (Mahkum İkilemi).
▪️ Bir oyunda birden fazla Nash dengesi olabilir (Battle of the Sexes).