Универзитет „Св.

Кирил и Методиј“
Факултет за електротехника и информациски
технологии

Примена на теорија на игри во П2П и
мобилни ад хок мрежи

Предметен наставник:

Изработил:

Проф. Д-р Аксенти Грнаров

Ангел Џеков

2008, Скопје
Содржина:
Теорија на игри како алатка за правење стратегија и за
предвидување на однесувањето на јазлите во Peer-to-Peer мрежи
I.
II.
III.
IV.

Вовед.............................................................................................3
Игра на услуга................................................................................5
Неш еквилибриум на играта на услуга..............................................7
А.
Еквилибриум на чиста стратегија......................................................7
Б.
Еквилибриум на мешана стратегија...................................................8
Својства на еквилибриумот на Неш
А.
Едноставност на пресметување на стратегијата на еквилибриум................10
Б.
Решавање на проблемот на ’шлепање’..............................................11
В.
Правило на 50 проценти..............................................................12
Г.

Правичност - Подеднакво споделување на штетата од
неефикасноста на системот...........................................................13

Д.

Намалување на ’алфа’ за зголемување на придонесот............................14

Користење на теорија на некомплетно кооперативни игри во мобилни
ад хок мрежи
I.
II.
III.

IV.
V.

Вовед............................................................................................15
Воведни објаснувања
А.
Опис на теорија на игри..............................................................16
Б.
Опис на DCF............................................................................17
Опис на теоријата на некомплетно кооперативни игри
А.
Карактеристики на теорија на некомплетно кооперативни игри.................18
Б.
Состојба на игра.......................................................................19
В.
Процена на состојба на игра.........................................................19
Г.
Стратегија на еквилибриум...........................................................20
Резултати од симулацијата.............................................................22
Заклучоци.....................................................................................28

2

П2П е моќна вмрежувачка парадигма во подем. 3 . Повеќе ветува моделот на стимулација врз база на углед. кога јазлите добиваат услуга врз база на нивната репутација (углед). скалабилен и флексибилен начин. Освен тоа. Теоријата на игри може да биде употребена од страна на индивидуални јазли за определување на нивната оптимална стратегија за нивото на учество во тој п2п систем. Угледот се користи како механизам за стимулирање на јазлите да споделуваат ресурси и овозможуваат услужување на другите. Општо прифатено е дека шлепањето го гуши моментниот растеж и распространета употреба на П2П системите. која овозможува споделување на практично неограничени податочни и процесирачки ресурси на целосно дистрибуиран. а угледот се зголемува единствено со услужување на другите. I. ефикасноста на системот и изнаоѓање начини за подобрување на истата. теоријата на игри дава интересен увид во севкупната природа на интеракцијата на јазлите. толерантен на грешки. Монетарната наплата вклучува фиктивна валута и бара сметководствена инфраструктура за следење на различни трансакции на ресурси. нејзината имплементација реално е комплицирана. Вовед Peer-to-peer (П2П) мрежите се флексибилни дистрибуирани системи што им овозможуваат на јазли (наречени peers. (2) репутациски шеми (јазли со повисок углед добиваат подобра услуга од другите). Постојат неколку предложени механизми за решавање на проблемот со шлепање: (1) монетарна наплата (снабдувачот на услугата добива соодветна компензација од корисниците на истата). Иако монетарната шема нуди чист економски модел.Теорија на игри како алатка за правење стратегија и за предвидување на однесувањето на јазлите во Peer-to-Peer мрежи Теоријата на игри може да се употреби во изучување на однесувањето на јазлите во peer-to-peer (п2п) мрежи. Таа го наплаќа тоа со помош на микронаплати. а ние овде ќе ги викаме ’врсници’) да се однесуваат и како клиенти и како сервери. На овој начин се мимимизира можноста за ’шлепање’. и меѓусебно да си овозможуваат услуги. Веројатноста за јазол да биде услужен е директно пропорционална со неговиот моментален углед.

Во П2П систем. т. Сепак. Врсниците добиваат вредност преку доаѓање до услуги (ресурси). Врсниците ги користат принципите на теорија на игри за да определат кога треба или не треба да ги услужат другите. Моментно. складирање на податоци. кој сака да ја максимизира својата услуженост преку учество во П2П системот. влогот на индивидуалните врсници би бил повисок. истата стратегија ја користат сите јазли.е. затоа што цената на овозможување (и примање) услуги би била многу поголема (наспроти сегашната цена на споделување филмови и музика. кои бараат различни јазли да се однесуваат различно. Употребуваните стратегии се симетрични. стратешките потези на врсниците се во насока на максимизирање на вкупната добиена вредност.е. која е практично нула). да си ги максимизираат 4 . Затоа е и разумно да се претпостави дека сите врсници би се однесувале себично како би ја максимизирле услугата што ја добиваат од системот. се обидуваат со минимално ниво на услужување. општо познато е дека со користење на П2П парадигмата можат да бидат споделени и други ресурси како пресметковна моќ. па доделувањето на различни стратегии на јазли би претставувало непотребна компликација.е.Подолу се проучува однесувањето на јазли во П2П мрежи кога угледот се користи како механизам за стимулирање на јазлите да споделуваат ресурси и да овозможуваат услуги. Постојат дури и предвидувања организираат во П2П дека во иднина.. итн. т. затоа што тие независно одлучуваат околу своите оптимални стратегии. Секој врсник го третираме како рационален стратег. сите јазли имаат иста улога. за големи да ад-хок мрежи извршуваат ќе се комплексни апликации од големи размери. без употреба на било каков централизиран ентитет и/или координација помеѓу врсниците. итн. конфигурација. Ова го минимизира проблемот со ’неуслужливи шлепачи’. Координација помеѓу врсниците не е потребна. Теоријата на игри е идеална алатка за моделирање на систем од себични јазли. видео. Со оглед дека веројатноста да се биде услужен зависи од сопствениот углед (кој се стекнува единствено преку услужување на другите). а губат вредност (интернет сообраќај) додека ги услужуваат другите. Веројатноста на јазол да добие услуга е директно пропорционална со неговиот моментен углед. ниво на учество) на јазлите во таква игра. П2П системите се користат главно за споделување на документи како аудио. Во таквите системи. Ја моделираме интеракцијата на врсници во П2П систем како бесконечно повторувана игра и пресметуваме Неш еквилибриум стратегии (т. фреквентен опсег. а единствен начин јазолот да си го зголеми угледот е преку услужување на други јазли. Наспроти ова се протоколите.

Оттука. Секое барање за услуга паралелно или во низа се внесува во еден или повеќе провајдери на услуги. Игра на услуга Претпоставуваме дека животниот век на мрежата е бесконечен и го делиме вкупното време во посебни временски периоди. веројатноста да се биде услужен. Концепцијата на Еквилибриум на Неш од теоријата на игри може да се употреби за анализа на стратешките избори направени од страна на различни врсници. под кое даден јазол не треба да оди. Потоа е изведен еквилибриум на Неш за чиста и мешана стратегија на играта на услуга. Ја моделираме интеракцијата помеѓу врсници како бесконечно повторувана игра. Во секој временски период. другата активност на секој јазол е обезбедување на услуга за себе. За поедноставување на работите.2. акцијата {Служи} (како што е опишано подолу) кореспондира со ситуација каде што му се излегува во пресрет на било кое од добиените барања во еден временски период. За да се проучи однесувањето на јазлите. претпоставуваме дека јазол секогаш бара точно една услуга и добива точно едно барање за услуга во секој временски период. II. Во реалноста. претставени со t за t = 0. Потоа се дискутирани и некои други пристапи од теорија на игри кон проблемот на шлепање во П2П мрежи. Исто така во секој временски период. јазли извлекуваат вредност и од алтруизам (кој често е резултат на небрежност. јазол може да прими повеќекратни барања. доколку биде услужен повеќе од еднаш во еден временски период. овде презентираниот модел дава долна граница на ниво на учество. Во играта. Испитани се неколку интересни и практични својства на овој Неш еквилибриум. 5 .1.. ∞. реално е поголема одошто тоа го тврдат пресметките од моделот презентиран во овој текст. Затоа. на некој начин. Претпоставуваме дека услужноста на јазол е нула.. развиен е модел на игра на интеракција помеѓу себични врсници. но некои од тие барања може да доаѓаат од клиенти со низок углед и затоа може да бидат игнорирани. Понатаму. Може да се проучи ефикасноста на системот и да се бараат начини за нејзино подобрување. секој јазол добива барање за услуга. Затоа. Барањето се смета за исполнето кога провајдер од кого е побарана услуга ќе се согласи да услужи.шансите да бидат услужени. во фактичка имплементација. како што е оставање на запалени светла во празни соби). Една партија се игра во еден временски период. наречен игра на услуга.

Параметарот α е константа која при процена на моментниот углед. Попрецизно. Ако α е големо. ја бележиме со G ∞ . Угледот на играч временски период t се обележува со i во даден Rti .е. периодот t. која доделува вредност U кога ќе се прими услуга. угледот едноставно изнесува ω . Понатаму. тоа значи дека поголема важност се дава на моментната услужливост на играчот. а трошок C кога ќе се овозможи услуга. Приоритети: Приоритетите на секој играч се претставени од очекуваната вредност на функцијата на исплата. Во горнава равенка. во t = 0 . т. угледот на сите играчи е 0. која е бесконечно повторување на играта G . Како што веќе споменавме. веројатноста со која играч бива услужен зависи од неговиот моментален углед.е. угледот на играч во секој временски период секогаш е вредност помеѓу (и вклучително со) 0 и 1. 6 . Играта на услуга. Затоа. и обратно. Затоа. Формално. ја дава таа информација на колку што е можно други играчи. ја доловува доделената важност на моментните перформанси на играчот. Примената информација потоа рекурзивно се дава на други играчи. Не служи}. дури и јазол со низок рејтинг може значајно да си го подобри угледот со овозможување на услуга во тековниот временски период. Претпоставуваме дека услужната информација без проблем се шири низ мрежата и им е достапна а сите играчи. но и во претходните i временски периоди. наспроти неговите минати перформанси. 0 ≤α ≤1 ω t ≥2 изнесува 1 кога е овозможен сервис од играчот i во i а во спротивно има вредност 0. Потези: Множеството на потези за секој играч е {Служи. т. јазли бараат услуга за себа и одлучуваат дали да служат други. за големо α . а во t = 1 . Угледот на јазол зависи од неговите перформанси во тековниот временски период.обележана со G . играта G е дефинирана вака: Играчи: Сите врсници. може да се претпостави дека услужната информација се шири според механизам на преплавување и е достапна за сите играчи. секој играч кога услужува друг играч. дефиниција за Rt ќе биде: Rti = Rti−1 (1 − α ) + ωα . Затоа имаме 0 ≤ Rt ≤ 1 .

ако a * е акционен профил во Неш еквилибриум за некоја игра G ' .III. Еквилибриум на чиста стратегија Акциониот профил каде што сите играчи се одлучуваат за потегот {Не служи} е еквилибриум на Неш. каде што ниту еден играч не може да ја подобри својата услуженост со отстапување од стратегијата. * доколку секој друг играч j се придржува кон a j .е. тогаш е исто така и за игра во која G ' се повторува бесконечен број пати. Како резултат на тоа. акциониот профил според кој сите играчи се одлучуваат за потегот {Не служи} е несакан еквилибриум на Неш. па играчот i нема можност да го материјализира својот зголемен углед. Се разбира. наоѓањето на Неш еквилибриум од G ∞ се сведува на наоѓање на Неш еквилибриум од играта G . колку да се услужуваат другите). Затоа. да добие услуга од другите (и да оствари исплата U ). и за чиста и за мешана стратегија. тогаш неговата исплата е −C . Ова е така затоа што ако некој играч i се одлучи да служи. затоа што подразбира дека мрежата воопшто не обезбедува услуги. таков што ниту еден играч i не може да мине подобро со одбирање на потег надвор од ai* .. Оттаму. Исплатата на играчот i е −C кога ќе се одлучи да служи. што е помалку од исплатата 0. која ќе ја добие ако се одлучи да не служи. Точка на еквилибриум е локално оптимално множество на стратегии (веројатности на услуга. Неш Еквилибриум на Играта на услуга (G ∞ ) Според Фолк Теоремата на Неш. Ги вреднуваме еквилибриумите на Неш од G . целиот П2П систем се распаѓа. каде што секој играч сака да ја максимизира својата извлечена вредност. А. ова е некооперативна игра. т. затоа што сите други играчи се одлучуваат за потегот {Не служи}. па затоа може да се каже дека овој акционен профил 7 . Еквилибриум на Неш е акционен профил a * . Со оглед дека предложениот механизам на стимулација ја поврзува добивката со придонесот – добивката е монотоно растечка функција од придонесот на играчот. Класичниот концепт на еквилибриум на Неш укажува на излез од бесконечниот циклус на шпекулации и контра-шпекулации околу тоа кои стратегии играчите треба да ги користат.

кој е * * Неш еквилибриум и ai = a j за било кои двајца играчи i и j . (Симетричен еквилибриум на Неш е акционен профил a * . Тоа е лесно воочливо. играчите се одлучуваат за потегот {Служи} во некои временски периоди и за потегот {Не служи} во останатите временски периоди во G ∞ . Овде p и потегот {Не служи} p има ненулта вредност. Нека има Неш еквилибриум на мешана стратегија за G . Бараме симетричен Неш еквилибриум. па симетричниот еквилибриум во кој сите користат иста стратегија е практично неизбежен. се разбира. Еквилибриум на Мешана стратегија Ја разгледуваме и можноста за Неш еквилибриум на мешана стратегија за G .е. т. Акциониот профил во кој сите играчи одбираат {Служи}. сите играчи прават исти потези (детерминистички или пробабилистички). ја имаат истата улога) и затоа е полесно (односно не е потребна координација помеѓу играчите) да се дојде до таков еквилибриум. Поинаку кажано. На тој начин играчот добива исплата U наместо U − C . Едноставно кажано. затоа што ако сите други служат. Инаку. тогаш најдобра стратегија е да се отстапи. така што потегот {Не служи} се одбира во секој временски период во G ∞ .е. Со оглед на 8 . играчите ќе бираат по случаен избор од множеството потези што ги имаат на располагање. таков што играчот го избира потегот {Служи} со веројатност со веројатност 1 − p . затоа што сите играчи припаѓаат на истата популација (т. одбирајќи {Не служи}. не делува како можна конвергентна состојба за било кој употреблив П2П систем. Ова. Б. заклучуваме дека единствениот Неш еквилибриум на чиста стратегија за играта G е кога играчите ќе се одлучат за потегот {Не служи}. ако припаѓаат на единечна хомогена популација. каде што наместо детерминистички да ги одбираат своите потези.е нестабилен еквилибриум и малку е веројатно да биде постигнат (особено затоа што до некаде постои и алтруизам помеѓу јазлите во мрежата). единечна хомогена популација подразбира дека сите врсници во П2П системот имаат еквивалентни одговорности и способности. од страна на играчот и на двата потези им е доделена позитивна веројатност. не е Неш еквилибриум. во симетричен Неш еквилибриум. т.е. тогаш за нив е тешко да се координираат. Затоа.) Ако играчите во играта не се разликуваат значително или не се свесни за било какви меѓусебни разлики.

На сличен начин се доаѓа и до одигра {Служи}. Исплатата на играч служи U. Очекуваната исплата на играч во временски период t. изнесува p (−C + Rt очекуваната исплата во мешана стратегија за играч што со веројатност 1 − p ќе одигра {Не служи}. Вредноста на оваа исплата ја одбере потегот {Служи} е p (−C + Rt Исплата бележиме со временски период t. следува: Rtслужи = Rt −1 (1 − α ) + α Rtнемој = Rt −1 (1 − α) и За Неш еквилибриум на мешана стратегија во конечни игри. кога ќе го служи U ) . p ќе очекуваната исплата во мешана стратегија за играч што со веројатност служи U ) . Изразот Rt услужен е директно ја доловува идејата дека веројатноста да се биде пропорционална со сопствениот углед. очекуваната исплата во еквилибриум е очекуваната исплата за секој од неговите потези што ги користи со позитивна веројатност. Од оваа корисна карактеризација на Неш еквилибриум на мешани стратегии. важи следново: За секој играч. произлегува: Исплата служи = Исплата немој ⇒ p (−C + ( Rt −1 (1 −α) +α)U = (1 − p )(( Rt −1 (1 −α))U Со решавање по p . кога овозможува услуга во определен временски период е − C + Rt што претставува вредност на добиена услуга минус цена на овозможување служи U услуга. t.претходно споменатата симетричност. за сите играчи важи истото и нема потреба од користење на горниот индекс i. се добива: p= Rt −1U (1 − α ) − C + 2 Rt −1U (1 − α ) + Uα 9 . Rtслужи Rtнемој е угледот на играч кога служи во временски период е угледот на играч што не служи во временски период t. Овде правиме претпоставка дека играчите прво имаат можност да ги служат другите (и зголемат својот углед) пред да побараат услуга за себе. Слично. Затоа. а Од најпрвата равенка во текстов. очекуваната исплата на играч во немој U. кога ќе одбере потег {Не служи} е (1 − p ) Rt Вредноста на оваа исплата ја бележиме со Исплата немој . служи .

1 − p ) за потезите {Служи. како за G . Под претпоставка дека не постои заговор помеѓу јазли. Во секоја партија од играта (или временски период). е Неш еквилибриум на мешана стратегија. IV. така и за G ∞ . тогаш најдобра стратегија за секој јазол е исто така да ја следи горната стратегија (од дефиницијата на еквилибриум на Неш). мрежата не е корисна за никого. Не служи}. поради следниве две причини: Прво.Мора да се спомене дека вредноста на p не е константа. Едноставност на пресметување на стратегијата на еквилибриум Во претходниот дел ја пресметувавме веројатноста врз база на која јазлите одлучуваат дали за нив е оптимално да служат или да не служат. врз база на својот углед од крајот на претходниот временски период. ако во пракса некои корисници успеваат да извлечат конечна добивка од алтруизам на други корисници. играчите одлучуваат дали треба да овозможат услуга во тековниот временски период. Својства на Еквилибриумот на Неш А. Играчите можат да го пресметуваат својот углед користејќи ја најпрвата равенка од текстов. тоа е во директна спротивност со сценариото во кое ниту еден врсник не услужува. оваа веројатност не останува константна низ периодите и зависи од угледот на играчот од крајот на последниот изминат временски период. 10 . затоа што имаат прецизен увид за своите потези во секоја од изминатите партии (периоди). Мешаната стратегија ( p. респективно. Како што може да се забележи. Второ. кога не се овозможува услуга. туку варира во секој временски интервал во зависност угледот на јазолот на крајот на претходниот временски интервал. ако сите други јазли ја следат горната стратегија. Тврдиме дека ова е постабилен еквилибриум од оној каде што ниту еден јазол не услужува. Тоа е симетричен Неш еквилибриум на мешана стратегија.

Како што може да се забележи. Едноставниот модел што е претставен овде. стратегијата на еквилибриум им гарантира на играчите дека со текот на времето приближно ќе се изедначат во поглед на овозможување услуга на другите. минимизиран е проблемот со шлепање во мрежата. симулациите го поддржуваат ова однесување. вкупната 11 . Како што е прикажано на Слика 2. Решавање на проблемот на ’шлепање’ Со оглед на тоа што Неш еквилибриумот на мешана стратегија му доделува позитивна веројатност на потегот {Служи} (т.е. На Слика 1 е прикажан пример како угледот на врсник може да се менува со текот на времето при следење на предложената стратегија на еквилибриум. Промена на вредноста на угледот на играчите со текот на време. и обратно. започнувајќи во моментот t. На тројцата играчи на почетокот им се доделени произволни вредности на углед. Како точно тоа се постигнува (или спроведува) е надвор од доменот на оваа студија.Слика 1.5 и U/C=100. Мора да се напомене дека неизбежно се потпираме на претпоставката дека врсниците добиваат услуга врз база на нивниот моментален углед. т. во секој временски период. Зголемувањето на угледната вредност кореспондира со временските интервали во кои се овозможува услуга. Б. предвидува дека во најдобар интерес на секој врсник (вклучувајќи ги и шлепачите) е да ги служи другите. во кој угледот се користи како основа за добивање услуга. определувањето α на =0. Неш еквилибриум стратегија е прилично едноставно за играчот. за секој играч постои позитивна веројатност дека ќе ги служи другите). без оглед на стартната угледна вредност.е. Затоа.

е. Слика 2. Правило на 50 проценти Од последната равенка произлегува значајно својство на еквилибриумот.5 . Од аспект на еквилибриум на Неш. И овде. тогаш било кој од играчите може лесно да си ја зголеми исплатата со менување на стратегијата кон услужување на помалку од 50% од барањата. Ова. овозможуваат што е можно помалку услуги. Вкупно случаи на овозможување и добивање услуга на јазол во период од 20 временски интервали (првиот и вториот број во секој квадрат означуваат овозможени и добиени услуги. C го апроксимираме со нула во последната равенка).. В. тогаш добиваме дека p < 0. Ако за сите играчи е познато дека ги услужуваат добиените барањата во поголем дел од времето. т.5). доколку врсник знае дека сите други се однесуваат себично. иако делува многу рестриктивно. Без оглед на почетниот углед на јазолот и на вредноста на алфа. Ако земеме дека C << U (т. ако цената на овозможување услуга е занемарлива.е.. одошто би ги услужувале другите. Со други зборови. U/C=100. кое ја предвидува веројатноста со која врсник треба да ги служи другите врсници.е. со веројатност поголема од 0. тогаш најдобра стратегија за него не може да биде служење во поголем дел од времето (т. горниот резултат може лесно да се сфати преку следниов едноставен контра-пример. Интуитивно. респективно). Неш еквилибриумот на играта на услуга предвидува дека играчите треба да се услужуваат во помалку од 50% од случаите кога им е побарана услуга. 12 . е последица на тоа што сите врсници се себични и повеќе би се шлепале.услуга што ќе ја добие јазол е во рамнотежа со вкупната услуга што може да им ја понуди на другите. услугите што јазол ги добива се скоро целосно во рамнотежа со услугите што им ги овозможува на друтите.

Оттука. Правичност – Подеднакво споделување на штетата од неефикасноста на системот Од заклучокот дека служење со веројатност помала од 0. може да се претпостави дека целокупната ефикасност на системот е сериозно намалена. Резултатите од Слика 2 се значаен исход на направениот модел на интеракција на јазли во П2П систем според теоријата на игри. Иако резултатот е интуитивно привлечен. акционен профил во кој врсниците широкоградо се услужуваат меѓусебно. Но. тогаш истиот ќе се обиде кај друг врсник што е во можност да го исполни истото барање. не може да формира еквилибриум на Неш.5 е оптимална стратегија (кога C << U ). Ова е од таму што барањето за услуга на секој врсник веројатно ќе биде одбиено од врсникот што може да го услужи. веројатноста дека барањето на еден врсник е успешно услужено во еден временски период е пропорционална со неговиот моментален углед. Ова доаѓа од тоа што барем половина од барањата за услуги не се исполнуваат. Претпоставуваме дека ако барањето на еден врсник е одбиено. позитивно е тоа што стратегијата на еквилибриум носи правичност затоа што цената на неефикасноста на системот не ја плаќа еден врсник. Г. 13 . Во просек. кој го објаснува таквото однесување на врсниците. туку истата е споделена (обратно пропорционално од угледот) помеѓу сите врсници. самиот модел обезбедува доказ базиран на теоријата на игри. каде што сите учесници се однесуваат себично.

14 . затоа што α меѓусебно со поголема веројатност. Намалување на α за зголемување на придонесот Како што може да се види од Слика 3. ефикасноста на системот може на едноставен начин да се подобри со поставување на α на Слика 3. Д. Ова се α .е. при пониска вредност на α зголемува веројатноста од услужување. без оглед на нивната услужливост во претходните периоди. Како што е прикажано α . доколку во последната равенка се замени за C = 0 и за α = 0 . Ниска вредност на α (т. U/C=100. за мало врсниците се услужуваат разбирливо.Слика 3. Од друга страна. со намалување на што е можно пониско. Оттаму. е определува колкава важност им се придава на моментните перформанси на врсникот во однос на перформансите од претходните периоди. Намалувањето на ’алфа’ ги тера играчите да се услужуваат меѓусебно со поголема веројатност. ако α е големо. вредноста на p тежнее кон 0. врсниците ќе можат лесно да си го зголемат угледот секогаш кога ќе услужат барање.5 (што е највисока можна веројатност на услуга во систем со себични врсници и за C << U ). До истиот резултат може да се дојде и директно. зголемување на значењето на минатите активности на јазлите во однос на тековната активност) значи дека врсниците мораат континуирано да овозможуваат услуга за да можат да си го одржат угледот на висина и да пристапат до услуги од системот. Поинаку кажано. Во сите три случаи се користи почетна вредност на угледот од 0. И овде.5.

Бежични ЛАН-и (WLANs) можат да работат и во инфраструктурен и во ад хок мод. и сите јазли компетитивно ги 15 .е. и стапката на изгубени пакети. а неговиот основен протокол за контрола на медиумски пристап (MAC) се нарекува дистрибуирана координативна функција (DCF). некои дури и понови од DCF. како една од суштествените технологии за овозможување на широкопојасен бежичен пристап. широко користена во скоро сите тестирања и симулации за истражување на MANET-и. Моментно. анализата на перформансите и подобрувањето на WLAN-и привлекуваат голем истражувачки интерес. Во овој текст е предложен иновативен концепт на теорија на некомплетно кооперативни игри. за да се добијат оптималните перформанси. Во DCF нема централни јазли (т. теоријата на игри станува корисна и моќна алатка за истражување на мобилни ад хок мрежи (MANETs). покажуваат дека некомплетно кооперативна игра може да го зголеми протокот во системот. итн. бројот на компетитивни јазли) преку детекција на каналот. опоравување од катастрофи.несакана варијација на една или повеќе карактеристики на периодичен сигнал во електроника и телекомуникации) I. употребена за подобрување на перформансите на WLAN. а да ги намали доцнењето. и се најшироко употребуваните МАНЕТ-и. Оттука.е. Во оваа игра. како кај колаборативни и дистрибуирани пресметувања. контрола на движење. Бежичните LAN-и (WLAN-и) имаат распространета примена и под инфраструктурен и под ад хок мод. џитерот (jitter .11 е еден од највлијателните WLAN стандарди. Вовед Мобилните ад хок мрежи (MANET) играат се’ позначајна улога во многу околини.Користење на теорија на некомплетно кооперативни игри во мобилни ад хок мрежи Во последно време. Потоа секој јазол ја менува својата стратегија на еквилибриум преку нагодување на своите локални натпреварувачки параметри врз база на проценетата состојба на играта. прво секој јазол ја проценува моменталната состојба на играта (т. играта се повторува конечен број пати. На крај. иако постојат многу MAC протоколи. Резултатите од симулацијата подолу. базни станици или пристапни точки) на каналскиот пристап на контролните јазли. DCF де факто е MAC стандард на MANET-и. IEEE 802.

пренесуваат своите податочни рамки. Опис на Теорија на Игри Теоријата на игри е моќна алатка за проучување на ситуации на конфликт и соработка. II. игрите можат да се категоризираат на некооперативни и кооперативни игри. Џон Харсанји и Реинард Селтен за нивниот голем придонес. 16 . Кај статична игра. Во зависност од тоа дали потезите на играчите се случуваат симултано или не. При користење на теорија на игри кај MANET-и. Теоријата на некооперативни игри се занимава со анализа на стратешки избори и експлицитно моделирање на процесот во кој играчот донесува одлуки во сопствен интерес. сите играчи ги имаат на располагање сите информации за карактеристиките на противниците. секој јазол ја прилагодува својата еквилибриум стратегија според претпоставената состојба на играта. особено MAC протоколите. конечно повторувана динамичка игра на некомплетна информација). Во зависност дали играчите имаат целосна информација за сите карактеристики на противниците во врска со исплатата. Кај првите. односно според бројот на натпреварувачки јазли.е. Генерално. главно кон некооперативните игри. играчите истовремено се одлучуваат за стратегија и влечат потег. Што се однесува до теоријата на игри. Во оваа игра. Оваа интеракција интуитивно посочува дека теоријата на игри би била многу добра алатка за анализа и подобрување на перформансите на MANET-и. без да го знаат изборот на другите играчи. во предвид мора да се земат карактеристиките на DCF. која се занимава со наоѓање на најдобрите потези за индивидуалните донесувачи на одлуки (т. некооперативните игри може да се поделат во две групи: игри со комплетна и игри со некомплетна информација. Кај кооперативните игри пак. Играчите влечат потег кога ќе дојдат на ред. кога им беше доделена Нобелова награда за економија на Џон Неш. некооперативните игри можат да се поделат во две категории: статични и динамични. Каналскиот пристап на секој јазол има директно влијание на соседните јазли. знаејќи што дотогаш одиграле другите. предложена е употреба на нов концепт на нецелосно кооперативна игра (т. Теоријата на игри особено влегува во фокусот на вниманието во 1994 година. играчите можат да градат врски. како и со препознавање на стабилни исходи.е. има точно определен редослед на играње. како Aloha и DCF. Кај динамична игра. играчи) во овие ситуации. Воведни објаснувања А.

CW се множи со Параметарот σ σ се’ до максималната вредност CW max = σ m CW min . а пакетот да се отфрли. По секој неуспешен пренос. Кога тоа ќе се случи. Во Табела 1 се прикажани четири типа на некооперативни игри и нивните соодветни концепти на еквилибриум. итн. ќе остане на таа вредост додека пакетот се пренесе успешно или додека времето за повторен пренос го достигне лимитот (r ) . се нарекува постојан фактор и е поставен на 2. Опис на DCF DCF е шема со случаен пристап. наречен дистрибуиран меѓу-рамковен простор (DIFS). јазолот продолжува да го надгледува каналот додека не измери неактивност со DIFS должина. Јазол со нов пакет за пренесување. Во спротивно. базирана на мрежен. тогаш јазолот пренесува. пред да почне да пренесува. конфликтниот рок (contention window – CW) е поставен на вредност CW min . Додека се достигне лимитот. јазолот генерира случајно уфрлен интервал на повлекување. Кај вторите тоа не е случај. ресурсно компетитивен протокол. а m се нарекува максимален степен на повлекување и CW max е максимален рок на конфликт.нивните стратегиски можности. Ако каналот е без работа за временски период. повторувањето на обидите за пренос треба да престане. Кога еднаш CW ќе стигне до CW max . DCF усвојува експоненцијална шема на повлекување (backoff). ја надгледува активноста на каналот. При пренос на секој пакет. кој ја слуша мрежата за да избегне судири ((CSMA/CA) – carrier sense multiple access with collision avoidance). При првиот обид за пренос. 17 . Игра со Статична игра Неш еквилибриум Динамична игра Совршен Неш еквилибриум на суб-игра комплетна Џон Неш (1950. CW-1]. функции на исплата. Големината на интервалот се нарекува aSlotTime. која се нарекува минимален рок на конфликт. Категории на некооперативни игри и соодеветни еквилибриуми Б. 1951) Реинхард Селтен (1965) информација Игра со Бајесов еквилибриум на Неш Совршен Бајесов еквилибриум на Неш некомплетна Џон Харсанји (1967-1968) Реинхард Селтен (1975) информација Крепс и Вилсон (1982) Фуденберг и Тирол (1991) Табела 1. времето на повлекување се одбира униформно во интервал од [0.

Кај некомплетно кооперативни игри.е. По проценувањето на фактичката состојба на играта. со оглед дека состојбата на играта е секогаш варијабилна. По доволно долго детектирање на каналот. секој јазол може да дојде до некомплетна информација за состојба на играта. Се разбира. зголемувањето на вредноста на CW се остварува на сметка на континуирана колизија по успешен пренос. ја проценуваат моменталната состојба на играта врз база на изминатите состојби. Второ. јазлите ги нагодуваат своите еквилибриумски стратегии. 18 .III. проценетата состојба на играта е доволно прецизна. некомплетно кооперативните игри пред се се’ конечно. еквилибриумската стратегија на секој јазол секогаш е променлива. тие можат да ги предвидат потезите на противниците врз база на случувањата што претходеле. Од една страна. А. во секој слот. невозможно е секогаш јазлите на време да доаѓаат до точната состојба на играта. кај DCF. Иако не знаат што другите ќе одберат сега. затоа што не постои информација за состојба која би го индицирала фактичкото ниво на конфликт. Теоријата на некомплетно кооперативни игри може да го реши овој проблем преку проценка на моменталната состојба на играта (т. јазли ги пренесуваат своите пакети. Сепак. а не бесконечно повторувани игри. Карактеристики на теорија на некомплетно кооперативни игри Некомплетно кооперативните игри имаат три карактеристики. секој јазол може да ја процени состојбата на играта преку детектирање на каналот. Некомплетно кооперативна игра е стохастичка игра. Опис на теоријата на некомплетно кооперативни игри Скорешни истражувања покажуваат дека механизмот за повлекување кај DCF има еден голем недостаток: кај оптоварена мрежа. фактичка состојба на системот) и преку доделување стратегија на еквилибриум на секој јазол врз база на проценетата состојба на играта. Поради варирање на состојба на играта. јазлите не можат директно и на време да си ја разменат состојбата на играта. секој временски слот кореспондира со една состојба на играта. Прво. играчите истовремено одбираат стратегии. од друга страна. И трето.

Состојба на игра Повеќе студии на вреднување на перформанси покажуваат дека перформансите на DCF се многу чувствителни на бројот на јазли што се натпреваруваат за каналот. без оглед на бројот на повторени пренесувања. 19 . В. m и σ . бројот на јазли што истовремено се обидуваат да испратат пакет до заедничкиот медиум. Покажано е дека веројатноста τ дека јазол пренесува во случајно одбран слот. Фундаменталната претпоставка е дека. и со решавање по log(1 − p ) 2(1 − σp ) log(1 − ) (1 − σp )(CW min + 1) + pCW min (1 − (σp ) m ) Горнава равенка дава експлицитен израз на n (3) наспроти веројатноста p и параметрите на конфликт.Б. Со оглед дека веројатноста p може да биде независно мерена од секој јазол со едноставно надгледување на активноста на каналот. Поради поедноставување. Процена на состојба на игра Резултати од анализи покажуваат дека бројот на конкурентски јазли. во овој текст. се добива: според (1) во (2). како CW min . До овој број не може да се дојде со DCF операција . состојба на играта ќе биде бројот на натпреварувачки јазли. n е функција од веројатност за рамковна колизија на конкурентски јазол ( p) .е. веројатноста p е константна и независна при секој обид за пренесување. може да се изрази како функција од τ= (1 − σp)(CW min Покажано е и дека веројатноста τ и p . следува дека секој јазол може да ја процени вредноста на n. така што: 2(1 − σp ) + 1) + pCW min (1 − (σp ) m ) (1) p може да биде изразена како функција од n . т. така што: p =1 − (1 −τ ) n −1 Со замена за τ n = f ( p) = 1 + (2) n .

Според теоријата на игри. играч не е секогаш јазол. играчот е јазол што се бори за каналот. потребен е многу сложен метод за определување на стратегијата. (4) Стратегија на еквилибриум Во некомплетно кооперативната игра... c..е. Стратегија на еквилибриум е бесконечен вектор на веројатности за пренос. а Играч 2 (т. p 2 . противникот) се сите други a. равенката (1) би ја добила следната форма:  2(1 − 2 p) (1 − p) m+ 1  m+ 1 m+ 1  C Wm in(1 − (2 p) ) (1 − p) + (1 − 2 p) (1 − p ) τ= 2(1 − 2 p) (1 − p) r + 1   C Wm in(1 − (2 p) m+ 1 ) (1 − p) + (1 − 2 p) (1 − p r + 1 ) + C Wm in2 m p m+ 1 (1 − 2 p) (1 − p r − m ) При што горниот израз важи за Г. со двајца играчи. јазлите b..е. На Слика 1 е прикажана табела на стратегии. На пример. Затоа.. p 2 . а µf е исплата кога преносот ќе пропадне и µ f < µi < µs . Бидејќи секој јазол повторно и повторно се бори за каналот. Доколку се земе предвид лимитот на испраќања.) . Играчите во оваа игра ги користат ( p1 . такви што користа на секој играч кога во моментот постојат n pn ја максимизира натпреварувачки јазли. тогаш ( n −1) јазли (т. а долниот за r > m . секој играч има два можни потези: Пренесувај и Чекај. а мрежата има многу јазли. за да дојдат до поголема исплата.) за да ги определат нивните веројатности за пренос. каде што µs е исплатата кога играчот успешно ќе изврши пренос. итн). ( p1 . во моделот во овој текст. µi е исплата кога е во состојба на чекање. 20 ..Потребно е да се забележи дека равенката (1) се темели на претпоставка дека ограничувањето на повторени обиди е занемарено и пакетот ќе биде испраќан бесконечно пати додека не биде пренесен успешно. ако ја анализираме еквилибриум стратегијата на јазол Играч 1 е јазолот a . r ≤ m .

Резултатите од симулацијата подолу. Односот е некаде помеѓу 7 и 8. предложена е експлицитна формулација за стратегијата под претпоставка дека промени во состојбата на играта не влијаат врз постоењето на еквилибриум. Сепак. За поедноставување. постојаниот фактор (σ) и лимитот на испраќања (r ) . бројот на јазли во конкуренција. играчот ја предвидува состојбата на играта. максималниот рок на конфликт ( CW max ). покажуваат дека горната равенка доволно точно го 21 . вредноста на веројатностите за пренос може да се промени преку нагодување на параметри за конфликт како што се минималниот рок на конфликт ( CW min ). Ако играч има пакети за праќање. Во DCF. (n) . пред да влезе во борба за наметнување на свој пакет на каналот. а [ z ] е најголемиот Резултати од истражувањата покажуваат дека оптималната вредност на CW min помеѓу оптималното CW min и (5) е зависна од бројот n. Модел на некомплетно кооперативна игра со n јазли При употреба на теоријата на игри во Aloha MAC протокол. максималниот степен на повлекување (m) .е.Слика 4. тој го нагодува CW min на следниот начин: CW min = [n × rand (7. а DCF е премногу сложена за да предложи експлицитна формулација. т. y ) враќа случајна вредност помеѓу цел број што не е поголем од z. таа е несоодветна за MANET-и. n x и y .8)] rand ( x. Во овој текст. можеме да ја добиеме вредноста на CW min од горната равенка. поради едноставност се врши нагодување само на еден конфликтен параметар. Откако ќе ја предвиди. CW min .

доцнење. Резултати од симулацијата За евалуација на теоријата на некомплетно кооперативна игра. И трето. се прикажани на Сликите 2-5. некои други јазли може да ја напуштат играта. Играч 1 ги нагодува своите локални параметри на конфликт. па Играч 2 (т. Бидејќи Играч 1 започнува да се натпреварува за каналот за пренесување на своите пакети. по добивање на состојбата на играта. Кај некомплетно кооперативна игра пак. тој ја проценува состојбата на играта.е. а лимит на доцнење нема. протокот кај DCF се намалува поради судири. на играта може да и’ се приклучуваат новопристигнати јазли. Заситениот капацитет. Значаен факт зад оваа стратегија е тоа што различни јазли може да имаат различни веројатности на пренос во даден слот. Состојбата на играта е секогаш варијабилна од три причини. затоа што може да добијат различна проценета вредност на n. туку да си ја максимизира очекуваната исплата низ сите слотови од почеток па се’ додека самиот успешно пренесува. Пакетите ќе бидат отфрлени само ако времето за препраќање го достигне временскиот лимит на препраќање. веројатноста за колизија е најмала. пред да успее да пренесе. Целта на секој јазол не е да си ја максимизира исплатата во единечен слот. останатите јазли) ќе ја детектираат оваа промена и ќе ги адаптираат сопствените еквилибриумски стратегии на моментната состојба. Кога бројот на јазли се зголемува. За време на преносот. Второ. особено кога бројот на јазли е голем. Со откривање на каналот. џитер и стапка на загубени пакети. протокот безмалку 22 . секој јазол ја проценува состојбата на играта. направени се следниве симулации во идеален канал без скриени терминали и записи.дава CW min . т. со влегувањето на Играч 1. бројот на конкурентски јазли. m=5 и r=7. Нека бројот на јазли порасне од 10 на 90 со чекор 20 и нека секој јазол секогаш има пакети за праќање. Прво. а потоа го нагодува својот конфликтен параметар CW min . IV. Слика 2 покажува дека заситениот проток во некомплетно кооперативна игра е повисок одошто кај DCF. состојбата на играта се менува. При оптимално CW min .е. на пример затоа што успешно вршат пренос. Брзината на каналот е поставена на 11 Mb/s. Играч со поинакво CW min има различни веројатности за пренос и за колизија.

Проток во услови на заситување 23 . Слика 4 покажува дека џитер во заситување кај некомплетно кооперативна игра има многу помалку одошто кај DCF. Слика 5 покажува дека во заситување.останува константен затоа што секој јазол може да се адаптира на варијабилните состојби на играта и да одбере соодветна стратегија на еквилибриум. Слика 5. Кај DCF секој јазол доаѓа до оптимално CW по неколку колизии. стапката на губиток на пакети кај некомплетно кооперативни игри е многу помала одошто кај DCF. што е многу привлечен факт. особено кога бројот на јазли е голем. Кај некомплетно кооперативната игра. секој јазол доаѓа до оптимално CW по проценување на состојбата на играта. Кај некомплетно кооперативни игри. стапката на губење на пакети е нула. Слика 3 покажува дека доцнењето во заситување кај некомплетно кооперативна игра е помало одошто кај DCF.

Доцнење во услови на заситување Џитер во услови на заситување 24 . Слика 7.Слика 6.

Протокот. за потоа да се зголемува така што на крајот на симулацијата сите јазли се скоро во услови на заситување. 25 . доцнењето. џитерот и губитокот на пакети се прикажани на Сликите 9-12. Сликите 9-12 покажуваат дека перформансите на некомплетно кооперативна игра се подобри од оние на DCF кога мрежата ќе се оптовари. стапката на пристигање на пакети е поставена да биде пониска одошто кај случаи на заситеност. Иницијално.Слика 8. Стапка на губење на пакети во услови на заситување Нека има 50 јазли и нека секој јазол генерира нови пакети според Поасонов процес во случаи на незаситеност.

Слика 9. Доцнење во незаситени услови 26 . Проток во незаситени услови Слика 10.

Слика 11. Џитер во незаситени услови Стапка на губење на пакети во незаситени услови 27 . Слика 12.

Второ. секој играч (јазол) прво ја проценува состојбата на играта. Иако постојат механизми за проценка. па потребно е детално да се развијат и математички да се докажат нејзиниот еквилибриум и употребната функција. Заклучоци Овој текст предлага подобрување на системските перформанси на Мобилни и Ад Хок Мрежи со помош на некомплетно кооперативна игра. 28 . Ова во голема мера ги поедноставува работите.е. секој играч ја нагодува својата еквилибриумска стратегија со менување на своите локални параметри на конфликт. Во оваа игра. т. како ARMA и Kalman Filters. играта се повторува конечен број пати за да се дојде до оптимални перформанси.V. Резултатите покажуваат дека некомплетно кооперативната игра е соодветна алатка за подобрување на перформанси на MANET-и. И трето. тие се базираат на повеќе строги претпоставки и се премногу комплексни за да можат да се имплементираат. но реално сеуште претставува нерешен проблем. бројот на конкурентски јазли. Затоа се продолжува со истражувања за пронаоѓање на едноставен алгоритам за проценка на состојба на игра. врз база на проценетата состојба. Теоријата на некомплетно кооперативни игри е нов концепт. Второ – во оваа студија се претпоставува дека секој јазол може брзо и прецизно да дојде до бројот на конкурентски јазли.