Odds algoritme - Odds algorithm
Den odds-algoritme er en matematisk metode til beregning optimale strategier for en klasse af problemer, der hører til domænet for optimale stoppe problemer. Deres løsning følger af oddsstrategien , og oddsstrategiens betydning ligger i dens optimalitet, som forklaret nedenfor.
Oddsalgoritmen gælder for en klasse af problemer kaldet last-succes- problemer. Formelt er formålet med disse problemer at maksimere sandsynligheden for i en sekvens af sekventielt observerede uafhængige begivenheder at identificere den sidste begivenhed, der opfylder et specifikt kriterium (en "specifik begivenhed"). Denne identifikation skal udføres på tidspunktet for observation. Ingen genbesøg af foregående observationer er tilladt. Normalt defineres en bestemt begivenhed af beslutningstageren som en begivenhed, der er af reel interesse med henblik på at "stoppe" for at tage en veldefineret handling. Sådanne problemer opstår i flere situationer.
Eksempler
To forskellige situationer eksemplificerer interessen for at maksimere sandsynligheden for at stoppe ved en sidst specifik begivenhed.
- Antag at en bil annonceres til salg til højstbydende (bedste "tilbud"). Lad n potentielle købere svare og bede om at se bilen. Hver insisterer på en øjeblikkelig beslutning fra sælgeren om at acceptere budet eller ej. Definer et bud som interessant og kodet 1, hvis det er bedre end alle foregående bud, og ellers kodet 0. Budene danner en tilfældig sekvens på 0s og 1s. Kun 1'er interesserer sælgeren, som måske frygter, at hver efterfølgende 1 måske er den sidste. Det følger af definitionen, at den sidste 1 er det højeste bud. Maksimering af sandsynligheden for at sælge på den sidste 1 betyder derfor at maksimere sandsynligheden for at sælge bedst .
- En læge, der bruger en særlig behandling, kan bruge koden 1 til en vellykket behandling, ellers 0. Lægen behandler en sekvens af n patienter på samme måde og ønsker at minimere enhver lidelse og behandle enhver lydhør patient i sekvensen. At stoppe på den sidste 1 i en sådan tilfældig rækkefølge på 0'er og 1'er ville nå dette mål. Da lægen ikke er nogen profet, er målet at maksimere sandsynligheden for at stoppe på sidste 1. (Se medfølende brug .)
Definitioner
Overvej en række uafhængige begivenheder . Associer med denne sekvens en anden sekvens med værdierne 1 eller 0. Her , kaldet en succes, står for begivenheden, at kth-observationen er interessant (som defineret af beslutningstageren) og for ikke-interessant. Vi observerer uafhængige tilfældige variabler sekventielt og ønsker at vælge den sidste succes.
Lad være sandsynligheden for, at kth-begivenheden er interessant. Yderligere lad og .Bemærk, der repræsenterer oddsene for, at kth-begivenheden viser sig at være interessant, og forklarer navnet på oddsalgoritmen.
Algoritmisk procedure
Oddsalgoritmen opsummerer oddsene i omvendt rækkefølge
indtil denne sum når eller overstiger værdien 1 for første gang. Hvis dette sker ved indeks s , gemmer det s og den tilsvarende sum
Hvis summen af odds ikke når 1, indstiller den s = 1. Samtidig beregnes den
Outputtet er
- , stoppetærsklen
- , vindersandsynligheden.
Odds-strategi
Oddsstrategien er reglen om at observere begivenhederne efter hinanden og stoppe ved den første interessante begivenhed fra indeks s og fremefter (hvis nogen), hvor s er stoppetærsklen for output a.
Betydningen af oddsstrategien og dermed oddsalgoritmen ligger i følgende odds-sætning.
Odds sætning
Oddssætningen siger det
- Oddsstrategien er optimal , dvs. den maksimerer sandsynligheden for at stoppe på den sidste 1.
- Vindersandsynligheden for oddsstrategien er lig
- Hvis vindersandsynligheden altid er mindst , og denne nedre grænse er bedst mulig .
Funktioner
Oddsalgoritmen beregner den optimale strategi og den optimale vindersandsynlighed på samme tid. Antallet af operationer for oddsalgoritmen er også (sub) lineær i n. Derfor kan ingen hurtigere algoritme muligvis eksistere for alle sekvenser, således at oddsalgoritmen samtidig er optimal som en algoritme.
Kilder
Bruss 2000 udtænkte den ulige algoritme og opfandt sit navn. Det er også kendt som Bruss-algoritme (strategi). Gratis implementeringer kan findes på internettet.
Ansøgninger
Ansøgninger strækker sig fra medicinske spørgsmål i kliniske forsøg med salgsproblemer, sekretærproblemer , porteføljevalg , (envejs) søgestrategier, bane problemer og parkeringsproblemer til problemer i online vedligeholdelse og andre.
Der eksisterer i samme ånd et Odds-sætning til kontinuerlige ankomstprocesser med uafhængige trin som Poisson-processen ( Bruss 2000 ). I nogle tilfælde er oddsene ikke nødvendigvis kendt på forhånd (som i eksempel 2 ovenfor), så anvendelsen af oddsalgoritmen ikke er direkte mulig. I dette tilfælde kan hvert trin bruge sekventielle estimater af oddsene. Dette er meningsfuldt, hvis antallet af ukendte parametre ikke er stort sammenlignet med antallet n af observationer. Spørgsmålet om optimitet er dog mere kompliceret og kræver yderligere undersøgelser. Generaliseringer af oddsalgoritmen giver mulighed for forskellige belønninger for ikke at stoppe og forkerte stop samt erstatte uafhængighedsantagelser med svagere (Ferguson (2008)).
Variationer
Bruss & Paindaveine 2000 diskuterede et problem med at udvælge de sidste succeser.
Tamaki 2010 viste sig at være et multiplikativ odds sætning, der beskæftiger sig med et problem med at stoppe ved en af de sidste succeser. En stram nedre grænse for vindersandsynlighed opnås af Matsui & Ano 2014 .
Matsui & Ano 2017 diskuterede et problem med at udvælge blandt de sidste succeser og opnåede en tæt nedre grænse for vindersandsynlighed. Når problemet svarer til Bruss 'oddsproblem. Hvis problemet svarer til det i Bruss & Paindaveine 2000 . Et problem diskuteret af Tamaki 2010 opnås ved at indstille
multiple choice problem : En spiller har tilladte valg, og han vinder, hvis et valg er den sidste succes. For problem med klassisk sekretær drøftede Gilbert & Mosteller 1966 sagerne . Oddsproblemet med diskuteres af Ano, Kakinuma & Miyoshi 2010 . For yderligere tilfælde af oddsproblem, se Matsui & Ano 2016 .
En optimal strategi tilhører den klasse af strategier, der er defineret af et sæt tærskelværdier , hvor . Førstevalg skal bruges på de første kandidater, der starter med ansøgeren, og når førstevalget er brugt, skal andet valg bruges på den første kandidat, der starter med ansøgeren, og så videre.
Når , Ano, Kakinuma & Miyoshi 2010 viste, at den stramme nedre grænse af win sandsynlighed er lig med For generel positivt heltal , Matsui & Ano 2016 drøftede den stramme nedre grænse af win sandsynlighed. Når , stram nedre grænser for win sandsynligheder er lig med , og henholdsvis. For yderligere sager , se Matsui & Ano 2016 .
Se også
Referencer
- Ano, K .; Kakinuma, H .; Miyoshi, N. (2010). "Odds sætning med flere valgmuligheder" . Tidsskrift for anvendt sandsynlighed . 47 (4): 1093-1104. doi : 10.1239 / jap / 1294170522 . S2CID 17598431 .
- Bruss, F. Thomas (2000). "Summ oddsene til en og stop" . Sandsynligheds annaler . Institut for Matematisk Statistik. 28 (3): 1384–1391. doi : 10.1214 / aop / 1019160340 . ISSN 0091-1798 .
- -: " A note on Bounds for the Odds-Theorem of Optimal Stopping ", Annals of Probability Vol. 31, 1859–1862, (2003).
- -: "Kunsten om en rigtig beslutning", Newsletter of the European Mathematical Society , udgave 62, 14–20, (2005).
- TS Ferguson : (2008, upubliceret)
- Bruss, FT; Paindaveine, D. (2000). "Valg af en række sidste succeser i uafhængige forsøg" (PDF) . Tidsskrift for anvendt sandsynlighed . 37 (2): 389-399. doi : 10.1239 / jap / 1014842544 .
- Gilbert, J; Mosteller, F (1966). "Anerkendelse af det maksimale af en sekvens". Journal of the American Statistical Association . 61 (313): 35–73. doi : 10.2307 / 2283044 . JSTOR 2283044 .
- Matsui, T; Ano, K (2014). "En note på en nedre grænse for den multiplikative odds sætning om optimal stop" . Tidsskrift for anvendt sandsynlighed . 51 (3): 885-889. doi : 10.1239 / jap / 1409932681 .
- Matsui, T; Ano, K (2016). "Lavere grænser for Bruss 'oddsproblem med flere stop". Matematik i operationsforskning . 41 (2): 700–714. arXiv : 1204.5537 . doi : 10.1287 / moor.2015.0748 . S2CID 31778896 .
- Matsui, T; Ano, K (2017). "Sammenlign forholdet mellem symmetriske polynomier af odds og et og stop". Tidsskrift for anvendt sandsynlighed . 54 : 12-22. doi : 10.1017 / jpr.2016.83 .
- Shoo-Ren Hsiao og Jiing-Ru. Yang: " Valg af den sidste succes i Markov-afhængige forsøg ", Journal of Applied Probability , bind. 93, 271-281, (2002).
- Tamaki, M (2010). "Summ de multiplikative odds til et og stop" . Tidsskrift for anvendt sandsynlighed . 47 (3): 761-777. doi : 10.1239 / jap / 1285335408 . S2CID 32236265 .
- Mitsushi Tamaki: " Optimal stop på baner og afstemningsproblemet ", Journal of Applied Probability Vol. 38, 946–959 (2001).
- E. Thomas, E. Levrat, B. Iung: " L'algorithme de Bruss comme bidrag à une maintenance préventive ", Sciences et Technologies de l'automation , bind. 4, 13-18 (2007).
eksterne links
- Bruss-Algorithmus http://www.p-roesler.de/odds.html