Modellválasztás - Model selection

A modell kiválasztása az a feladat, hogy statisztikai modellt válasszon ki a jelölt modellekből, adott adatokból. A legegyszerűbb esetekben egy már létező adatsort veszünk figyelembe. A feladat azonban magában foglalhatja olyan kísérletek tervezését is , hogy az összegyűjtött adatok jól illeszkedjenek a modellválasztás problémájához. A hasonló prediktív vagy magyarázó erejű jelöltmodellek mellett valószínűleg a legegyszerűbb modell a legjobb választás ( Occam borotvája ).

Konishi & Kitagawa (2008 , 75. o.) Kijelentik: "A statisztikai következtetések problémáinak többsége a statisztikai modellezéssel kapcsolatos problémáknak tekinthető". Ehhez kapcsolódóan Cox (2006 , 197. o.) Azt mondta: "Az elemzés legkritikusabb része gyakran az, ahogyan a tárgyi problémáról a statisztikai modellre fordítják".

A modellválasztás utalhat arra a problémára is, hogy a reprezentatív modelleket nagy számítási modellekből kell kiválasztani a döntéshozatal vagy az optimalizálás céljából a bizonytalanság alatt.

Bevezetés

Image
A tudományos megfigyelési ciklus.

A modellválasztás a legalapvetőbb formáiban a tudományos kutatás egyik alapvető feladata . A megfigyelések sorozatát megmagyarázó elv meghatározása gyakran közvetlenül kapcsolódik egy ezeket a megfigyeléseket megjósló matematikai modellhez. Például, amikor Galileo elvégezte ferde sík kísérleteit, bebizonyította, hogy a golyók mozgása illeszkedik a modellje által megjósolt parabolához.

A számtalan lehetséges mechanizmus és folyamat közül, amelyek előállíthatták az adatokat, hogyan is lehetne elkezdeni kiválasztani a legjobb modellt? A matematikai megközelítés általánosan alkalmazott jelöltmodellek között dönt; ezt a készletet a kutatónak kell megválasztania. Gyakran egyszerű modelleket, például polinomokat használnak, legalábbis kezdetben. Burnham & Anderson (2002) könyvükben hangsúlyozzák a megalapozott tudományos elveken alapuló modellek kiválasztásának fontosságát, például az adatok mögött álló fenomenológiai folyamatok vagy mechanizmusok (pl. Kémiai reakciók) megértését.

Miután kiválasztották a jelölt modellek halmazát, a statisztikai elemzés lehetővé teszi számunkra, hogy kiválasszuk ezek közül a legjobbakat. Ami a legjobbat jelenti, ellentmondásos. A jó modellválasztási technika egyensúlyba hozza az illeszkedés jóságát az egyszerűséggel. A bonyolultabb modellek jobban képesek alakjukat úgy alakítani, hogy illeszkedjenek az adatokhoz (például egy ötödrendű polinom pontosan elfér hat ponton), de a további paraméterek nem jelenthetnek semmi hasznosat. (Talán ez a hat pont valójában csak véletlenszerűen oszlik el egy egyenes körül.) Az illeszkedés jóságát általában a valószínűség arányának megközelítésével, vagy ennek közelítésével határozzák meg, ami khi-négyzet teszthez vezet . A bonyolultságot általában a modellben szereplő paraméterek számával mérik .

A modellválasztási technikák valamilyen fizikai mennyiség becslésének tekinthetők , például annak valószínűsége, hogy a modell előállítja az adott adatokat. A torzítás és a variancia egyaránt fontos mérőszámai ennek a becslésnek a minőségében; a hatékonyságot is gyakran figyelembe veszik.

A modellválasztás egyik standard példája a görbeillesztés , ahol egy ponthalmaz és egyéb háttérismeretek (pl. A pontok iid minták eredményeként ) meg kell választanunk egy görbét, amely leírja a pontokat létrehozó függvényt.

A modellválasztás két iránya

A következtetésnek és az adatokból való tanulásnak két fő célja van. Az egyik a tudományos felfedezés, az alapul szolgáló adat-előállító mechanizmus megértése és az adatok természetének értelmezése. Az adatokból való tanulás másik célja a jövőbeni vagy nem látott megfigyelések előrejelzése. A második célkitűzésben az adatkutató nem feltétlenül foglalkozik az adatok pontos valószínűségi leírásával. Természetesen az is érdekelheti mindkét irányt.

A két különböző célkitűzésnek megfelelően a modellválasztásnak két iránya is lehet: modellválasztás a következtetéshez és modellválasztás az előrejelzéshez. Az első irány az adatok legjobb modelljének meghatározása, amely előnyösen megbízhatóan jellemzi a bizonytalanság forrásait a tudományos értelmezéshez. E cél érdekében jelentősen fontos, hogy a kiválasztott modell ne legyen túl érzékeny a minta méretére. Ennek megfelelően a megfelelő fogalom értékelésére modell kiválasztása a kiválasztási összhang, ami azt jelenti, hogy a legtöbb robusztus pályázót következetesen kiválasztott adott kellően sok adat mintákat.

A második irány az, hogy olyan modellt válasszunk gépként, amely kiváló prediktív teljesítményt nyújt. Ez utóbbi esetében azonban a kiválasztott modell egyszerűen a szerencsés nyertes lehet néhány közeli versenytárs között, mégis a prediktív teljesítmény a lehető legjobb lehet. Ha igen, akkor a modell kiválasztása megfelel a második célnak (jóslatnak), de a kiválasztott modell használata betekintéshez és értelmezéshez súlyosan megbízhatatlan és félrevezető lehet. Sőt, az így kiválasztott nagyon összetett modellek esetében még a jóslatok is ésszerűtlenek lehetnek, ha az adatok csak kissé különböznek azoktól, amelyeken a kiválasztás történt.

Módszerek a jelöltmodellek megválasztásában

Kritériumok

Az alábbiakban felsoroljuk a modell kiválasztásának kritériumait. A leggyakrabban használt kritériumok (i) az Akaike információs kritérium és (ii) a Bayes-faktor és / vagy a Bayes-i információs kritérium (amely bizonyos mértékben közelíti a Bayes-faktort), lásd áttekintésként Stoica & Selen (2004) .

Ezen kritériumok közül általában a keresztellenőrzés a legpontosabb és számítási szempontból a legdrágább a felügyelt tanulási problémák esetében.

Burnham & Anderson (2002 , 6.3. Bekezdés) a következőket mondja:

Számos modellválasztási módszer létezik. A módszer statisztikai teljesítményének és a felhasználás tervezett kontextusának szempontjából azonban csak két különálló módszercsoport létezik: Ezeket hatékonyaknak és következeteseknek nevezték el . (...) A modellválasztás gyakorisági paradigmája szerint általában három fő megközelítés van: (I) egyes kiválasztási kritériumok optimalizálása, (II) hipotézisek tesztje és (III) ad hoc módszerek.

Lásd még

Megjegyzések

Hivatkozások