Keresztvalidáció

1. Fogalom magyarul: keresztvalidáció

2. Fogalom angolul: cross-validation

3. Meghatározás:

A keresztvalidáció a gépi tanulás kísérlettervezésénél egy gyakran használt statisztikai módszer, amelyet a modellek teljesítményének értékelésére használnak. A lényege, hogy a rendelkezésre álló címkézett adatokat (a teljes tanulóállományt) több részre osztják, ahol az egyik rész a modell tesztelésére, míg az összes többi rész a modell tanítására szolgál. A keresztvalidáció célja, hogy csökkentse a modellező munkafolyamata során a túltanulás (overfitting) kockázatát, és megbízhatóbb becslést adjon a modell általánosító képességéről. Az eljárás során a folyamatot annyiszor ismétlik meg, ahány részre lett szétosztva a teljes adathalmaz, így minden rész egyszer fog szerepelni tesztként. Az egyes tesztek jósági értékeinek átlaga adja az említett megbízhatóbb becslési értéket. A szétosztásnál a részek számát „n”-el jelölve a teljes folyamatot n-szeres keresztvalidációnak (angolul: n-fold cross-validation) nevezik. Speciális esetben, amikor az n egyenlő az adatok számával (ezt kis adatszámú esetben használják), akkor ezt „leave-one-out” megoldásnak is hívják, azaz ebben az esetben az egyes kísérletek során a teszt mindössze egyetlen elemből áll.

4. Hivatkozások:

Cross-validation (statistics) szócikk a wikipédián: https://en.wikipedia.org/wiki/Cross-validation_(statistics)

Refaeilzadeh, P., Tang, L., Liu, H. (2009). Cross-Validation. In: LIU, L., ÖZSU, M.T. (eds) Encyclopedia of Database Systems. Springer, Boston, MA. https://doi.org/10.1007/978-0-387-39940-9_565

5. Megjegyzések:

6. Kulcsszavak: gépi tanulás, ellenőrzés, validáció, túltanulás, tanulóállomány

7806 Views
Average (0 Votes)

Gyakran ismételt kérdések

Hogyan tudok hozzászólást fűzni a szócikkhez?

Regisztráció után (egy név és egy valós e-mail cím kell hozzá) lehet hozzászólni.

Ki felügyeli a fogalmak helyességét?

A Hírközlési és Informatikai Tudományos Egyesület által létrehozott szerkesztőbizottság hagyja jóvá a fogalmakat.

Lehet bővíteni a fogalomtárat?

A szerkesztőség határozza meg definiálandó fogalmakat. Örömmel vesszük javaslatait a „További fogalmak” oldalon található űrlap kitöltésével.