Modell validálás

1. Fogalom magyarul: modell validálás          

2. Fogalom angolul: model validation

3. Meghatározás:

A modell validálás a gépi tanulás egyik fontos lépése, amelynek célja annak biztosítása, hogy a modell megbízható és pontos előrejelzéseket tudjon adni valós adatokon. Ez a folyamat segít (i) azonosítani, hogy a modell mennyire jól teljesít a tanító adatokon kívül, és (ii) elkerülni a túltanulást, amikor a modell túl jól illeszkedik a tanító adatokhoz, de gyengén teljesít új, ismeretlen adatokon. A rendelkezésre álló adatokat általában két részre osztják: egy tanító és egy validáló (vagy más néven teszt) halmazra; az elsőt a modell betanítására használják, a másodikat pedig a modell teljesítményének értékelésére. A validálás során a legelterjedtebb módszer a keresztvalidáció, amely lehetővé teszi az adatok hatékonyabb kihasználását: itt az adathalmazt kettő helyett több részre osztják, és minden egyes részt egyszer validáló halmaznak használnak, míg a többi rész a modell tanítására szolgál. A validálás során különböző statisztikai mutatókat alkalmaznak, hogy a gépi tanuló modell jóságáról visszajelzést kapjanak. Az adatokat szokták még három részre is osztani: tanító, validáló és teszt részhalmazokra. Ebben az esetben a validálás szerepe a tanításhoz kapcsolódik, ugyanis (i) bizonyos algoritmusok olyan adatokon mérik vissza a tanítás jóságát, amiket tanítás során nem láttak (ez a validáló halmaz) és ezt használják a tanítás körülményeinek befolyásolására (pl. tanítás leállítására), illetve (ii) a validáló halmazon lehet több tanuló módszert versenyeztetni és kiválasztani a legjobbat az elért eredménytől függően. A harmadik (teszt) részhalmaz már csak egy döntés nélküli visszamérésre szolgál.

4. Hivatkozások:

What is Model Validation? https://c3.ai/glossary/data-science/model-validation/

Deisenroth, M. P., Faisal, A. A., & Ong, C. S. (2020). Mathematics for machine learning. Cambridge University Press. https://doi.org/10.1017/9781108679930

5. Megjegyzések:​​​​​​​

6. Kulcsszavak: mesterséges intelligencia, gépi tanulás, adattudomány, modell tanítás, keresztvalidáció, túltanulás

3132 Megtekintés
Átlagos (0 Szavazatok)

Gyakran ismételt kérdések

Hogyan tudok hozzászólást fűzni a szócikkhez?

Regisztráció után (egy név és egy valós e-mail cím kell hozzá) lehet hozzászólni.

Ki felügyeli a fogalmak helyességét?

A Hírközlési és Informatikai Tudományos Egyesület által létrehozott szerkesztőbizottság hagyja jóvá a fogalmakat.

Lehet bővíteni a fogalomtárat?

A szerkesztőség határozza meg definiálandó fogalmakat. Örömmel vesszük javaslatait a „További fogalmak” oldalon található űrlap kitöltésével.