Kiugró érték

1. Fogalom magyarul: kiugró érték     

2. Fogalom angolul: outlier

3. Meghatározás:

A kiugró érték (kiugró adat, anomália) olyan megfigyelt érték a statisztikában, amely jelentősen eltér a többi megfigyelt értéktől. Ez általában azt jelenti, hogy az adott érték jóval nagyobb vagy kisebb, mint ami a többi adat alapján várható lenne. A kiugró adatok az elemzés során problémákat okozhatnak, mivel torzíthatják a statisztikai modellek eredményeit és következtetéseit. A kiugró értékek megjelenésének három fő oka lehet: hibás adat, természetes variancia és hibás modell. Hibás adat esetén mérési vagy feldolgozási hibák állhatnak a háttérben, amelyeket érdemes kideríteni és javítani. A természetes variancia azt jelenti, hogy a kiugró értékek a minta normális eloszlásából adódhatnak, de a mintaméret befolyásolja, hogy ez mennyire valószínű. Végül, ha egy érték nem illeszkedik a várt modellhez, az hibás modellre utalhat, ami torzíthatja az eredményeket és további vizsgálatot igényel. A gépi tanuló módszerek esetében vannak olyanok (pl. a nem felügyelt változathoz tartozó k-átlag klaszterező), amelyek érzékenyek a kiugró értékekre, ezért ezeket érdemes megkeresni és kiszűrni. Ezek kiszűrésére szakosodtak az anomália detekciós módszerek, amelyek széles körben képesek az kiugró értékek detektálására.

4. Hivatkozások:

Kiugró érték szócikk a wikipedián: https://hu.wikipedia.org/wiki/Kiugró_érték

Aggarwal, C. C., & Aggarwal, C. C. (2017). Outlier analysis, Springer International Publishing. https://doi.org/10.1007/978-3-319-47578-3

5. Megjegyzések:​​​​​​​

6. Kulcsszavak: adatbányászat, adattudomány, anomália detekció, mesterséges intelligencia, statisztika

2784 Megtekintés
Átlagos (0 Szavazatok)