Kiugró érték
1. Fogalom magyarul: kiugró érték
2. Fogalom angolul: outlier
3. Meghatározás:
A kiugró érték (kiugró adat, anomália) olyan megfigyelt érték a statisztikában, amely jelentősen eltér a többi megfigyelt értéktől. Ez általában azt jelenti, hogy az adott érték jóval nagyobb vagy kisebb, mint ami a többi adat alapján várható lenne. A kiugró adatok az elemzés során problémákat okozhatnak, mivel torzíthatják a statisztikai modellek eredményeit és következtetéseit. A kiugró értékek megjelenésének három fő oka lehet: hibás adat, természetes variancia és hibás modell. Hibás adat esetén mérési vagy feldolgozási hibák állhatnak a háttérben, amelyeket érdemes kideríteni és javítani. A természetes variancia azt jelenti, hogy a kiugró értékek a minta normális eloszlásából adódhatnak, de a mintaméret befolyásolja, hogy ez mennyire valószínű. Végül, ha egy érték nem illeszkedik a várt modellhez, az hibás modellre utalhat, ami torzíthatja az eredményeket és további vizsgálatot igényel. A gépi tanuló módszerek esetében vannak olyanok (pl. a nem felügyelt változathoz tartozó k-átlag klaszterező), amelyek érzékenyek a kiugró értékekre, ezért ezeket érdemes megkeresni és kiszűrni. Ezek kiszűrésére szakosodtak az anomália detekciós módszerek, amelyek széles körben képesek az kiugró értékek detektálására.
4. Hivatkozások:
Kiugró érték szócikk a wikipedián: https://hu.wikipedia.org/wiki/Kiugró_érték
Aggarwal, C. C., & Aggarwal, C. C. (2017). Outlier analysis, Springer International Publishing. https://doi.org/10.1007/978-3-319-47578-3
5. Megjegyzések:
6. Kulcsszavak: adatbányászat, adattudomány, anomália detekció, mesterséges intelligencia, statisztika