Klaszterezés

1. Fogalom magyarul: klaszterezés

2. Fogalom angolul: clustering

3. Meghatározás:

A klaszterezés egy felügyelet nélküli gépi tanulási technika, amelynek célja az adatok csoportokba rendezése hasonlóságuk alapján úgy, hogy a klaszteren (csoporton) belüli hasonlóság maximális legyen, miközben minimalizálja a klaszterek közötti hasonlóságot. Tehát az adathalmazt olyan részekre bontja, ahol az egyes klasztereken belül az adatok egymáshoz közelebb vannak, mint a klaszterek között. Az általános klaszterezési algoritmusok közé tartoznak a K-átlag, a hierarchikus klaszterezés, a DBSCAN és a Gauss-keverék modellek. A legújabb fejlesztések egyike a hagyományos klaszterezést neurális hálózatokkal kombináló mély klaszterezési módszer. A különféle algoritmusok működését leginkább befolyásoló tényezők az adateloszlás, a szükséges klaszterek száma és a definiált távolsági mérőszám, így a konkrét problémától és az adatok jellegétől függően érdemes a klaszterezési eljárást kiválasztani. A klaszterezési alkalmazások a marketingben az ügyfelek szegmentálásától a képtömörítésig és az anomáliák észleléséig terjednek, de használják az e-kereskedelemben vásárlói viselkedés alapú ajánlórendszerek fejlesztéséhez, vagy a biológiában a genetikai adatok elemzése során a különböző gének hasonlóságainak azonosítására is.

4. Hivatkozások:

  • Xu, Rui, and Donald C. Wunsch. "Clustering." Wiley-IEEE Press, 2008.

5. Megjegyzések:​​​​​​​

6. Kulcsszavak:

mesterséges intelligencia, gépi tanulás

2636 Megtekintés
Átlagos (0 Szavazatok)