Кластерлөөнүн кайсы түрү чоң маалыматтарды иштете алат?
Кластерлөөнүн кайсы түрү чоң маалыматтарды иштете алат?

Video: Кластерлөөнүн кайсы түрү чоң маалыматтарды иштете алат?

Video: Кластерлөөнүн кайсы түрү чоң маалыматтарды иштете алат?
Video: Prolonged Field Care Podcast 144: Pain Pathway 2024, Ноябрь
Anonim

Иерархиялык кластерлөө мүмкүн эмес чоң маалыматтарды иштетүү жакшы бирок K билдирет кластерлөө болот. Себеби, K орточо убакыттын татаалдыгы сызыктуу, б.а. O(n), ал эми иерархиялык кластерлөө квадраттык, б.а. O(n2).

Буга байланыштуу, чоң маалыматтарда кластерлөө деген эмне?

Кластерлөө тобун камтыган Machine Learning ыкмасы маалыматтар упайлар. топтому берилген маалыматтар упайлар, биз колдоно алабыз кластерлөө ар бирин классификациялоо үчүн алгоритм маалыматтар белгилүү бир топко көрсөтүү.

Ошо сыяктуу эле, кластерлөө деген эмне жана анын түрлөрү? Кластерлөө ыкмалар маркетинг, биомедициналык жана геомейкиндик сыяктуу тармактардан чогултулган көп өзгөрмөлүү маалымат топтомдорундагы окшош объекттердин топторун аныктоо үчүн колдонулат. Алар башкача түрлөрү нын кластерлөө ыкмалары, анын ичинде: Бөлүү ыкмалары. Иерархиялык кластерлөө . Моделге негизделген кластерлөө.

Ошондой эле, абдан чоң маалымат топтомдору үчүн кластердик алгоритмдин кайсы түрү жакшыраак экенин билүү керек?

K- билдирет эң көп колдонулгандардын бири болуп саналат кластерлөө ыкмалары жана K- билдирет MapReduce негизинде өнүккөн чечим катары каралат абдан чоң маалымат топтомун кластерлөө . Бирок, итерациялардын санынын көбөйүшүнө байланыштуу аткаруу убактысы дагы эле тоскоолдук болуп саналат. маалымат топтому өлчөмү жана саны кластерлер.

Кластерлөө эмне үчүн колдонулат?

Кластерлөө көзөмөлсүз окутуу ыкмасы болуп саналат жана статистикалык маалыматтарды талдоо үчүн жалпы ыкмасы болуп саналат ичинде колдонулат көп талаалар. Маалымат илиминде биз колдоно алабыз кластерлөө Колдонгондо маалымат пункттары кайсы топторго кирээрин көрүү менен биздин маалыматтардан баалуу түшүнүктөрдү алуу үчүн талдоо кластерлөө алгоритм.

Сунушталууда: