Скаладагы RDD деген эмне?
Скаладагы RDD деген эмне?

Video: Скаладагы RDD деген эмне?

Video: Скаладагы RDD деген эмне?
Video: Кытайдагы Кыргыздар жөнүндө таң калычтуу фактылар [Кыргыз топ] 2024, Ноябрь
Anonim

Туруктуу бөлүштүрүлгөн маалымат топтомдору ( RDD ) бул Sparkтын негизги маалымат структурасы. Бул объекттердин өзгөрүлгүс бөлүштүрүлгөн жыйнагы. RDDs Python, Java, же каалаган түрүн камтышы мүмкүн Scala объекттер, анын ичинде колдонуучу аныктаган класстар. Формалдуу түрдө, а RDD окуу үчүн гана арналган, жазуулардын бөлүнгөн жыйнагы.

Ошондой эле суроо туулат, RDD менен DataFrame ортосунда кандай айырма бар?

RDD – RDD көптөгөн машиналарга таралган маалымат элементтеринин бөлүштүрүлгөн жыйнагы ичинде кластер. RDDs маалыматтарды чагылдырган Java же Scala объекттеринин жыйындысы. DataFrame – А DataFrame аталган тилкелерде уюштурулган маалыматтардын бөлүштүрүлгөн жыйнагы. Бул концептуалдык жактан үстөлгө барабар ичинде реляциялык маалымат базасы.

Андан тышкары, RDD кантип бөлүштүрүлөт? Туруктуу Бөлүштүрүлгөн Берилиштер топтому ( RDDs ) Алар а таркатылды кластердин ар кандай машиналарынын эс тутумунда же дисктеринде сакталган объекттердин жыйындысы. Жалгыз RDD Бул бөлүктөр кластердин ар кандай машиналарында сакталып жана иштетиле тургандай кылып бир нече логикалык бөлүктөргө бөлүүгө болот.

Spark RDD кантип иштейт?

RDDs ичинде Spark бөлүмдөрдү камтыган жазуулар жыйнагы бар. RDDs ичинде Spark кичинекей логикалык маалымат бөлүктөрүнө бөлүнөт - бөлүмдөр деп аталат, иш-аракет аткарылганда, ар бир бөлүмдө тапшырма ишке киргизилет. Бөлмөлөр RDDs параллелизмдин негизги бирдиктери болуп саналат.

RDD же DataFrame кайсынысы ылдамыраак?

RDD - Жөнөкөй топтоо жана топтоо операцияларын аткарууда RDD API жайыраак. DataFrame - чалгындоочу талдоо жүргүзүүдө, маалыматтар боюнча жалпы статистиканы түзүүдө; dataframes болуп саналат тезирээк . RDD - Сиз төмөнкү деңгээлдеги трансформацияны жана аракеттерди кааласаңыз, биз колдонобуз RDDs . Ошондой эле, бизге жогорку деңгээлдеги абстракциялар керек болгондо колдонобуз RDDs.

Сунушталууда: