Ачкыч менен азайтуу деген эмне?
Ачкыч менен азайтуу деген эмне?

Video: Ачкыч менен азайтуу деген эмне?

Video: Ачкыч менен азайтуу деген эмне?
Video: ЭРКЕКТИН АЯЛЫН СҮЙБӨЙ КАЛГАНЫН КАНТИП БИЛСЕ БОЛОТ? 5 БЕЛГИ 2024, Май
Anonim

Spark RDD reduceByKey функциясы ар бири үчүн маанилерди бириктирет ачкыч ассоциацияны колдонуу азайтуу функция. Бул интуитивдик жактан алганда, бул функция элементтин тартибине карабастан, бир нече бөлүмдөр менен RDD маалыматтарынын бир топтомуна кайталанып колдонулганда бирдей натыйжа берет.

Андан кийин, groupByKey менен reduceByKey ортосунда кандай айырма бар?

groupByKey () бул жөн гана маалымат топтомуңузду ачкычтын негизинде топтоо. reduceByKey () топтоо + топтоо сыяктуу бир нерсе. reduceByKey биз чоң маалымат топтомун иштеткенде колдонсо болот. aggregateByKey() логикалык жактан окшош reduceByKey () бирок натыйжаны кайтарууга мүмкүнчүлүк берет башкача түрү.

Ошондой эле билиңиз, эмне үчүн кыскартуу иш-аракет учкунда болот? Учкун азайтат операция болуп саналат иш-аракет операциянын түрү жана ал бардык тизилген жалкоо көрсөтмөлөр үчүн толук DAG аткарылышын козгойт. Spark RDD азайтуу функция көрсөтүлгөн коммутативдик жана ассоциативдик бинардык операторду колдонуу менен бул RDD элементтерин азайтат. Учкун азайтат операция дээрлик окшош азайтуу Scala ыкмасы.

Жогорудагыдан тышкары, Pairrdd деген эмне?

Spark ачкыч/маани жуптарын камтыган RDD боюнча атайын операцияларды камсыз кылат. Бул RDD жуп RDD деп аталат. Жуп RDDs көптөгөн программаларда пайдалуу курулуш материалы болуп саналат, анткени алар ар бир ачкычта параллелдүү аракеттенүүгө же тармак боюнча маалыматтарды кайра топтоштурууга мүмкүндүк берген операцияларды ачыкка чыгарат. PairRDDs KEY/VALUE жуптары.

reduceByKey аракетпи?

reduce() багытталган ациклдик графикке (DAG) кошулбаган коллекцияны чыгарат, ошондуктан иш-аракет . Бирок, reduceByKey () RDD кайтарат, бул DAGдагы дагы бир деңгээл/мамлекет, ошондуктан трансформация.

Сунушталууда: