Spark берүү деген эмне?
Spark берүү деген эмне?

Video: Spark берүү деген эмне?

Video: Spark берүү деген эмне?
Video: Сабак "Маалымат илими деген эмне?" 2024, Май
Anonim

Берүү Apache өзгөрмөлөр Spark окуу үчүн гана арналган аткаруучулар боюнча өзгөрмөлөрдү бөлүшүү механизми болуп саналат. жок берүү өзгөрмөлөр бул өзгөрмөлөр ар бир трансформация жана аракет үчүн ар бир аткаруучуга жөнөтүлөт жана бул тармактын ашыкча чыгымына алып келиши мүмкүн.

Анын сыңарындай, эл сурашат, мен качан учкун чыгарышым керек?

Берүү өзгөрмөлөр көбүнчө бир нече этаптардагы тапшырмалар бирдей маалыматтарды талап кылганда же сериялык эмес формадагы маалыматтарды кэштөө талап кылынганда колдонулат. Берүү өзгөрмөлөр V өзгөрмөнүн жардамы менен SparkContext чакырып түзүлөт.

Ошондой эле, учкундагы аккумуляторлор жана уктуруу өзгөрмөлөрү деген эмне? Spark бөлүштүрүүнүн эки түрүн колдойт өзгөрмөлөр : берүү өзгөрмөлөрү , бардык түйүндөрдө эстутумдагы маанини кэштөө үчүн колдонулушу мүмкүн жана аккумуляторлор , кайсылар өзгөрмөлөр эсептегичтер жана суммалар сыяктуу гана "кошулган".

Ушуну эске алып, учкун аккумулятору деген эмне?

Аккумуляторлор алар ассоциативдик операция аркылуу гана "кошулган" өзгөрмөлөр жана ошондуктан параллелдүү түрдө натыйжалуу колдоого алынышы мүмкүн. Алар эсептегичтерди (MapReduce сыяктуу) же суммаларды ишке ашыруу үчүн колдонулушу мүмкүн. Spark түпкүлүгүндө колдойт аккумуляторлор сандык түрлөрүн жана программисттер жаңы түрлөрү үчүн колдоо кошо алат.

Spark'тагы уктуруу өзгөрмөсүн кантип жаңыртсам болот?

  1. Маалымдама маалыматтарын издөөнү forEachPartition же forEachRdd ичине жылдырыңыз, ошентип ал толугу менен жумушчуларда болот.
  2. Refdata өзгөргөн сайын жаңы уктуруу өзгөрмөсү менен Spark контекстти кайра иштетиңиз.

Сунушталууда: