Мазмуну:

PySpark чогултуу деген эмне?
PySpark чогултуу деген эмне?

Video: PySpark чогултуу деген эмне?

Video: PySpark чогултуу деген эмне?
Video: ВВЕДЕНИЕ В PYSPARK И SPARKSQL / ОЛЕГ АГАПОВ 2024, Май
Anonim

чогултуу (Аракет) - Драйвер программасына массив катары берилиштер топтомунун бардык элементтерин кайтарыңыз. Бул, адатта, чыпкадан же маалыматтардын жетишерлик кичинекей бөлүгүн кайтарган башка операциядан кийин пайдалуу.

Ошентип, PySpark деген эмне?

PySpark Программалоо. PySpark Apache Spark жана Python кызматташтыгы болуп саналат. Apache Spark бул ачык булактуу кластердик-эсептөө алкагы, ылдамдыктын, колдонуунун жөнөкөйлүгүнүн жана агымдык аналитиканын айланасында курулган, ал эми Python жалпы максаттуу, жогорку деңгээлдеги программалоо тили.

Ошондой эле, PySparkта карта деген эмне? Spark Карта Трансформация. А карта бул Apache Sparkтагы трансформация операциясы. Бул RDD ар бир элементине тиешелүү жана ал натыйжаны жаңы RDD катары кайтарат. Карта N узундуктагы RDDди N узундуктагы башка RDDге айлантат. Киргизүү жана чыгаруу RDDs адатта бирдей сандагы жазууларга ээ болот.

Ошентип, PySpark'та SparkContext деген эмне?

PySpark - SparkContext . Жарнамалар. SparkContext кандайдыр бир кирүү чекити болуп саналат учкун функционалдуулук. Качан биз кайсынысы болбосун Spark тиркемесинде негизги функцияга ээ болгон драйвер программасы башталат жана сиздин SparkContext бул жерде башталат. Андан кийин драйвер программасы жумушчу түйүндөрдөгү аткаруучулардын ичиндеги операцияларды аткарат.

PySpark версиясын кантип текшерсем болот?

2 Жооптор

  1. Spark кабык терминалын ачып, буйрукту киргизиңиз.
  2. sc.version Же spark-submit --version.
  3. Эң оңой жолу - жөн гана буйрук сабында "учкундун кабыгын" ишке киргизүү. Ал көрсөтөт.
  4. Sparkтын учурдагы активдүү версиясы.

Сунушталууда: