Мазмуну:

Мен Hadoop боюнча Python иштете аламбы?
Мен Hadoop боюнча Python иштете аламбы?

Video: Мен Hadoop боюнча Python иштете аламбы?

Video: Мен Hadoop боюнча Python иштете аламбы?
Video: Data Science with Python! Analyzing File Types from Avro to Stata 2024, Май
Anonim

Java, Scala жана сыяктуу программалоо тилдерин тандоо менен Python үчүн Hadoop экосистема, көпчүлүк иштеп чыгуучулар колдонушат Python анын маалымат аналитика милдеттери үчүн колдоо китепканалары үчүн. Hadoop агым колдонуучу түзүүгө мүмкүндүк берет жана аткаруу Карталоочу же/жана редуктор катары ар кандай скрипт же аткарылуучу жумуштарды карта/кыскартыңыз.

Ошо сыяктуу эле, суралат, Python Hadoop менен кантип туташат?

Python менен Hadoop HDFS туташтыруу

  1. 1-кадам: Hadoop HDFS туура иштеп жатканын текшериңиз. Терминалды/Буйрук сапты ачыңыз, HDFS иштеп жатканын төмөнкү буйруктарды колдонуу менен текшериңиз: start-dfs.sh.
  2. Step2: libhdfs3 китепканасын орнотуу.
  3. Step3: hdfs3 китепканасын орнотуу.
  4. Step4: HDFS менен байланыш ийгиликтүү болгонун текшериңиз.

Ошо сыяктуу эле, Pythonдо Hadoop деген эмне? Python Бул программалоо дүйнөсүндө дээрлик бардыгын жасоо үчүн колдонула турган толук программалоо тили. Hadoop чоң көлөмдөгү маалыматтар менен иштөө үчүн Java тилинде жазылган чоң маалымат алкагы. Көптөгөн онлайн институттар бар Hadoop менен Python сыяктуу курстар: Analytixlabs. Edureka.

Андан кийин, суроо туулат, мен кантип Hadoopдо Python MapReduce программасын иштетем?

Pythonдо Hadoop MapReduce программасын жазуу

  1. Мотивация.
  2. Биз эмне кылгыбыз келет.
  3. Пререквизиттер.
  4. Python MapReduce коду. Карта кадамы: mapper.py. Кыскартуу кадамы: reducer.py.
  5. Hadoop боюнча Python кодун иштетүү. Мисал киргизүү дайындарын жүктөп алыңыз. Жергиликтүү мисал маалыматтарды HDFSге көчүрүңүз.
  6. Жакшыртылган Mapper жана Reducer коду: Python итераторлорун жана генераторлорун колдонуу. mapper.py. reduktor.py.

Hadoop Streaming банкасы деген эмне?

Hadoop бөлүштүрүү деп аталган Java утилитасын камсыз кылат Hadoop агымы . Ал пакеттелет банка файл. менен Hadoop агымы , биз аткарылуучу скрипт менен Map Reduce жумуштарын түзүп, иштете алабыз. Hadoop агымы менен келген утилита болуп саналат Hadoop бөлүштүрүү. Бул чоң маалыматтарды талдоо үчүн программаларды аткаруу үчүн колдонулушу мүмкүн.

Сунушталууда: