Hadoopто маалымат агымы деген эмне?
Hadoopто маалымат агымы деген эмне?

Video: Hadoopто маалымат агымы деген эмне?

Video: Hadoopто маалымат агымы деген эмне?
Video: Data Science with Python! Analyzing File Types from Avro to Stata 2024, Апрель
Anonim

Hadoop агымы . Hadoop агымы менен келген утилита болуп саналат Hadoop бөлүштүрүү. Утилита сизге Карта/Кыскартуу жумуштарын каалаган аткарылуучу же скрипт менен картачы жана/же редуктор катары түзүүгө жана иштетүүгө мүмкүндүк берет.

Ошондой эле билүү керек, Hadoopто агым деген эмне?

Hadoop агымы каалаган тилде Mappers жана Reduces жазууга мүмкүндүк берген жалпы API болуп саналат. Бирок негизги түшүнүк ошол эле бойдон калууда. Картачылар жана Редукторлор stdin жана stdout боюнча киргизүү жана чыгарууну (ачкыч, маани) жуптар катары алышат. Apache Hadoop колдонот агымдар колдонмоңуз менен UNIX стандартына ылайык Hadoop системасы.

пакеттик жана агымдык маалыматтар деген эмне? А партия жыйнагы болуп саналат маалыматтар белгилүү бир убакыт аралыгы ичинде топтоштурулган чекиттер. Бул үчүн көбүнчө колдонулган дагы бир термин терезе болуп саналат маалыматтар . Агым кайра иштетүү үзгүлтүксүз менен алектенет маалыматтар жана чоң айлануунун ачкычы маалыматтар тез салып маалыматтар.

Ошо сыяктуу эле, маалымат агымы деген эмнени билдирет?

Агымдагы маалыматтар болуп саналат маалыматтар ар кандай булактар тарабынан үзгүлтүксүз түзүлөт. Мындай маалыматтар колдонуу менен кадам сайын иштетилиши керек Агым бардык мүмкүнчүлүктөрү жок кайра иштетүү ыкмалары маалыматтар . Ал көбүнчө чоң контекстинде колдонулат маалыматтар анда ал жогорку ылдамдыкта көптөгөн ар кандай булактар тарабынан түзүлөт.

Hadoop агымы кайда?

The Hadoop агымдык банкасы EMRдин акыркы чыгарылышында дагы эле жеткиликтүү Hadoop . EMR релиз 4.0 менен башталат. 0 аны /usr/lib/ дарегинен тапса болот hadoop - mapreduce / hadoop - агым.

Сунушталууда: