Hadoopто маалыматтарды локалдаштырууга кантип жетишилет?
Hadoopто маалыматтарды локалдаштырууга кантип жетишилет?

Video: Hadoopто маалыматтарды локалдаштырууга кантип жетишилет?

Video: Hadoopто маалыматтарды локалдаштырууга кантип жетишилет?
Video: Поднимаем Hadoop-кластер локально | Скринкасты | Ok #1 2024, Май
Anonim

Маалыматтарды локалдаштыруу ичинде Hadoop . Сөздөрдүн көбү 5 лак же андан көп жолу кайталанган Wordcount үлгүсүн алалы. Анда Mapper фазасынан кийин ар бир карта чыгаруучу 5 Лак диапазонундагы сөздөргө ээ болот. LFSге Mapper чыгарууну сактоонун бул толук процесси деп аталат Маалыматтарды локалдаштыруу.

Муну эске алып, Hadoopто маалыматтарды локалдаштыруу деген эмне?

Концепциясы Маалыматтар аймагындагы жер Hadoop маалыматтары аймагындагы жер MapReduce эсептөөнү иш жүзүндөгү жерге жакын жылдыруу мүмкүнчүлүгүн билдирет маалыматтар чоң кыймылдын ордуна түйүнүндө жашайт маалыматтар эсептөөгө. Бул тармактын тыгынын азайтат жана системанын жалпы өткөрүү жөндөмдүүлүгүн жогорулатат.

Ошондой эле, чоң маалыматтар кантип сакталат? Көпчүлүк адамдар HDFS же Hadoop бөлүштүрүлгөн файл тутумун Hadoop менен автоматтык түрдө байланыштырышат маалыматтар кампалар. HDFS майда блоктордон турган кластерлерде маалыматты сактайт. Бул блоктор сакталган жеринде физикалык сактоо ички дисктер сыяктуу бирдиктер.

Ошентип, Hadoopто маалыматтар кантип сакталат?

Үстүндө Hadoop кластер, маалыматтар HDFS ичинде жана MapReduce системасы кластердеги ар бир машинада жайгашкан. Маалыматтар болуп саналат сакталган ичинде маалыматтар DataNodes боюнча блоктор. HDFS аларды кайталайт маалыматтар блокторду, адатта 128 МБ өлчөмүндө түзөт жана аларды кластер боюнча бир нече түйүндөрдө репликациялоо үчүн бөлүштүрөт.

HDFSде файлдар кантип сакталат?

HDFS ашкерелейт а файл тутумдук аттар мейкиндиги жана колдонуучунун маалыматтары болууга мүмкүндүк берет сакталган ичинде файлдар . Ички, а файл бир же бир нече блокторго бөлүнөт жана бул блоктор сакталган DataNodes топтомунда. NameNode аткарат файл системанын аталыш мейкиндигинде ачуу, жабуу жана атын өзгөртүү сыяктуу операциялар файлдар жана каталогдор.

Сунушталууда: