Hadoopтогу маалымат көлү деген эмне?
Hadoopтогу маалымат көлү деген эмне?

Video: Hadoopтогу маалымат көлү деген эмне?

Video: Hadoopтогу маалымат көлү деген эмне?
Video: Data Science with Python! Analyzing File Types from Avro to Stata 2024, Май
Anonim

А Hadoop маалымат көлү болуп саналат маалыматтар бир же бир нече башкаруу платформасы Hadoop кластерлер. Ал, негизинен, байланышсыз иштетүү жана сактоо үчүн колдонулат маалыматтар , мисалы, журнал файлдары, интернет чыкылдатуу жазуулары, сенсор маалыматтар , JSON объектилери, сүрөттөрү жана социалдык медиа посттору.

Бул жагынан алганда, маалымат кампасы менен маалымат көлүнүн ортосунда кандай айырма бар?

Маалымат көлдөрү жана маалыматтар кампалар да чоң сактоо үчүн кеңири колдонулат маалыматтар , бирок алар бири-бирин алмаштыра турган терминдер эмес. А маалымат көлү чийки ири көлмө болуп саналат маалыматтар , максаты азырынча аныктала элек. А маалымат кампасы структураланган, чыпкаланган репозиторий болуп саналат маалыматтар белгилүү бир максатта иштетилген.

Андан тышкары, маалымат көлүнүн архитектурасы деген эмне? А Data Lake структураланган, жарым структураланган жана структураланбаган чоң көлөмдө сактай турган сактагыч репозиторий маалыматтар . Иерархалдык Dataware үйүнөн айырмаланып, кайда маалыматтар Файлдарда жана Папкада сакталат, Маалымат көлү батири бар архитектура.

Буга байланыштуу маалымат көлү деген эмнени билдирет?

А маалымат көлү ири көлөмдөгү чийки затты сактаган сактоочу жай маалыматтар зарыл болгонго чейин өзүнүн түп нускасында. Иерархиялык болгондо маалыматтар кампа дүкөндөрү маалыматтар файлдарда же папкаларда, а маалымат көлү сактоо үчүн жалпак архитектураны колдонот маалыматтар . Мөөнөт маалымат көлү көбүнчө Hadoop-багытталган объект сактагыч менен байланышкан.

Elasticsearch маалымат көлбү?

А маалымат көлү жөн гана унаа токтотуучу жай маалыматтар сизге керек болгонго чейин жана ал HDFS (эң таралган), объект сактагыч, NAS кутучалары же башка нерселерди камтышы мүмкүн. Негизинен, Elasticsearch индекстөө үчүн курал болуп саналат маалыматтар , сактоо үчүн эмес маалыматтар өзү.

Сунушталууда: