Паркет маалымат формат деген эмне?
Паркет маалымат формат деген эмне?

Video: Паркет маалымат формат деген эмне?

Video: Паркет маалымат формат деген эмне?
Video: Технология укладки ламината. Наглядная видео инструкция. 2024, Май
Anonim

Apache Паркет эркин жана ачык булак тилкеге багытталган маалыматтар сактоо формат Apache Hadoop экосистемасынын. Бул көпчүлүк менен шайкеш келет маалыматтар Hadoop чөйрөсүндө алкактарды иштетүү. Ал натыйжалуу камсыз кылат маалыматтар татаал иштетүү үчүн жакшыртылган аткаруу менен кысуу жана коддоо схемалары маалыматтар жапырт.

Жөн эле, паркет файлынын форматы кандай?

Паркет , ачык булак Файлдын форматы Hadoop үчүн. Паркет уяланган маалымат структураларын жалпак мамычада сактайт формат . Маалыматтар сапка багытталган ыкмада сакталган салттуу ыкмага салыштырмалуу, паркет сактоо жана аткаруу жагынан кыйла натыйжалуу.

Андан тышкары, паркет эмне үчүн колдонулат? Паркет Hadoop экосистемасындагы каалаган долбоор үчүн жеткиликтүү ачык булак файл форматы. Apache Паркет CSV же TSV файлдары сыяктуу катарга негизделген файлдарга салыштырмалуу маалыматтардын эффективдүү жана натыйжалуу жалпак мамычалык сактоо форматы үчүн иштелип чыккан.

Андан тышкары, паркет форматы маалыматтарды кантип сактайт?

DATA BLOCK Ар бир блок паркет файл болуп саналат сакталган катар топтор түрүндө. Ошентип, маалыматтар ичинде паркет файл бир нече катар топторго бөлүнгөн. Бул сап топтору өз кезегинде тилкедеги тилкеге туура келген бир же бир нече тилке бөлүктөрүнөн турат маалыматтар коюу. The маалыматтар барактар түрүндө жазылган ар бир тилке бөлүгү үчүн.

Паркетти адам окуйбу?

ORC, Паркет , жана Avro да машина- окула турган экилик форматтар, башкача айтканда, файлдар ансыз деле көрүнбөйт адамдар . Эгер керек болсо адам - окула турган JSON же XML сыяктуу форматта болсоңуз, анда сиз биринчи кезекте эмне үчүн Hadoop колдонуп жатканыңызды кайра карап чыгышыңыз керек.

Сунушталууда: