Spark жергиликтүү файлдарды окуй алабы?
Spark жергиликтүү файлдарды окуй алабы?

Video: Spark жергиликтүү файлдарды окуй алабы?

Video: Spark жергиликтүү файлдарды окуй алабы?
Video: Судья Дредд Лордун тарыхы жана түшүндүрүлгөн алгачкы ... 2024, Ноябрь
Anonim

Ал эми Spark жүктөөнү колдойт файлдар тартып жергиликтүү файл системасы, ал талап кылат файлдар кластериңиздеги бардык түйүндөрдө бирдей жолдо жеткиликтүү. NFS, AFS жана MapRдин NFS катмары сыяктуу кээ бир тармактык файл системалары колдонуучуга кадимки файл системасы катары ачылат.

Кийинчерээк, мен кантип локалдык режимде учкунду иштетем деп сурашы мүмкүн?

In жергиликтүү режим , учкун жумуштар чуркоо бир машинада жана параллелдүү түрдө көп агымдын жардамы менен аткарылат: бул параллелизмди машинаңыздагы өзөктөрдүн санына (эң көп) чектейт. үчүн чуркоо жумуш орундары жергиликтүү режим , адегенде интерактивдүү режимде SLURM аркылуу машинаны резервдештирүү керек режими жана ага кириңиз.

Жогорудагыдан тышкары, SC textFile деген эмне? textFile уюмдун ыкмасы болуп саналат. apache. SparkContext окуган класс а текст файлы HDFSден, локалдык файл тутумунан (бардык түйүндөрдө бар) же Hadoop колдогон каалаган файл тутумунун URIсынан жана аны RDD Strings катары кайтарыңыз.

Ушуга байланыштуу, учкун файлы деген эмне?

The Spark File бардык чыгармачылык жакшылыктарыңызды сактап турган документ болуп саналат. Бул жазуучу Стивен Джонсон тарабынан аныкталган. Ошентип, түн ортосунда Post-it® баракчасына жазууларды тырмап же идеялар үчүн ар кандай журналдарды арнагандын ордуна, сиз бардык концепцияларыңызды бир жерге топтойсуз. файл.

Параллелдүү чогултуу учкуну деген эмне?

Биз кийинчерээк бөлүштүрүлгөн маалымат топтомдорундагы операцияларды сүрөттөйбүз. Параллелдүү жыйнактар JavaSparkContext дын чакыруусу менен түзүлөт параллелдөө бар болгон ыкма боюнча Коллекция сиздин драйвер программаңызда. элементтери чогултуу параллелдүү иштей турган бөлүштүрүлгөн маалымат топтомун түзүү үчүн көчүрүлөт.

Сунушталууда: