Эмне үчүн Hadoop арзаныраак?
Эмне үчүн Hadoop арзаныраак?

Video: Эмне үчүн Hadoop арзаныраак?

Video: Эмне үчүн Hadoop арзаныраак?
Video: Аны куруу үчүн... Мен аны жок кылышым керек болчу 2024, Декабрь
Anonim

Hadoop салыштырмалуу болуп саналат арзан

Ишке ашыруу үчүн бир терабайттын баасы а Hadoop кластер болуп саналат арзаныраак лента резервдик системасын орнотуу үчүн бир терабайт баасынан караганда. Берилген, а Hadoop системанын иштеши кымбатыраак, анткени маалыматтарды камтыган дисктер лентадан айырмаланып, бардыгы онлайн жана кубатталган.

Ушундай жол менен, Hadoop үнөмдүүбү?

Hadoop масштабдуу сунуш кылат, наркы - натыйжалуу жана чоң маалыматтарды сактоо жана иштетүү үчүн жогорку жеткиликтүү чечим. Менчик эмес физикалык катмарды колдонуу технологиядан көз карандылыкты кыйла азайтат. Ал ошондой эле виртуалдык машиналарда же IAAS булутунда жайгаштырылганда ийкемдүү өлчөө мүмкүнчүлүгүн сунуш кылат.

Кошумча, эмне үчүн Spark Hadoop караганда жакшыраак? Apache Spark – Spark чагылган ылдам кластердик эсептөө куралы болуп саналат. Apache Spark колдонмолорду эстутумда 100 эсеге жана дискте 10 эсеге чейин тезирээк иштетет Hadoop караганда . Дискке окуу/жазуу циклинин санын кыскартуу жана эстутумда аралык маалыматтарды сактоо Spark мүмкүн кылат.

Муну эске алып, Hadoop канча турат?

Ишкана классы үчүн Hadoop кластер, орто диапазондогу Intel сервери сунушталат. Булар адатта наркы Каалаган өндүрүмдүүлүккө жараша 3ТБдан 6ТБга чейинки диск кубаттуулугу менен бир түйүн үчүн 4000 доллардан 6000 долларга чейин. Бул түйүн дегенди билдирет наркы ТБ үчүн болжол менен 1 000 доллардан 2 000 долларга чейин. HDFS файл өлчөмү боюнча физикалык чектөөлөр жок.

Эмне үчүн Hadoop тезирээк?

Спарктын себеби тезирээк караганда Hadoop Spark бардыгын эс тутумда иштетет. Ал ошондой эле эстутумга туура келбеген маалыматтар үчүн дискти колдоно алат.

Сунушталууда: