Çfarë është formati i të dhënave të parketit?
Çfarë është formati i të dhënave të parketit?

Video: Çfarë është formati i të dhënave të parketit?

Video: Çfarë është formati i të dhënave të parketit?
Video: Top News- Çfarë është sistemi ETIAS!/Si i ‘skanon’ udhëtarët para se të hyjnë në Shengen 2024, Mund
Anonim

Apache Parket është një kolonë e lirë dhe me burim të hapur të dhëna magazinimit format të ekosistemit Apache Hadoop. Është në përputhje me shumicën e të dhëna kornizat e përpunimit në mjedisin Hadoop. Ofron efikasitet të dhëna Skemat e ngjeshjes dhe kodimit me performancë të përmirësuar për të trajtuar komplekse të dhëna në masë.

Thjesht kështu, cili është formati i skedarit të parketit?

Parket , një burim i hapur formati i skedarit për Hadoop. Parket ruan strukturat e të dhënave të mbivendosura në një kolonë të sheshtë format . Krahasuar me një qasje tradicionale ku të dhënat ruhen në një qasje të orientuar nga rreshti, parket është më efikas për sa i përket ruajtjes dhe performancës.

Për më tepër, për çfarë përdoret parketi? Parket është një format skedari me burim të hapur i disponueshëm për çdo projekt në ekosistemin Hadoop. Apache Parket është projektuar për format efikas dhe performues të ruajtjes kolone të sheshtë të të dhënave në krahasim me skedarët e bazuar në rreshta si skedarët CSV ose TSV.

Për më tepër, si i ruan të dhënat formati i parketit?

TË DHËNAT BLOCK Çdo bllok në parket skedari është të ruajtura në formën e grupeve të rreshtave. Kështu që, të dhëna ne nje parket skedari është i ndarë në grupe të shumëfishta rreshtash. Këto grupe rreshtash nga ana e tyre përbëhen nga një ose më shumë copa kolone që korrespondojnë me një kolonë në të dhëna vendosur. Të të dhëna për çdo copë kolone të shkruar në formën e faqeve.

A është parketi i lexueshëm nga njeriu?

ORC, Parket , dhe Avro janë gjithashtu makineri- të lexueshme formatet binare, që do të thotë se skedarët duken si koprraci njerëz . Nëse keni nevojë një njeri - të lexueshme format si JSON ose XML, atëherë ndoshta duhet të rishikoni pse po përdorni Hadoop në radhë të parë.

Recommended: