Përmbajtje:

A mund ta ekzekutoj Python në Hadoop?
A mund ta ekzekutoj Python në Hadoop?

Video: A mund ta ekzekutoj Python në Hadoop?

Video: A mund ta ekzekutoj Python në Hadoop?
Video: Data Science with Python! Analyzing File Types from Avro to Stata 2024, Mund
Anonim

Me një zgjedhje midis gjuhëve të programimit si Java, Scala dhe Python për Hadoop ekosistemin, shumica e zhvilluesve përdorin Python për shkak të bibliotekave mbështetëse për detyrat e analizës së të dhënave. Hadoop transmetimi i lejon përdoruesit të krijojë dhe ekzekutuar Harto/Zvogëlo punët me ndonjë skript ose të ekzekutueshëm si hartues ose/dhe reduktues.

Në mënyrë të ngjashme, pyetet, si lidhet Python me Hadoop?

Lidhja e Hadoop HDFS me Python

  1. Hapi 1: Sigurohuni që Hadoop HDFS po funksionon siç duhet. Hapni Terminal/Command Prompt, kontrolloni nëse HDFS po funksionon duke përdorur komandat e mëposhtme: start-dfs.sh.
  2. Hapi 2: Instaloni bibliotekën libhdfs3.
  3. Hapi 3: Instaloni bibliotekën hdfs3.
  4. Hapi 4: Kontrolloni nëse lidhja me HDFS është e suksesshme.

Në mënyrë të ngjashme, çfarë është Hadoop në Python? Python është një gjuhë programimi e plotë për qëllime të përgjithshme, e cila mund të përdoret për të bërë pothuajse gjithçka në botën e programimit. Hadoop është një kornizë e madhe e të dhënave e shkruar në Java për t'u marrë me vëllime të mëdha të të dhënave. Ka shumë institute online të cilat Hadoop me Python kurse të tilla si: Analytixlabs. Edureka.

Më pas, pyetja është, si mund të ekzekutoj një program Python MapReduce në Hadoop?

Shkrimi i një programi Hadoop MapReduce në Python

  1. Motivimi.
  2. Çfarë duam të bëjmë.
  3. Parakushtet.
  4. Python MapReduce Code. Hapi i hartës: mapper.py. Hapi i reduktimit: reduktor.py.
  5. Ekzekutimi i kodit Python në Hadoop. Shkarkoni shembullin e të dhënave hyrëse. Kopjoni të dhënat e shembullit lokal në HDFS.
  6. Kodi i përmirësuar i Mapper dhe Reducer: duke përdorur iteratorët dhe gjeneruesit e Python. hartues.py. reduktues.py.

Çfarë është kavanoza Hadoop Streaming?

Hadoop shpërndarja ofron një program Java të quajtur Hadoop Streaming . Është i paketuar në një kavanoz dosje. Me Hadoop Streaming , ne mund të krijojmë dhe të ekzekutojmë punët Map Reduce me një skript të ekzekutueshëm. Hadoop Streaming është një mjet i dobishëm që vjen me Hadoop shpërndarja. Mund të përdoret për të ekzekutuar programe për analizën e të dhënave të mëdha.

Recommended: