Cómo practicar Hadoop en línea: 11 pasos (con imágenes)

Tabla de contenido:

Cómo practicar Hadoop en línea: 11 pasos (con imágenes)
Cómo practicar Hadoop en línea: 11 pasos (con imágenes)

Video: Cómo practicar Hadoop en línea: 11 pasos (con imágenes)

Video: Cómo practicar Hadoop en línea: 11 pasos (con imágenes)
Video: Como Crear Una Calculadora Básica en PHP | Ejemplo de Calculadora básica usando PHP | FACILITOPHP21 2024, Marcha
Anonim

Como uno de los marcos de programación de código abierto más potentes, Hadoop es una herramienta importante para cualquiera que desee encontrar un trabajo de big data. Si desea repasar sus habilidades con Hadoop o aprender a dominarlo, su mejor opción es tomar un curso en línea. Si no está disponible para usted, vea tutoriales gratuitos en línea y use materiales de referencia para solucionar problemas específicos. Una vez que haya aprendido los conceptos básicos, practique con pequeños conjuntos de datos del mundo real para mejorar sus habilidades.

Pasos

Método 1 de 2: Realización de cursos y uso de tutoriales

Practica Hadoop Online Paso 1
Practica Hadoop Online Paso 1

Paso 1. Regístrese en Cloudera para un curso de 6 partes y tutoriales interactivos

Cloudera te ofrece ejemplos del mundo real para practicar en un entorno de solo lectura, por lo que no tienes que preocuparte por cometer grandes errores. También ofrecen herramientas analíticas para ayudarlo a experimentar la consulta de datos, así como una demostración en vivo gratuita llamada Cloudera Live para ayudarlo a aprender el entorno de Hadoop.

Aunque el curso completo y en profundidad con certificación le costará $ 295, definitivamente valdrá la pena si está utilizando estas habilidades para su trabajo. Usar el curso de Cloudera lo ayudará a detectar errores y ahorrar tiempo, lo que hará que se amortice rápidamente

Practica Hadoop Online Paso 2
Practica Hadoop Online Paso 2

Paso 2. Pruebe los cursos en línea gratuitos a través de Cloudera si ya conoce los conceptos básicos

Si tiene experiencia con Hadoop y solo desea un repaso, es posible que no necesite desembolsar el dinero para el curso de 6 partes. En su lugar, consulte los cursos gratuitos en línea en el sitio web de la Universidad de Cloudera.

Hay recursos para administradores, desarrolladores y analistas de datos, por lo que no importa cuál sea su función, debería poder encontrar un curso apropiado

Practica Hadoop Online Paso 3
Practica Hadoop Online Paso 3

Paso 3. Toma un curso de nivel universitario en Coursera si quieres más teoría

Coursera es una fuente reconocida y respetada de cursos de programación. Aunque las instrucciones son generalmente más teóricas y no incluyen tantos ejemplos de ejecución, puede practicar junto con el tutorial y utilizar los proyectos del curso para adquirir experiencia práctica.

  • Puede encontrar este curso en línea en
  • El costo varía entre los cursos, pero Coursera también ofrece una opción de ayuda financiera para aquellos que califiquen.
Practica Hadoop Online Paso 4
Practica Hadoop Online Paso 4

Paso 4. Siga un curso gratuito sobre Big Data University para una opción económica

Si no desea pagar por un curso en línea, Big Data University es una excelente opción. Tienen un curso de 2 partes, que se enfoca primero en los conceptos básicos de Hadoop, luego en la programación con Hadoop, y el formato en línea hace que sea fácil ir a su propio ritmo.

  • Puede encontrar estos cursos en
  • Ofrecen muchos tutoriales en inglés, así como en japonés, español, portugués y ruso.
Practica Hadoop Online Paso 5
Practica Hadoop Online Paso 5

Paso 5. Busque tutoriales en YouTube si necesita capacitación específica y gratuita

Hay miles de videos creados para explicar Hadoop y cómo utilizarlo. La amplia gama de videos te brinda flexibilidad y además es gratis. Si se encuentra con un problema específico, busque en YouTube un video que lo guíe a través del proceso.

Los tutoriales de Hadoop también deberían ser bastante fáciles de encontrar, ya que "hadoop" es un término de búsqueda único

Practica Hadoop Online Paso 6
Practica Hadoop Online Paso 6

Paso 6. Utilice los tutoriales gratuitos de Yahoo si desea practicar con un ejemplo virtual

Estos tutoriales están divididos en 7 módulos y le enseñan cómo instalar y operar Hadoop desde el principio. Esta es una excelente opción para repasar habilidades específicas si están un poco oxidadas.

Practica Hadoop Online Paso 7
Practica Hadoop Online Paso 7

Paso 7. Consulte el documento de código abierto de IBM para obtener instrucciones detalladas y gratuitas

Este es un documento PDF de código abierto increíblemente completo creado por una iniciativa de capacitación de IBM. Lo guía a través de Hadoop cuidadosamente, paso a paso, y le brinda instrucciones claras por escrito.

Estas instrucciones también funcionan bien cuando se combinan con una demostración en vivo como Cloudera

Método 2 de 2: transición a la aplicación del mundo real

Practica Hadoop Online Paso 8
Practica Hadoop Online Paso 8

Paso 1. Pregunte si puede implementar Hadoop en el trabajo para practicar con datos reales

Haga una solicitud con su jefe o supervisor, o hable con ellos personalmente sobre cómo llevar estas nuevas habilidades al lugar de trabajo. Esto es especialmente importante si su empresa pagó por cualquier capacitación o curso en línea.

Cuanto antes empiece a implementar las habilidades que ha aprendido, antes podrá dominarlas

Practica Hadoop Online Paso 9
Practica Hadoop Online Paso 9

Paso 2. Busque proyectos sencillos para practicar sus habilidades

Elija proyectos que sean relativamente simples y de bajo riesgo, como contar y clasificar la cantidad de interacciones por agente del cliente, como correos electrónicos y sesiones de chat.

  • Algunas otras aplicaciones de datos reales incluyen escanear los weblogs en busca de errores o monitorear los canales de redes sociales en busca de la opinión de la marca.
  • También puede practicar con datos de muestra de sitios como https://www.kaggle.com/datasets o
Practica Hadoop Online Paso 10
Practica Hadoop Online Paso 10

Paso 3. Verifique regularmente su código con pequeños subconjuntos para resolver cualquier error

Antes de ejecutar todo el conjunto de datos, tome un conjunto de datos de prueba más pequeño en su máquina local y ejecútelo a través de varios modos diferentes. Por ejemplo, puede ejecutarlo iterativamente a través del modo Jobrunner local, luego el modo pseudodistribuido y luego el modo completamente distribuido.

  • Esto le permitirá reconocer cualquier defecto o error antes de que se amplifique en el conjunto de datos completo.
  • El modo Jobrunner local le permite probar y depurar localmente su código Map and Reduce, el modo pseudodistribuido imita el entorno de producción y el modo totalmente distribuido analiza su clúster de producción real.
Practica Hadoop Online Paso 11
Practica Hadoop Online Paso 11

Paso 4. Utilice una prueba gratuita de 1 año para practicar en un entorno de máquina virtual

Empresas como Amazon y Microsoft ofrecen suscripciones pagas para sus servicios de práctica de Hadoop. La máquina virtual de Amazon se llama Amazon Web Service (AWS) y el servicio de Microsoft se llama Microsoft Azure. Para ambos servicios, su primer año es gratis cuando ingresa la información de su tarjeta de crédito.

No olvide cancelar la suscripción después de 1 año para evitar que se le cobre

Consejos

  • Tenga en cuenta que Hadoop es un lenguaje de programación más especializado y de uso limitado. Sin duda, le dará una ventaja en el mundo de los macrodatos, pero no siempre es necesario convertirse en programador.
  • También puede leer libros y artículos sobre Hadoop, como Hadoop: The Definitive Guide, 3rd Edition de Tom White.

Recomendado: