Une vidéo tutorial français sur ce que c'est Apache Hadoop, son utilisation et c'est quoi Hadoop HDFS (Hadoop Distributed File System).
âś… Suivez la formation Big Data avec Apache Spark :
â–¶ https://bit.ly/2ANYwoU
âž–âž–âž–âž–âž–âž–âž–
# C'est quoi Hadoop ?
Hadoop est un framework libre et open source écrit en Java destiné à faciliter la création d'applications distribuées (au niveau du stockage des données et de leur traitement) et échelonnables (scalables) permettant aux applications de travailler avec des milliers de nœuds et des pétaoctets de données. Ainsi chaque nœud est constitué de machines standard regroupées en grappe. Tous les modules de Hadoop sont conçus dans l'idée fondamentale que les pannes matérielles sont fréquentes et qu'en conséquence elles doivent être gérées automatiquement par le framework.
# C’est quoi le Big Data ?
Le big Data signifie mégadonnées, grosses données ou encore données massives. Il désigne un ensemble très volumineux de données qu’aucun outil classique de gestion de base de données ou de gestion de l’information ne peut vraiment travailler.
En effet, nous procréons environ 2,5 trillions d’octets de données tous les jours. Ce sont les informations provenant de partout : messages que nous nous envoyons, vidéos que nous publions, informations climatiques, signaux GPS, enregistrements transactionnels d’achats en ligne et bien d’autres encore.
Ces données sont baptisées Big Data ou volumes massifs de données. Les géants du Web, au premier rang desquels Yahoo (mais aussi Facebook et Google), ont été les tous premiers à déployer ce type de technologie.
# C'est quoi Apache Spark ?
Spark est actuellement le projet open source le plus actif sous la plate-forme Apache Software Foundation (ASF). Il est aussi l'un des projets open source de big data le plus actif.
Spark permet aux développeurs de créer un traitement de données complexe en plusieurs étapes routines, fournissant une API de haut niveau et un cadre tolérant aux pannes qui permet aux programmeurs à se concentrer sur la logique plutôt que sur les problèmes d'infrastructure ou d'environnement comme une défaillance matérielle par exemple.
# Qu'est ce que vous allez apprendre dans cette formation Big Data avec Apache Spark ?
Dans cette formation vous allez vous familiariser avec les principes fondamentaux de Spark en utilisant le langage Scala. Spark est écrit en Scala. Il fonctionne en Java virtuel machines (JVM).
Vous allez maitriser l’utilisation MapReduce avec Spark qui est une alternative à l'utilisation traditionnelle MapReduce sur Hadoop.
L’utilisation de MapReduce avec Hadoop a été jugé inadaptée aux requêtes interactives ou temps réel, avec une faible latence applications. Un inconvénient majeur de l'implémentation MapReduce de Hadoop était sa persistance des données intermédiaires sur le disque entre le Map et le Reduce en phases de traitement.
Dans cette formation vous allez apprendre à implémenter une structure distribuée, tolérante aux pannes et in-memory appelée Resilient Distributed Dataset (RDD). Vous allez également apprendre à traiter les données non structurées.
Dans le chapitre de Spark SQL les notions des DataFrame et DataSet ne seront plus un secret pour vous.
Vous avez surement entendu parler du traitement des données qui arrivent en temps réel, ce qu’on appelle le Streaming. Un chapitre bien détaillé vous attend afin que vous puissiez monter en compétence rapidement avec Spark Streaming.
âž–âž–âž–âž–âž–âž–âž–
Abonnez-vous à notre chaîne :
â–¶ https://www.youtube.com/alphorm?sub_confirmation=1
âž–âž–âž–âž–âž–âž–âž–
✳️ Le plan de la formation Big Data avec Apache Spark :
01. Introduction de la formation
02. Le Big Data
03. Apache Hadoop
04. Apache Spark
05. Scala avec Apache Spark
06. RDD - Resilient Distributed Dataset
07. Spark SQL
08. Spark Streaming
09. Conclusion
âś… Suivez la formation Big Data avec Apache Spark :
â–¶ https://bit.ly/2UYIlMw
âž–âž–âž–âž–âž–âž–âž–
Playlist des vidéos gratuites de la formation Big Data avec Apache Spark :
â–¶ https://www.youtube.com/playlist?list=PL1aYsXmhJ1Wf1B6Zm8SpK863jH0jiqytB
âž–âž–âž–âž–âž–âž–âž–
🔵 Restez connecté-e :
Alphorm Formations â–¶ https://bit.ly/2UZLs6W
YouTube â–¶ https://www.youtube.com/alphorm?sub_confirmation=1
LinkedIn â–¶ https://www.linkedin.com/company/alphorm
Twitter â–¶ https://twitter.com/alphorm
Facebook â–¶ https://www.facebook.com/Alphorm.Officiel
#BigData #Hadoop #HadoopHDFS