Informática EmÁudio: Tecnologias - Parte 3
Bom dia! Boa tarde! Boa noite! Beleza, meu povo?
Lembra que eu falei que existiam duas principais tecnologias de Big Data atualmente? Já aprendemos sobre a NoSQL. Hora de falar sobre o Hadoop.
O Hadoop é uma plataforma para desenvolvimento de soluções voltadas para Big Data. Nesta plataforma, é possível criar uma estrutura para armazenamento e processamento de sistemas com Big Data.
Para desenvolver essas soluções, é preciso ter escalabilidade, horizontal, processamento paralelo, possibilidade de espalhar o poder de processamento, confiabilidade, flexibilidade, um sistema flexível, e baixo custo. Se custar uma fortuna, pode ser inviável economicamente.
No Hadoop, utilizam-se vários módulos, mas os principais são o HDFS, Hadoop File System, e o MapReduce.
O HDFS é um sistema de armazenamento de arquivos voltado para os sistemas distribuídos por todo o mundo. Sim, é um sistema de armazenamento tipo NTFS e FAT32. Ele foi originado no Google File System e tem como principal premissa atender aos três Vs principais do Big Data, volume, velocidade e variedade.
O principal foco do HDFS reside no armazenamento distribuído de arquivos muito grandes. Por exemplo, um vídeo de uma hora, filmado em resolução 4K, possui um tam... Ler mais