Informática EmÁudio: Resumão sobre Inteligência Artificial e Big Data - Parte 2
E aí, jovem, beleza? Hora de revisar as técnicas de Big Data. Então, meu amigo, preste bastante atenção a partir de agora, pois revisaremos o NoSQL e o Hadoop, duas das principais tecnologias de Big Data atualmente.
NoSQL é um termo que designa tecnologias de bancos de dados não relacionais, que não conseguem um esquema definido. Logo, não respeita as chamadas propriedades ACID, Atomicidade, Consistência, Isolamento e Durabilidade, ao passo que segue as propriedades BASE, que dizem que um sistema deve estar basicamente disponível, em um estado leve e com consistência eventual.
Além disso, o NoSQL respeita também o teorema CAP, que traz as regras de consistência, disponibilidade e tolerância a partições.
Contudo, a regra é que duas dessas propriedades devem estar funcionando, porém nunca as três ao mesmo tempo, pois conflitam entre si.
Os sistemas de NoSQL distribuídos devem ter escalabilidade horizontal e vertical, possibilidade de crescimento quando necessário, seja em quantidade de máquinas, horizontal ou processamento vertical, disponibilidade, replicação, capacidade de replicar algo para outras máquinas, e consistência eventual, havendo tolerância a falhas.
Para sua implementação, existem algumas tecnologias, como chave-valor, documentos, família de colunas e grafos.
Calma, não precisa se desesperar, vou explicar um por um. Chave-valor.
Em uma tabela relacional, tudo é bem separado e organizado, não havendo tolerância quanto às informações a serem preenchidas. Por exemplo, em uma tabela de projetos que contém as colunas Códigos, Setor e Responsável, na coluna Códigos só se aceitam os códigos, na coluna Setor só se aceitam os nomes dos setores, e na coluna Responsável só se aceita o nome do responsável.
Já no NoSQL, em um modelo baseado na técnica chave-valor, há maior fl... Ler mais