0

A IMPORTÂNCIA DO ELEFANTE

Maycon Batestin
Maycon Batestin

O Hadoop está evoluindo como a melhor abordagem para a análise de Big Data. Desenvolvido a partir do projeto de busca de web de código aberto, o Hadoop é uma estrutura de software que fornece um modelo de programação simples para permitir processamento distribuído de grandes conjuntos de dados em clusters de computadores. A estrutura é de fácil escalabilidade em hardware como os servidores baseados nos processadores

O software Hadoop é uma estrutura completa de código aberto para análise de Big Data. Ele inclui um sistema de arquivos distribuídos, uma estrutura de processamento paralelo chamada Apache Hadoop MapReduce e vários componentes de apoio à ingestão de dados, coordenação de fluxos de trabalho, gestão de trabalho e monitoramento dos clusters. O Hadoop tem melhor custo-benefício no manejo de grandes conjuntos de dados não estruturados na comparação com abordagens tradicionais.

O Hadoop oferece varias vantagens chave para análise de Big Data,

entre elas:

• Armazenamento de qualquer dado em formato nativo.

Como os dados não requerem uma proposta de Tag de acordo

com um esquema específico, nenhuma informação é perdida.

• Escala para Big Data. A capacidade de operação em escala do

Hadoop já foi comprovada por empresas como Facebook e Yahoo!,

que executam enormes implementações

• Entrega de novos insights. A análise de Big Data está

descobrindo relações escondidas que eram difíceis, demoradas e

caras – ou até mesmo impossíveis – de identificar utilizando as

abordagens de data mining tradicionais.

• Redução de custos. O software de código aberto Hadoop

opera em servidores padrão e tem custo mais baixo por terabyte

para armazenagem e processamento. O armazenamento pode

ser agregado em incrementos conforme necessário, e o hardware

pode ser acrescentado ou trocado dentro ou fora do cluster.

• Maior disponibilidade. O Hadoop se recupera após falhas de

hardware, software ou sistema fornecendo tolerância a falhas

através da replicação de dados e failover através de nós de

computação.

• Menor risco. A comunidade Hadoop é ativa e diversa, com

desenvolvedores e usuários de muitos setores ao redor do mundo.

A tecnologia Hadoop vai continuar avançando


0
0

Comentários (1)

0
Raquel Toussaint

Raquel Toussaint

27/06/2021 23:57

Gostei do artigo. Explicou em linhas gerais o conceito e a importância do hadoop para big data.

None

Brasil