AVALIAÇÃO DE PLATAFORMA DE SISTEMA DE ARQUIVOS DISTRIBUÍDOS EM CLUSTER

Gledson de Oliveira

Resumo


Análise de sentimentos (Ou também, opinion mining, ) é um campo da ciência que
estuda a opinião, o comportamento, o sentimento dentre outros aspectos que as pessoas
utilizam na comunicação, por exemplo (BARBOSA, 2012). Estudo de sentimentos
sobre as informações publicadas no twitter tem sido amplamente explorados e aplicados
na detecção de características, como determinar se um comentario foi positivo ou
negativo e podem ser utilizadas para fins estratégicos em áreas comerciais, políticas,
dentre outras (BARBOSA, 2012).
Entretanto, esta única rede social tem gerado diariamente uma maciça
quantidade de dados, o que torna o trabalho dos engenheiros e cientistas de criar formas
eficientes de armazenar, processar e recuperar informação, um grande desafio.
Ainda que um sistema de cluster demonstre ser uma boa alternativa para dar
suporte ao processamento de grandes quantidades de informação, os tradicionais
modelos de armazenamento de arquivos, baseados em um sistema Cliente-Servidor,
demonstra ser eficiente apenas em clusters de baixa escala, já que a medida que o
número de computadores acoplados ao sistema aumenta, é criado uma vazão de
requisições para acesso a informações grande o suficiente para comprometer o
desempenho do sistema (KUSZERA, 2010) . Ou seja, aplicações paralelas intensivas em
dados, sob um sistema de clusters de grande porte apresentam limitações de
desempenho, ao mesmo tempo que geram baixa escalabilidade e throughput.
Uma alternativa que surgiu para tratar os problemas citados acima foi a
utilização de sistemas de arquivos distribuídos. Neste modelo, os arquivos que
armazenam os dados são divididos entre os nós do cluster, possibilitando o acesso em
paralelo de diferentes partes de um mesmo arquivo. Esta estratégia permite aumentar a
vazão de dados ao mesmo tempo que promove ampliação da escalabilidade do sistema
(KUSZERA, 2010) . Entretanto, a complexidade desta arquitetura gera um maior grau de
dificuldade para instalação, configuração e gerenciamento do sistema como um todo,
dificultando a produção neste ambiente de trabalho (KUSZERA, 2010) .
Nesse sentido, este trabalho objetiva investigar sistemas de arquivos distribuídos
que permitam da suporte ao a trabalhos que demandam uso de uma quantidade maciça
de dados, como o de análise de sentimentos, visando compreender melhor seu
funcionamento e arquitetura.


Texto completo:

PDF

Apontamentos

  • Não há apontamentos.