Abstract:
O crescente avanço do desenvolvimento da tecnologia e o consequente aumento da utilização das
chamadas mídias sociais contribuem para uma ampla produção de dados na Web. Visto que os
usuários da Internet utilizam tais mídias sociais como meio de divulgação para criar, compartilhar
e expressar suas opiniões referentes a determinados produtos e/ou serviços, estas tornaram-se
fonte valiosa de informação para as organizações. A partir da identificação de padrões de
sentimentos por meio do emprego de técnicas computacionais aplicadas sobre o conteúdo, as
organizações dispõem de uma oportunidade de investigar a opinião dos seus consumidores sobre
sua marca e principalmente utilizar as métricas geradas como guia para tomadas de decisões
futuras mais assertivas. Diante desse cenário, o presente trabalho apresenta a aplicação de
técnicas e ferramentas da área de Processamento de Linguagem Natural (PLN) para extrair
significado de textos publicados dentro da rede social Twitter. Baseou-se em técnicas de
mineração de texto para executar o processo de extração de dados, juntamente com a prática do
tratamento dos mesmos e por fim, a exploração de algoritmos de classificação de sentimentos,
capazes de avaliar a polaridade dos textos Ao final desse processo, por meio da solução de
Business Intelligence construída, apresentou-se a avaliação dos resultados, referente aos valores
extraídos da análise de sentimentos do estudo de caso realizado. Neste caso, o produto escolhido
foi o sistema operacional mobile Android 10. Obteve-se, a partir dos testes com a biblioteca
Pattern utilizada em PLN, um nível de acurácia de 85% para o modelo de classificação de
polaridade utilizado. Por fim, os resultados retornados a partir da análise de sentimento da
opinião dos consumidores do Android 10 revelam um sentimento majoritariamente positivo do
público em relação ao produto, visto que, dos tweets classificados, mais de 75% foram
considerados positivos pelo modelo de classificação adotado. Ademais, são demonstradas com
detalhamento as ferramentas que auxiliaram o desenvolvimento desta técnica através da
utilização da linguagem de programação Python, bem como as bibliotecas empregadas para
análise de dados.