R Statistics

Por: Ricardo Dortas Schönhofen

Introdução

R é um ambiente de computação especializado em computação estatística e gráfica. O seu código de linguagem de programação é aberto. A força do R está na análise preditiva e na visualização de dados. R pode rodar em plataformas Linux, Unix, Windows e MacOS.

Você pode baixar o R através desse link: http://cran.r-project.org/mirrors.html.

História

R foi lançado inicialmente em 1995. Seu objetivo era permitir que pesquisadores com base estatística pudessem executar análises estatísticas complexas e ao mesmo tempo mostrar os resultados visualmente através de uma maior amplitude de gráficos.

O nome R vem dos nomes dos dois desenvolvedores: Ross Ihaka e Robert Gentleman.

Linguagem

A linguagem de programação R inclui funções que permitem modelagens lineares e não-linerares, classificações, clusterizações, estatística clássica, etc. A robustez das funcionalidades aliada à gratuidade fez com que o R se tornasse muito popular no meio acadêmico. Gradualmente, o R tem se tornado mais popular também no meio empresarial, onde começa a competir com softwares distribuídos comercialmente.

Ambiente de desenvolvimento

O ambiente de desenvolvimento do R funciona com uma interface padrão de linha e comando. A interface permite carregar e ler dados na área de trabalho, especificar comandos e receber resultados. Os comandos podem ser simples operadores matemáticos, incluindo +, -, * e /, como também funções mais avançadas que executam regressões lineares e outros cálculos.

Os usuários também podem escrever suas próprias funções. O ambiente permite combinar operações individuais como juntar arquivos de dados separados em um único documento, extrair uma única variável e executar uma regressão no conjunto de dados resultante. Isso pode ser feito em uma única função a ser usada repetidamente.

Pros e contras do R

O download e o uso são gratuitos. Essa é uma enorme vantagem quando se compara com outros pacotes que são pagos. Os recursos de análise de dados oferecidos são muito sofisticados. Há muitas funcionalidades construídas para estatísticos e permite também que se construam ferramentas e métodos próprios para analisar dados. Tem uma comunidade ativa de usuários on-line, a qual presta muito apoio e suporte. Já é uma linguagem bastante madura. Pode-se fazer o download de pacotes add-on que melhoram a funcionalidade básica do idioma. Esses pacotes permitem aos usuários visualizar dados, conectar-se a bancos de dados externos, mapear dados geograficamente e executar funções estatísticas avançadas. A visualização de dados através de gráficos é uma das melhores. A interface de usuário chamada RStudio simplifica a codificação na linguagem R.

A linguagem R tem sido criticada por fornecer análises lentas quando aplicada a grandes conjuntos de dados. Isso ocorre porque a linguagem utiliza o processamento de thread único, o que significa que a versão básica de código aberto só pode utilizar uma CPU de cada vez.

Além das limitações de processamento single-threaded, o ambiente de programação R é um aplicativo na memória. Todos os objetos de dados são armazenados na RAM de uma máquina durante uma determinada sessão. Isso pode limitar a quantidade de dados com que o R é capaz de trabalhar simultaneamente.


Veja também:


1 comentário em “R Statistics”

Deixe uma resposta