Ciência e Dados
Menu
  • Home
  • Sobre
  • Contato
Menu
Uma Breve Introdução ao R

Uma Breve Introdução ao R

Posted on 26 de setembro de 201527 de dezembro de 2017 by David Matos

R é uma linguagem de programação de computadores, que é usada para manipulação de dados estatísticos e gráficos. A linguagem R é amplamente utilizada entre os estatísticos e mineradores de dados para o desenvolvimento de software estatístico e análise de dados. Pesquisas recentes mostram que a popularidade do R tem aumentado substancialmente nos últimos anos.

História

R é uma implementação da linguagem de programação S combinada com a semântica de escopo léxico e Schemas. S foi criado por John Chambers, na Bell Labs. Existem algumas diferenças importantes, mas a maior parte do código escrito para S funciona inalterado.

R foi criado por Ross Ihaka e Robert Gentleman na Universidade de Auckland, Nova Zelândia, e atualmente é desenvolvido pela equipe de Desenvolvimento do R, da qual John  Chambers é um membro. O código fonte para o ambiente de software R é escrito principalmente em C, Fortran e R. R está disponível gratuitamente sob a licença GNU General Public e em vários sistemas operacionais como MAC, Windows e Linux. R usa uma interface de linha de comando, mas há também vários front-ends gráficos para ele, como RStudio.

Principais características

  • Fornece acesso completo aos algoritmos e sua implementação
  • Fornece um fórum permitindo aos pesquisadores explorar e expandir os métodos utilizados para analisar dados.
  • É o produto de trabalho de mais de 1000 especialistas nas áreas de estatística e análise de dados.
  • Permite que Cientistas de todo o mundo – e não apenas os dos países ricos – possam ter acesso as ferramentas de software necessárias para realizar pesquisas.
  • Promove a investigação reprodutível (código criados como funções, podem ser reproduzidos), fornecendo ferramentas abertas e acessíveis
  • As funções do R são escritas em … R! Isto permite verificar facilmente o que as funções realmente fazem.

Vantagens e Desvantagens

Vantagens

Desvantagens

Rápido e gratuito Curva de aprendizagem significativa
Pesquisadores de Estatística fornecem os seus métodos em pacotes de R Não há suporte comercial
Nos gráficos perde apenas para o Matlab Trabalhando com grandes conjuntos de dados é limitada pela RAM
Comunidade de usuários ativos Fácil cometer erros se não conhecer bem a linguagem
Excelente para a simulação, programação, análises intensivas de computador, etc.

 

Preparação e limpeza de dados pode ser mais confusa e mais propenso erro em R que em soluções proprietárias como SPSS ou SAS
Interfaces com software de armazenamento de banco de dados (SQL) Descobrir que métodos utilizar ou como usar uma função pode ser frustrante.

Por que aprender R?

R está se tornando a língua padrão para a ciência de dados. Isso não quer dizer que é a única linguagem ou que é a melhor ferramenta para cada trabalho. É, no entanto, a mais amplamente utilizada e está aumentando em popularidade.

A O’Reilly Media realizou uma pesquisa em 2014 para entender as ferramentas que os cientistas de dados estão usando atualmente. Eles descobriram que R é a linguagem de programação mais popular (se você excluir SQL como linguagem de programação).

Olhando de forma mais ampla, existem outros rankings que olham para a popularidade das linguagens de programação em geral (não apenas entre os cientistas de dados). Por exemplo, Redmonk mede a popularidade de linguagens de programação através da análise de fóruns de discussão (Stack Overflow) e uso (no GitHub). Em seus últimos rankings, R está colocado em 13°, o mais alto de qualquer linguagem de programação estatística. O Redmonk também observou que R tem aumentado significativamente em popularidade ao longo do tempo.

Aprendendo R

Algumas boas fontes oficiais para aprender o R:

R Mailing Lists

R-bloggers

CRAN

Rseek (use o Rseek ao invés do Google para buscas relacionadas ao R)

Swirl

Por fim:

  • Conheça as classes e seus objetos
  • Como R é interativo, os erros são seus amigos!
  • MAIS IMPORTANTE – quanto mais tempo você usar R, mais confortável e confiante você se tornará. Depois de fazer seu primeiro projeto real no R, você não vai olhar para trás. Eu prometo.

David Matos

Relacionado

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Assinar blog por e-mail

Digite seu endereço de e-mail para assinar este blog e receber notificações de novas publicações por e-mail.

Buscar

Twitter

Meus Tuítes

Tags Mais Comuns nos Posts

Anaconda Analytics Análise de Negócios Apache Spark AWS Big Data Blockchain Business Intelligence ChatGPT Chief Data Officer Cientista de Dados Cientistas de Dados Ciência de Dados Cloud Computing Data Lake Data Mesh Data Science Data Scientist Data Warehouse Deep Learning Deploy Descriptive Analytics Diagnostic Analytics Engenharia de Dados Engenheiro de Dados Estatística GPU Hadoop Inteligência Artificial Internet of Things Linguagem Python Linguagem R Machine Learning MapReduce Metadados NoSQL NVIDIA Open Data Oracle Predictive Analytics Prescriptive Analytics Probabilidade Python Salários Data Science Visualização

Histórico de Posts

  • março 2023 (3)
  • fevereiro 2023 (3)
  • janeiro 2023 (5)
  • dezembro 2022 (8)
  • novembro 2022 (7)
  • outubro 2022 (2)
  • setembro 2022 (3)
  • agosto 2022 (2)
  • julho 2022 (2)
  • junho 2022 (3)
  • maio 2022 (1)
  • abril 2022 (3)
  • março 2022 (1)
  • fevereiro 2022 (3)
  • janeiro 2022 (2)
  • dezembro 2021 (1)
  • novembro 2021 (5)
  • outubro 2021 (2)
  • setembro 2021 (3)
  • agosto 2021 (1)
  • junho 2021 (1)
  • fevereiro 2021 (2)
  • janeiro 2021 (1)
  • dezembro 2020 (1)
  • novembro 2020 (1)
  • outubro 2020 (2)
  • agosto 2020 (1)
  • abril 2020 (1)
  • março 2020 (1)
  • fevereiro 2020 (2)
  • agosto 2019 (1)
  • abril 2019 (1)
  • setembro 2018 (2)
  • julho 2018 (1)
  • junho 2018 (3)
  • abril 2018 (1)
  • março 2018 (1)
  • fevereiro 2018 (2)
  • janeiro 2018 (1)
  • dezembro 2017 (1)
  • novembro 2017 (1)
  • outubro 2017 (1)
  • setembro 2017 (1)
  • julho 2017 (1)
  • junho 2017 (1)
  • maio 2017 (2)
  • abril 2017 (1)
  • janeiro 2017 (1)
  • novembro 2016 (1)
  • outubro 2016 (1)
  • setembro 2016 (1)
  • julho 2016 (1)
  • junho 2016 (1)
  • maio 2016 (1)
  • abril 2016 (1)
  • fevereiro 2016 (1)
  • janeiro 2016 (3)
  • dezembro 2015 (4)
  • novembro 2015 (6)
  • outubro 2015 (9)
  • setembro 2015 (9)
  • agosto 2015 (9)
©2022 Ciência e Dados