Ciência e Dados
Menu
  • Home
  • Sobre
  • Contato
Menu
Uma Breve Introdução ao R

Por quê escolher R?

Posted on 28 de setembro de 201527 de dezembro de 2017 by David Matos

R faz estatísticas. Você pode vê-lo como um concorrente de sistemas analíticos como SAS Analytics, para não mencionar os pacotes mais simples como StatSoft ou Minitab. Muitos estatísticos profissionais, sejam do governo, nos negócios ou na indústria farmacêutica passam suas carreiras usando IBM SPSS ou SAS sem escrever uma linha de código R. Por isso, em parte, a decisão de aprender e de usar R é uma questão de cultura corporativa e como você prefere trabalhar. Eu uso várias ferramentas como Cientista de Dados, mas a maioria do que eu faço é feito em R. Estes exemplos mostram o porquê:

  • R é uma linguagem de script poderosa. R é uma linguagem de script poderosa com acesso a a expressões regulares para a manipulação de texto. Dados não-estruturados exigem os recursos de uma linguagem de programação e, embora SAS e SPSS tenham linguagens de script para tarefas que vão além do menu, R foi escrito como uma linguagem de programação e assim é uma ferramenta melhor para essa finalidade.
  • R está liderando o caminho. Muitos novos desenvolvimentos na área de estatística, aparecem primeiro como pacotes R antes de seguirem seu caminho em plataformas comerciais.
  • Integração com a publicação do documento. R integra-se facilmente com o sistema de publicação de documentos LaTeX, o que significa que os resultados estatísticos e gráficos a partir de R podem ser incorporados em documentos com qualidade de publicação. Isto não é para todos, mas se você quer escrever um livro sobre as suas análises de dados ou simplesmente não gosta de copiar seus resultados em um documento de processamento de texto, o caminho mais curto e mais elegante encontra-se através de R e LaTeX.
  • Sem custo. R é gratuito. Mesmo para uma grande empresa, é bom saber que você pode utilizar uma solução de análise de dados totalmente gratuita e de tecnologia de ponta.

R já está no século 21

Abordagem exploratória para análise de dados tornou-se norma em projetos de dados. R apoia esta abordagem, o que pode explicar por que ele é tão popular. Orientação a objetos também ajuda R a se manter como uma linguagem atual. A solução IBM InfoSphere® Streams agora suporta R analytics para dados que são diferentes dos previstos por John Chambers (criador da linguagem). Muitos gigantes da tecnologia estão prestando cada vez mais atenção ao R.

O que R não faz bem

Para ser justo, há algumas coisas que R não faz bem. R pode não ser a melhor opção para todos os usuários:

  • R não é um repositório de dados. A maneira mais fácil de inserir dados em R é inseri-los em outro lugar e em seguida importá-los para R. Esforços têm sido feitos para adicionar uma planilha de front-end para R, mas não avançaram. Não só a ausência de um recurso de planilha afeta a entrada de dados, mas também é difícil inspecionar visualmente dados no R, como você pode fazer em SPSS ou Excel.
  • R torna as tarefas comuns difíceis. Na pesquisa médica, por exemplo, a primeira coisa que você faz com os dados é calcular estatísticas de resumo para todas as variáveis, enquanto listando a ocorrência de não-resposta e falta de dados. Este é um processo de três cliques em SPSS, mas R não tem nenhuma função “built-in” para calcular esta informação bastante óbvia e exibi-la em forma de tabela. Você poderia escrever algo com bastante facilidade, mas às vezes você só quer apontar e clicar.
  • A curva de aprendizagem para R não é trivial. Um novato pode abrir uma plataforma estatística baseada em menus e obter resultados em minutos. Nem todo mundo quer se tornar um programador para ser um analista e talvez nem todo mundo precise.
  • R é open source. A comunidade R é grande, madura e ativa e R é certamente um dos mais bem sucedidos projetos de código aberto. Este é um conceito comprovado e um produto de qualidade comprovada. Mas com qualquer produto de código aberto, a confiabilidade depende de transparência. Nós acreditamos no código porque podemos verificá-lo nós mesmos e porque outras pessoas podem verificá-lo e relatar erros. Este não é o mesmo como um projeto empresarial que se encarrega de avaliar e validar seu software. E no caso de pacotes R menos utilizados, você não tem nenhuma razão para supor que eles realmente produzem resultados corretos.

Conclusão

Preciso aprender R? Talvez não; necessidade é uma palavra forte. R é uma valiosa ferramenta para análise de dados? Certamente. A linguagem foi concebida para refletir a maneira que os estatísticos pensam e trabalham. R reforça bons hábitos de análise. Para mim, é a ferramenta certa para o trabalho.

David Matos

Relacionado

1 thought on “Por quê escolher R?”

  1. Pingback: R ou Python para Análise de Dados? – Data Analisando

Deixe um comentário Cancelar resposta

O seu endereço de e-mail não será publicado. Campos obrigatórios são marcados com *

Assinar blog por e-mail

Digite seu endereço de e-mail para assinar este blog e receber notificações de novas publicações por e-mail.

Buscar

Tags Mais Comuns nos Posts

Agentes de IA Analytics Análise de Negócios Apache Spark AWS Big Data Blockchain Business Intelligence ChatGPT Cientista de Dados Cientistas de Dados Ciência de Dados Cloud Computing Data Lake Data Mesh Data Science Data Scientist Data Warehouse Deep Learning Deploy Engenharia de Dados Estatística GPU GraphRAG Hadoop IA Generativa Inteligência Artificial Internet of Things Linguagem Python Linguagem R LLM LLMs Machine Learning MCP (Model Context Protocol) Metadados Normalização NVIDIA Oracle Pipeline de Dados Predictive Analytics Probabilidade PySpark Python RAG Storytelling

Histórico de Posts

  • maio 2025 (6)
  • abril 2025 (2)
  • março 2025 (4)
  • fevereiro 2025 (8)
  • janeiro 2025 (5)
  • dezembro 2024 (4)
  • novembro 2024 (1)
  • outubro 2024 (1)
  • setembro 2024 (1)
  • agosto 2024 (1)
  • julho 2024 (3)
  • junho 2024 (1)
  • maio 2024 (1)
  • abril 2024 (2)
  • março 2024 (1)
  • fevereiro 2024 (1)
  • janeiro 2024 (1)
  • dezembro 2023 (1)
  • outubro 2023 (2)
  • setembro 2023 (1)
  • agosto 2023 (4)
  • julho 2023 (2)
  • junho 2023 (4)
  • maio 2023 (2)
  • abril 2023 (2)
  • março 2023 (3)
  • fevereiro 2023 (3)
  • janeiro 2023 (3)
  • dezembro 2022 (7)
  • novembro 2022 (6)
  • outubro 2022 (2)
  • setembro 2022 (3)
  • agosto 2022 (2)
  • julho 2022 (2)
  • junho 2022 (3)
  • maio 2022 (1)
  • abril 2022 (3)
  • março 2022 (1)
  • fevereiro 2022 (3)
  • janeiro 2022 (2)
  • dezembro 2021 (1)
  • novembro 2021 (5)
  • outubro 2021 (2)
  • setembro 2021 (3)
  • agosto 2021 (1)
  • junho 2021 (1)
  • fevereiro 2021 (2)
  • janeiro 2021 (1)
  • dezembro 2020 (1)
  • novembro 2020 (1)
  • outubro 2020 (2)
  • agosto 2020 (1)
  • abril 2020 (1)
  • março 2020 (1)
  • fevereiro 2020 (2)
  • agosto 2019 (1)
  • abril 2019 (1)
  • setembro 2018 (2)
  • julho 2018 (1)
  • junho 2018 (3)
  • abril 2018 (1)
  • março 2018 (1)
  • fevereiro 2018 (2)
  • janeiro 2018 (1)
  • dezembro 2017 (1)
  • novembro 2017 (1)
  • outubro 2017 (1)
  • setembro 2017 (1)
  • julho 2017 (1)
  • junho 2017 (1)
  • maio 2017 (2)
  • abril 2017 (1)
  • janeiro 2017 (1)
  • novembro 2016 (1)
  • outubro 2016 (1)
  • setembro 2016 (1)
  • julho 2016 (1)
  • junho 2016 (1)
  • maio 2016 (1)
  • abril 2016 (1)
  • fevereiro 2016 (1)
  • janeiro 2016 (3)
  • dezembro 2015 (4)
  • novembro 2015 (6)
  • outubro 2015 (9)
  • setembro 2015 (9)
  • agosto 2015 (9)
©2025 Ciência e Dados