A linguagem R pode ser uma forte aliada em qualquer produção acadêmica, uma vez que provê recursos para execução desde um simples teste de hipóteses até os mais sofisticados modelos estatísticos e de aprendizado de máquina.
De forma resumida, um problema de otimização é quando desejamos encontrar um conjunto de valores, dentro de um espaço restrito, com o objetivo de minimizar ou maximizar uma função. Quando o problema de otimização possui função objetivo e restrições lineares, temos um problema de Programação Linear.
Ao longo da minha carreira na área de dados eu posso afirmar que tenho menos “horas de vôo” em Python do que em R, no entanto, buscando equilibrar estas habilidades, há algum tempo venho me forçando realizar em Python atividades que tenho maior fluência executando em R.
O Pyomo é um pacote baseado em Python para formulação, resolução e análise de modelos de otimização. Um modelo escrito em Pyomo pode ser resolvido através de diversos solvers, entre eles CPLEX, Gurobi e GLPK.
O Kaggle, de forma resumida, é uma plataforma que hospeda competições de ciência de dados, famosa entre profissionais e entusiastas da área. Entre as diversas competições disponíveis ao público, o desafio do Titanic provavelmente seja o mais popular entre os iniciantes no mundo dos dados.
Um dia desses um colega me perguntou como criar uma função summary() personalizada, com algumas medidas a mais. Disse que havia tentado, mas tinha dúvidas de como passar o nome das variáveis do data frame como argumento da função.
Com o Rmarkdown podemos elaborar relatórios e slides com facilidade e muita qualidade, mas há momentos que precisamos levar os visuais criados no R para um documento externo. Já tive a necessidade, por exemplo, de gerar alguns gráficos para serem incluídos no informativo interno de uma empresa que eu trabalhei e o requisito era que estes gráficos estivessem em alta resolução.
Em consequência da espécie de lavagem cerebral que sofri durante as aulas de Programção Orientada a Objetos na graduação, hoje, por mais que eu nunca tenha atuado profissionalmente como desenvolvedor de sistemas, fico muito incomodado ao repetir trechos de código durante as minhas análises e por isso desenvolvi o hábito de criar funções para tudo no R, com o simples intuito de não redigir mais de uma vez determinados trechos de código.
A linguagem R possui excelentes recursos para uma boa análise descritiva, principalmente quando o assunto é visualização de dados. No entanto, a necessidade de digitar algumas linhas de código para conseguir plotar determinado gráfico pode complicar o trabalho de quem ainda não tem tanta fluência com a linguagem, pois convenhamos que interromper toda hora a nossa linha de raciocínio para pesquisar “como fazer” atrapalha um pouco.
Há alguns dias, atuando em um projeto em R, necessitei de um recurso que eu estava mais habituado utilizar em Python, então decidi pesquisar como chamar um script.py no meu projeto.