Recomendado, 2024

Escolha dos editores

1010Data fica sabendo sobre o R

1010data - An Analyst's Tale

1010data - An Analyst's Tale
Anonim

A linguagem de programação R continua permear o ambiente de big data. O provedor de plataformas de análise de dados 1010data adicionou R ao seu arsenal, permitindo que seus muitos clientes empresariais questionassem seus dados com a linguagem de programação orientada por estatísticas.

“Sabemos que muitos cientistas e modeladores de dados cresceram usando R, e esse é o ambiente com o qual se sentem confortáveis ​​”, disse Jed Alpert, vice-presidente de marketing da 1010data. “Eles constroem modelos de dados em R e, em seguida, têm o poder de nossa plataforma para executar a análise em todos os dados.”

Fundado em 2010, o 1010data fornece às organizações um conjunto de serviços para analisar grandes conjuntos de dados, eliminando a necessidade para configurar sistemas para fazer o trabalho em casa

Com a nova opção de usar a linguagem R, as organizações não precisarão treinar seus cientistas de dados na própria linguagem de consulta do 1010data. Como outros serviços 1010data, R pode ser acessado através de um navegador.

O novo serviço também beneficiará usuários de longa data do R que desejam usar o idioma para investigar conjuntos de dados maiores, algo que tem sido bastante difícil até recentemente. A implementação de estoque de R é um aplicativo de encadeamento único, o que significa que ele não pode ser usado com eficácia em conjuntos de dados distribuídos em vários servidores. Para o serviço, o 1010data desenvolveu seu próprio software para executar o R ​​contra conjuntos de dados grandes e distribuídos.

Com milhões de usuários em todo o mundo, o R é uma das linguagens de programação mais usadas especificamente projetadas para computação estatística e análise preditiva, juntamente com SAS MatLab, Mathematica e várias bibliotecas Python. Sua popularidade cresceu à medida que mais organizações realizam análises de big data para aprender mais sobre seus clientes e melhorar as operações. “O R é muito bom em permitir que os usuários modifiquem diferentes métodos de análise estatística para atender suas necessidades”, disse Chris Simon, 1010data analista sênior

Várias outras empresas também recentemente estenderam o R para uso de big data. A Hewlett-Packard criou o Distributed R, um pacote de software livre para executar a linguagem nos clusters de computadores. A Microsoft, que recentemente comprou o distribuidor Revolution Analytics, oferece a linguagem R como uma interface para seu serviço de nuvem de aprendizado de máquina.

Mais de 700 organizações usam 1010data, incluindo muitas grandes empresas nos setores de varejo, manufatura, telecomunicações e financeiro. Serviços. O 1010data, baseado em Nova York, mantém mais de 19 trilhões de linhas de dados em nome desses clientes.

Top