Thursday, 16 November 2017

Como Inserir Dados Em Falta No Stata Forex


AVISO: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar a manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital, ajudando o Grupo de Consultoria Estatal, dando um presente. Módulo de Aprendizagem Stata Inserindo seus dados no Stata. Este módulo irá mostrar como inserir seus dados no Stata. Isso abrange a entrada de dados com delimitados por vírgulas, delimitados por tabelas, delimitados em espaço e dados de coluna fixa. Nota . Todos os arquivos de entrada de amostra para esta página foram criados por nós e não estão incluídos no Stata. Você pode criá-los você mesmo para experimentar este código copiando e colando os dados em um arquivo de texto. 1. Digitando dados no editor Stata Um dos métodos mais fáceis para obter dados no Stata está usando o editor de dados Stata, que se assemelha a uma planilha do Excel. É útil quando seus dados estão em papel e precisam ser digitados, ou se seus dados já foram digitados em uma planilha do Excel. Para saber mais sobre o editor de dados Stata, veja o módulo de edição. 2. Arquivo separado de Commatab com nomes de variáveis ​​na linha 1 Dois formatos comuns de arquivo para dados brutos são arquivos separados por vírgulas e arquivos separados por separações. Esses arquivos geralmente são feitos a partir de programas de planilhas como o Excel. Considere o arquivo delimitado por vírgulas mostrado abaixo. Este arquivo tem duas características: - A primeira linha possui os nomes das variáveis ​​separadas por vírgulas, - As seguintes linhas possuem os valores das variáveis, também separados por vírgulas. Esse tipo de arquivo pode ser lido usando o comando da planilha, conforme mostrado abaixo. Podemos verificar se o dado veio diretamente usando o comando da lista. Como você provavelmente terá mais observações, você pode usar para listar apenas um subconjunto de observações. Abaixo, listamos as observações 1 a 3. Agora que o arquivo foi lido no Stata, você pode salvá-lo com o comando save (ignoraremos esse passo). O comando exato da planilha poderia ser usado para ler um arquivo delimitado por tabulação. O comando da planilha é inteligente porque pode descobrir se você possui um arquivo delimitado por vírgulas ou delimitado por tabulações e depois lê-lo. (No entanto, a planilha não pode lidar com um arquivo que usa uma mistura de vírgulas e guias como delimitadores.) Antes de iniciar a próxima seção, limpe os dados existentes na memória. 3. Arquivo separado do Commatab (sem nomes de variáveis ​​no arquivo) Considere um arquivo idêntico ao que examinamos na seção anterior, mas não possui os nomes das variáveis ​​na linha 1. Este arquivo pode ser lido usando o comando da planilha, como mostrado abaixo. Mas, onde a Stata obteve os nomes das variáveis ​​Se a Stata não possui nomes para as variáveis, elas as nomeam v1. V2. V3 etc., como você pode ver abaixo. Limpe os dados na memória e tente ler os dados novamente. Agora, vamos tentar ler os dados e dizer ao Stata os nomes das variáveis ​​no comando da planilha. Como o comando da lista mostra, o Stata usou os nomes das variáveis ​​fornecidos no comando da planilha. O comando da planilha funciona igualmente bem nos arquivos que usam guias como separadores. Stata examina o arquivo e determina se vírgulas ou abas estão sendo usadas como separadores e lê o arquivo adequadamente. Agora que o arquivo foi lido no Stata, você pode salvá-lo com o comando save (ignoraremos esse passo). Limpe os dados na memória antes de ir para a próxima seção. 4. Arquivo separado por espaço Considere um arquivo onde as variáveis ​​são separadas por espaços como o mostrado abaixo. Observe que a marca do carro está contida entre aspas. Isso é necessário porque os nomes contêm espaços dentro deles. Sem as citações, Stata pensaria que a AMC é a marca e a Concord é o mpg. Se a marca não tivesse espaços incorporados dentro delas, aspas não seriam necessárias. Este arquivo pode ser lido com o comando infile como mostrado abaixo. Você pode estar perguntando a si mesmo, de onde veio o str13. Uma vez que a marca é uma variável de personagem, precisamos dizer à Stata que é uma variável de personagem, e quanto tempo ela pode ser. O str13 diz a Stata que é uma variável stritch e que pode ter até 13 caracteres de largura. O comando da lista confirma que os dados foram lidos corretamente. Agora que o arquivo foi lido no Stata, você pode salvá-lo com o comando save (ignoraremos esse passo). Limpe os dados na memória antes de passar para a próxima seção. 5. Arquivo de formato fixo Considere um arquivo usando dados de coluna fixa como o mostrado abaixo. Observe que as variáveis ​​são claramente definidas por qual coluna (s) elas estão localizadas. Além disso, note que a marca do carro não está contida entre aspas. As citações não são necessárias porque as colunas definem onde a marca começa e termina, e os espaços incorporados não geram confusão. Este arquivo pode ser lido com o comando infix como mostrado abaixo. Aqui novamente, precisamos dizer a Stata que faz é uma variável de strings, fazendo antes com str. Não precisamos indicar o comprimento, uma vez que a Stata pode inferir que a marca pode ter até 13 caracteres de largura com base nas localizações das colunas. O comando da lista confirma que os dados foram lidos corretamente. Agora que o arquivo foi lido no Stata, você pode salvá-lo com o comando save (ignoraremos esse passo). Limpe os dados na memória antes de passar para a próxima seção. 6. Outros métodos de obtenção de dados no Stata Isso não abrange todos os métodos possíveis para obter dados brutos no Stata, mas cobre muitas situações comuns. Consulte o Guia do Usuário do Stata para obter informações mais abrangentes sobre a leitura de dados brutos no Stata. Outro método que deve ser mencionado é o uso de programas de conversão de dados. Esses programas podem converter dados de um formato de arquivo para outro formato de arquivo. Por exemplo, eles poderiam criar diretamente um arquivo Stata de uma planilha do Excel, uma planilha do Lotus, um banco de dados Access, um banco de dados Dbase, um arquivo de dados SAS, um arquivo do sistema SPSS, etc. Dois desses exemplos são Stat Transfer e DBMS Copy. Ambos os produtos estão disponíveis em PCs SSC e a cópia DBMS está disponível no Nicco e Aristóteles. Finalmente, se você estiver usando Nicco, Aristotle ou o RS6000 Cluster, há um comando especificamente para converter dados do SAS em Stata chamado sas2stata. Se você possui dados SAS que deseja converter para o Stata, esta pode ser uma maneira útil de obter seus dados SAS no Stata. 7. Resumo Traga o editor de dados Stata para digitar dados. Leia no arquivo delimitado por vírgulas ou tabulações chamado auto2.raw, levando os nomes das variáveis ​​da primeira linha de dados. Leia no arquivo delimitado por vírgulas ou tabulações chamado auto3.raw nomeando as variáveis ​​mpg peso e preço. Leia no arquivo separado do espaço chamado auto4.raw. A variável make é cercada por aspas porque tem espaços embutidos embutidos. Leia no arquivo de formato fixo chamado auto5.raw. Outros métodos DBMSCopy, Stat Transfer, sas2stata e Stata Guia do Usuário. O conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software da Universidade da Califórnia. NOTICE: O grupo de consultoria estatística IDRE estará migrando o site para o WordPress CMS em fevereiro para facilitar Manutenção e criação de novos conteúdos. Algumas de nossas páginas antigas serão removidas ou arquivadas de modo que elas não serão mais mantidas. Vamos tentar manter os redirecionamentos para que os URLs antigos continuem a funcionar da melhor maneira possível. Bem-vindo ao Instituto de Pesquisa e Educação Digital Ajudar o Grupo de Consultoria Estatal, dando um presente Módulo de Aprendizado STATA Dados perdidos 1. Introdução Este módulo explorará os dados faltantes no STATA, com foco em dados faltantes numéricos. Ele irá descrever como indicar a falta de dados em seus arquivos de dados brutos, bem como como dados faltantes são tratados nos comandos lógicos STATA e instruções de atribuição. Vamos ilustrar algumas das propriedades dos dados perdidos no STATA usando dados de um estudo de tempo de reação com oito assuntos indicados pelo ID da variável. E os tempos de reação dos sujeitos foram medidos em três pontos de tempo (trial1 trial2 trial3). O arquivo de dados de entrada é mostrado abaixo. Você pode notar que alguns dos tempos de reação são codificados usando um único. Como é o caso do assunto 2. A pessoa que mede o tempo para esse teste não mediu o tempo de resposta adequadamente, portanto, os dados para o segundo julgamento estão faltando. 2. Como o STATA lida com dados faltantes nos procedimentos STATA Como regra geral, os comandos STATA que executam cálculos de qualquer tipo manipulam dados ausentes, omitiendo os valores faltantes. No entanto, a forma como os valores em falta são omitidos nem sempre é consistente em todos os comandos, então, diga-nos alguns exemplos. Primeiro, let39s resumem nossas variáveis ​​de tempo de reação e veja como o STATA lida com os valores que faltam. Como você vê na saída abaixo, resuma os meios calculados usando 4 observações para trial1 e trial2 e 6 observações para trial3. Em suma, o comando de resumo executou os cálculos em todos os dados disponíveis. Um segundo exemplo, mostra como o comando tabulação ou tab1 lida com dados faltantes. Como resumir, tab1 usa apenas dados disponíveis. Observe que as porcentagens são calculadas com base no número total de casos não faltantes. É possível que você possa querer que as porcentagens sejam calculadas a partir do número total de observações, e a porcentagem em falta para cada variável mostrada na tabela. Isso pode ser alcançado incluindo a opção em falta após a tabulação. Comando, Let39s veja como o comando correlate lida com dados faltantes. Esperamos que ele execute os cálculos com base nos dados disponíveis e omita os valores em falta. Aqui está um exemplo de comando. A saída é mostrada abaixo. Observe como os valores em falta foram excluídos. O Stata executará a exclusão da lista e exibirá apenas a correlação para as observações que tenham valores não faltantes em todas as variáveis ​​listadas. A Stata também permite a eliminação em pares. As correlações são exibidas para as observações que possuem valores não faltantes para cada par de variáveis. Isso pode ser feito usando o comando pwcorr. Usamos a opção obs para exibir o número de observação usado para cada par, como você pode ver, eles diferem dependendo da quantidade de falta. 3. Resumo de como os valores faltantes são tratados nos procedimentos STATA resumem. Para cada variável, o número de valores não faltantes é usado. Tabulação Por padrão, os valores em falta são excluídos e as porcentagens são baseadas no número de valores não faltantes. Se você usar a opção perdida no comando tab, as porcentagens são baseadas no número total de observações (não faltando e faltando) e a porcentagem de valores faltantes é relatada na tabela. Corrente Por padrão, as correlações são calculadas com base no número de pares com dados não faltantes (emparelhamento de dados faltantes). O comando pwcorr pode ser usado para solicitar que as correlações sejam computadas apenas para observações que tenham dados não faltantes para todas as variáveis ​​listadas após o comando pwcorr (eliminação de dados faltantes). Reg Se alguma das variáveis ​​listadas após o comando reg estiver faltando, as observações que faltam esse (s) valor (es) são excluídas da análise (ou seja, a eliminação de dados faltantes). Para outros procedimentos, consulte o manual STATA para obter informações sobre como os dados faltantes são tratados. 4. Valores faltantes nas declarações de atribuição É importante entender como os valores em falta são tratados nas declarações de atribuição. Considere o exemplo mostrado abaixo. O comando da lista a seguir ilustra como valores faltantes são tratados nas instruções de atribuição. A variável sum1 é baseada nas variáveis ​​trial1 trial2 e trial3. Se alguma dessas variáveis ​​estivesse faltando, o valor para sum1 estava configurado como ausente. Portanto, o sum1 está faltando para as observações 2, 3 e 4, como é o caso da observação 7. Como regra geral, os cálculos envolvendo valores faltantes produzem valores faltantes. Por exemplo, 2 2 produz 4 2. rendimentos . 2 2 produz 1. 2 rendimentos. 2 3 produz 6 2. rendimentos . Sempre que você adicionar, subtrair, multiplicar, dividir, etc. valores que envolvem dados em falta, o resultado está faltando. Em nosso experimento de tempo de reação, o tempo de reação total sum1 está faltando para quatro dos sete casos. Poderíamos tentar totalizar os dados para os testes não faltantes, usando a função rowtotal como mostrado no exemplo abaixo. Os resultados abaixo mostram que sum2 agora contém a soma dos ensaios não faltantes. Observe que a função rowtotal trata faltando como um valor zero. Ao somar várias variáveis, pode não ser razoável tratar falta como zero se faltarem observações em todas as variáveis ​​a serem somadas. A função rowtotal com a opção ausente retornará um valor faltante se falta uma observação em todas as variáveis. Outras declarações funcionam de forma semelhante. Por exemplo, observou o que aconteceu quando tentamos criar uma variável média sem usar uma função (como no exemplo abaixo). Se alguma das variáveis ​​trial1, trial2 ou trial3 estiver faltando, o valor para avg1 está definido como ausente. Alternativamente, a função rowmean calcula a média dos dados para os testes que não faltam da mesma maneira que a função rowtotal. Nota: Houve um grande número de testes, digamos 50 tentativas, então seria irritante ter que digitar avgrowmean (trial1 trial2 trial3 trial4.). Aqui está um atalho que você pode usar neste tipo de situação: Finalmente, você pode usar as funções rowmiss e rownomiss para determinar o número de falta e o número de valores não faltantes, respectivamente, em uma lista de variáveis. Isso é ilustrado abaixo. Para nomiss variável. As observações 1, 5 e 6 tinham três valores válidos, as observações 2 e 3 tinham dois valores válidos, a observação 4 tinha apenas um valor válido e a observação 7 não tinha valores válidos. A variável miss mostra o contrário, fornece uma contagem do número de valores em falta. 5. Valores em falta em declarações lógicas É importante entender como os valores faltantes são tratados em declarações lógicas. Por exemplo, diga que deseja criar uma variável 01 para trial1 que seja 1 se for 1.5 ou menos e 0 se for superior a 1.5. Mostramos isso abaixo (incorretamente, como você verá). Parece que algo deu errado com a nossa nova variável new-new1 recentemente criada. As observações com valores faltantes para trial2 receberam um zero para newvar1. Vamos explorar por que isso aconteceu olhando a tabela de freqüência do teste2. Como você pode ver na saída, os valores em falta estão listados após o valor mais alto 2.1. Isso ocorre porque STATA trata um valor faltante como o maior valor possível (por exemplo, infinito positivo) e esse valor é maior do que 2.1, então os valores para Newvar1 torna-se 0. Agora que entendemos como o STATA trata os valores faltantes, excluiremos explicitamente os valores em falta para garantir que eles sejam tratados corretamente, conforme mostrado abaixo. Como você pode ver na saída STATA abaixo, a nova variável newvar2 tem valores faltantes para observações que também estão faltando para trial2. 6. Valores em falta em declarações lógicas Ao criar ou recodificar variáveis ​​que envolvem valores em falta, sempre preste atenção se a variável inclui valores faltantes. 7. Para obter mais informações, o conteúdo deste site não deve ser interpretado como um endosso de qualquer site, livro ou produto de software específico da Universidade da Califórnia.

No comments:

Post a Comment