TABWIN - Tab para Windows

Biblioteca de esquemas de análise com R

Atualizado em 21/07/2005

Clique aqui para baixar um arquivo ZIP com todos os esquemas de análise descritos abaixo.

Clique aqui para saber como usar estes esquemas de análise no TabWin.

TítuloAutorVersãoCódigo fonte
Análise de tabelas 2 x 2Ernani B Bandarra e Oswaldo G Cruz 1.0Ver
Cálculo de percentagens, risco relativo, odds ratio e qui-quadrado e gráficos para tabelas 2x2.
Analise exploratória das colunasOswaldo G Cruz 1.0Ver
Esta rotina de análise exploratória das colunas gera, para cada coluna do quadro ativo, um histograma, um box plot, um qq.plot normal além do sumário relativo aos dados.
Assim é possível avaliar se os dados seguem uma distribuição normal.
Para isso também é gerado um teste de Shapiro.
Calculo do Odds RatioOswaldo G Cruz 1.0Ver
Este script calcula o odds ratio e seu intervalo de confiançade 95%
para uma tabela 2x2.

A funçao foi baseada em uma de autoria de Frank Harrell
http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/RS
Carrega dados do SPSSErnani Bandarra 1.0Ver
Este esquema carrega no TabWin dados salvos pelo SPSS no formato .SAV.
Destina-se a demonstrar a forma de transferir um "data-frame" do R para o quadro do TabWin.
CorrelaçãoErnani Bandarra 1.0Ver
Correlação permite ver a interação entre duas variáveis.
O coeficiente de correlação varia de -1 a +1.
Coeficientes próximos de zero indicam que as variáveis não tem dependência.
Coeficientes negativos indicam que uma variável cresce quando a outra diminue.
Este esquema calcula uma matriz de coeficientes de correlação entre as colunas selecionadas e faz um gráfico da dispersão conjunta (ScatterPlot) dos valores das colunas tomadas duas a duas.
Observe o uso do parâmetro "colsel" para permitir ao usuário escolher as colunas.
Demo de carga do TabWinErnani Bandarra 1.0Ver
Transfere dados do R para o quadro do TabWin.
Trata-se de um exemplo simples para demonstrar o processo de transferir um
"data-frame" do R para o quadro do TabWin através da função
"carrega.tabwin()".
Estatísticas para tabelas 2 x 2Ernani Bandarra 1.0Ver
Gráfico de setoresErnani Bandarra 1.0Ver
Gera um gráfico de setores para cada coluna selecionada.
Gráficos de RamosOswaldo G Cruz 1.0Ver
Executa gráfico do tipo Stem das colunas do Quadro.
Este tipo de grafico, feito somente com caracteres na janela de texto, nos permite ter uma visão inicial da distribuição dos dados da coluna.
HistogramaErnani Bandarra 1.0Ver
Plota um histograma para cada uma das colunas selecionadas.
Histogramas nos permitem verificar a distribuição dos valores de uma variável.
Importação de mapa do TabWinErnani Bandarra 1.1Ver
Importa um mapa do TabWin dentro do ambiente do R, e salva a "polylist" resultante no formato que o R pode carregar com o comando "load()". A polylist criada pode ser plotada com a função "plot.polylist()" da biblioteca "maptools" que é usada neste esquema para plotar um exemplo do mapa importado.
O nome do arquivo criado tem o mesmo nome do mapa do tabwin com a extensão ".mapR".
Para fazer este esquema funcionar corretamente é necessário ter um arquivo .map associado ao quadro corrente.
Para associar um arquivo .map a um quadro do TabWin basta haver plotado o mapa uma vez com as informações do quadro.
Observe a função "read.map" que está definida no esquema já que ela pode ser copiada para outros esquemas de análise onde for necessário ler arquivos ".map" do TabWin bem como pode ser modificada para atender a necessidade de ter os dados em outros formatos específicos.
A capacidade do TabWin importar bases cartográficas em vários formatos, e a grande potencia de análise espacial do R potencializa o poder das duas ferramentas, resultando em uma associação poderosa para análise espacial.
Kernel de pontos 2DErnani Bandarra 1.0Ver
Demo de utilização do Kernel em duas dimensões da biblioteca "splancs".

O esquema espera as coordenadas dos pontos nas colunas de nome de X e Y no quadro do TabWin.

Será necessário fornecer também o nome do arquivo que contém a poligonal que delimita a área de aplicação do Kernel. Este arquivo texto, com extensão .BNA, deve conter uma linha para cada par de coordenadas do polígono sendo que X separado de Y por uma virgula. A primeira linha do arquivo, normalmente contendo cabeçalho, é desprezada.

Este esquema precisa da biblioteca "splancs" instalada no seu computador. Entre no R interativo e clique no menu "Packages" para buscar e instalar esta biblioteca.
Palheta de CoresOswaldo 1.0Ver
Cria gráficos com várias palhetas de cor.
Demonstra a fexibilidade do R na geração de gráficos.
Pirâmide EtáriaKarla Ferreira 1.0Ver
Essa rotina plota uma apresentação gráfica denominada pirâmide etária. Os dados devem estar organizados de modo a conter nas colunas a variável sexo, e nas linhas a variável faixa etária, conforme os agrupamentos tradicionalmente utilizados em análises demográficas.
A função utilizada é de autoria de Juan Carlos Correa y Nelfi González, disponível em http://cran.r-project.org/other-docs.html no material intitulado "Gráficos Estadísticos con R".

A coluna contendo os dados referentes ao sexo masculino deve ser a primeira coluna do quadro.
Plota duas colunasErnani Bandarra 1.0Ver
Gera um gráfico de dispersão que mostra a distribuição conjunta das informações de duas colunas do quadro atual.

O usuário escolhe as colunas a serem plotadas.
Regressão Linear IIOswaldo G Cruz 1.1Ver
Regressão Linear revista para incluir tratamento de erros na fórmula fornecida pelo usuário.
Regressão LinearOswaldo G Cruz 1.0Ver
....
Descrição e notas técnicas sobre o esquema de análise.
....
Série histórica anualOswaldo G Cruz 1.03Ver
Gera gráficos das séries históricas e gráficos da função de autocorrelaçao (ACF)
As colunas devem ser Regiões, Estados, Municipios etc..., e as linhas os Anos. Pode ser facilmente tabulado a partir do TabWin ou do TabNet.
Lembre-se que muitas linhas tornará difícil a vizualização.

Teoria:
Dados ordenados no tempo são denominado séries temporais e, quando analisadas,podem mostrar importantes informações acerca do processo endêmico-epidêmico, entre as quais: a verificação de existência de tendências, ciclos e variações sazonais e a detecção de mudanças no comportamento da doença

A função de autocorrelação (ACF), é uma das principais ferramentas de análise exploratória das séries temporais, ela indica o grau de dependência temporal existente.

A ACF não possui dimensão, variando entre -1 e +1. Nela o coeficiente de correlação r mede o quanto os pares ordenados de observações (Zt+k, Zt ) estão relacionados.

Classifica-se a dependência quanto à:

Sem dependência serial: série puramente aleatória.
Memória longa: a dependência desaparece lentamente (os valores de pontos no passado influenciam momentos muito adiante no tempo - ex, doenças com grande latência)
Memória curta: dependência desaparece rapidamente (doenças de alta infecciosidade e "explosivas" - gripe, por ex.)

Bibliografia:
Morettin, P.A. & Toloi, C.M.C. (1987) Previsão de Séries Temporais. Atual Editora, 2ª Edição
Diggle, P. (1990) Time Series : A Biostatistical Introduction. Oxford Statistical Science Series, No. 5
Sumário das colunasErnani Bandarra 1.0Ver
Fornece estatísticas de sumarização (média, mediana, quartis, mínimo e máximo) das colunas da tabela.
Permite demonstrar o poder e a simplicidade de uso do R para análise de dados já que apenas uma linha de comando "summary(tabela)" nos fornece várias informações sobre os dados das colunas.
Teste do Qui QuadradoErnani Bandarra 1.0Ver
Aplica o teste do Qui Quadrado de Pearson a uma tabela de contingência.
O teste do QuiQuadrado, que se aplica somente a tabelas nas quais a células representem freqüências, nos permite determinar a probabilidade de uma determinada combinação de freqüências ocorrer de forma aleatória, sem que haja nenhuma relação entre as categorias.