Home
Análisis de los datos mediante herramientas gráficas
Contents
1. 5 La informaci n presentada a trav s de una herramienta gr fica no tiene por qu repetirse detalladamente en el texto 6 La informaci n que muestra la herra mienta gr fica debe comprenderse sin necesidad de acudir al texto 4 7 Los gr ficos en tercera dimensi n solo tienen sentido cuando la informaci n as lo requiere En publicaciones y pre sentaciones cient ficas debe primar lo sobrio sobre lo decorativo En el presente art culo se exponen los aspectos referentes a las herramientas gr ficas como elementos imprescindi bles del an lisis de datos Su utilizaci n para publicaci n o difusi n de resulta dos ser objeto de una entrega poste rior Las tablas En general son herramientras gr ficas que trabajan con datos categ ricos de tipo nominal u ordinal La forma y estructura de una tabla de pende del n mero de variables que quie ra mostrar Cuando se maneja una sola variable se habla de distribuci n univariada o de frecuencia simple Cuando la tabla cruza dos variables se est trabajando una distribuci n bivariada Si la tabla maneja m s de dos variables se habla de distribuci n SANCHEZ R C CERES H multivariada 2 Entre m s variables sean introducidas en una tabla m s compleja resulta su construcci n lec tura e interpretaci n Tablas para distribuciones univariadas La estructura t pica de estas tablas es la siguiente Droga Frec Acumulado droga 1 15 25 86 25 86
2. 42 43 43 50 52 Se puede tomar como rama el prime ro de los d gitos de cada n mero De tal manera puede armarse una rama con el n mero 1 primer d gito de 10 12 12 que tendr tres hojas 0 2 2 co rrespondientes a cada uno de los d gitos que est n despu s del 1 Se efect a el mismo proceso con cada una de las ramas De esta manera el gr fico que 7 dar a 1 022 2 3448 3 0023344 4 233 5 02 Gr ficos de caja y bigote Son herramientas dise adas para explo rar variables cuantitativas La mayor a de los programas estad sticos las tie nen incorporadas dentro de sus men s La utilidad de estos gr ficos radica en que permiten evaluar la simetr a de la distribuci n el grado de dispersi n y la presencia de valores extremos Ejem plos de este gr fico son los siguientes 108 Caracter sticas de la variable Tensi n Arterial Sist lii Diferencia entre fumadores y no fumadores 180 170 160 150 140 130 o 5 F No si tension arterial sistolica Fumador Tensi n arterial sist lica 175004 150 004 125 00 4 tension arterial sistolica 100 04 Se pueden distinguir unos cuadrados oscuros cajas de los cuales salen unas l neas hacia arriba y abajo bigotes Los l mites superior e inferior de la caja es t n marcados por el percentil 25 y el 75 rango intercuart lico lo cual quie re decir que el 50 de los datos est incluido dentro de esta ca
3. En estudios dise ados para probar hip tesis las herramientas gr ficas pueden orientar al investigador para la utilizaci n de los m todos estad s ticos m s indicados 4 En algunos casos se le debe creer 104 m s al gr fico que a una prueba esta d stica como sucede en las pruebas de normalidad aplicadas a pocos da tos 5 Permiten transmitir la informaci n de una manera m s sencilla y clara lo cual es de gran importancia cuando se van a presentar los resultados a un p blico no experto En general existen dos niveles de utili zaci n de herramientas gr ficas Uno en el cual se manejan como un instrumento para efectuar an lisis de los datos y otro en el cual son un medio de transmitir la informaci n al p blico En muchas cir cunstancias las mismas herramientas gr ficas utilizadas para analizar datos tambi n se utilizan para transmitir la in formaci n al p blico En estos casos deben tenerse en cuenta las siguientes recomendaciones 1 La herramienta gr fica debe ser lo m s sencilla posible y solo debe recurrirse a ella cuando se considere que presenta los datos de una manera m s clara y precisa que el texto 2 Los datos escasos o mon tonamente reiterativos no necesitan presentarse por medio de herramientas gr ficas 3 3 La importancia de los datos no se mo difica si se a aden o no gr ficos 4 Las herramientas gr ficas que pueden reemplazarse por pocas palabras no son necesarias
4. SECCI N DE EPIDEMIOLOG A UNIVERSIDAD NACIONAL DE COLOMBIA E Revista de la Facultad de Medicina 2000 48 2 104 110 An lisis de los datos mediante herramientas gr ficas Ricardo S nchez Pedraza Profesor Asociado Centro de Epidemiolog a Cl nica Heidi Alexandra C ceres Interna Especial Centro de Epidemiolog a Cl nica Facultad de Medicina Universidad Nacional de Colombia Se consideran herramientas gr ficas aquellas estructuras de organizaci n y presentaci n de los datos que per miten un an lisis de los mismos me diante su apreciaci n en el espacio Los dos tipos de herramientas gr fi cas utilizados son las tablas y los gr ficos propiamente dichos Independientemente del tipo de ma nejo estad stico que se vaya a dar a los datos una etapa inicial que siem pre se recomienda es la de efectuar una exploraci n preliminar de la in formaci n Adem s de las estrategias presentadas en un escrito anterior 1 las herramientas gr ficas resultan de gran utilidad si consideramos las si guientes ventajas 2 1 Permiten un mejor conocimiento de los datos al hacer evidentes deter minadas particularidades o incluso incoherencias que puedan llevar a re visar su calidad o a utilizar herramien tas estad sticas espec ficas 2 En ausencia de hip tesis estudios exploratorios las herramientas gr ficas pueden sugerir preguntas de in vestigaci n para ser analizadas en es tudios posteriores 3
5. blarse estructuras tridimensionales o matri ces de dispersi n Un ejemplo de cada uno de estos casos se muestra a con tinuaci n Relaci n entre tensi n arterial edad y peso i TT yabaki Se Tas e lt Q A a gt Poy gupa gdad tension arterial sistolica Edad Peso 120 140 160 180 200 40 60 80 100 Los gr ficos de tiempo son considera dos una modalidad de gr fico de dis persi n Su particularidad radica en que una de las variables tiene una forma especial de continuidad Debido a esto al conectar los puntos con una l nea se pueden apreciar tendencias o compor tamientos particulares durante per odos espec ficos Gr ficos de estrella Son gr ficos que permiten la exploraci n visual de m ltiples variables simult nea mente No es necesario que las variables est n medidas en las mismas unidades 12 Se utilizan m s que todo para com parar observaciones Para su construc ci n se elaboran c rculos de igual tama o con un n mero determinado de ra dios igual al n mero de variables que se van a analizar que tienen una longitud igual al valor de las variables Al conectar el final de los radios se forma una estrella 10 En el ejemplo que a continuaci n se presen ta se ilustran diferentes variables relaciona das con el cumplimiento acad mico de 4 estudiantes de un curso v Lopez nane Cognoscitivo Motor Interpersonal Afectivo Cumplimiento Ramirez Cala De acuerdo con este
6. del inter valo sobre el eje x y la altura indica la frecuencia dentro de cada intervalo No se recomienda que las bases de los rec t ngulos tengan diferente tama o ya que esto dificulta la interpretaci n de los datos 6 El histograma permite de tectar valores extremos caracter sti cas de simetr a de la distribuci n o pre sencia de varias modas 7 El gr fico que se muestra a continuaci n eviden cia la utilidad de esta herramienta para explorar la simetr a de la distribuci n y la posible normalidad de una variable SANCHEZ R C CERES H Tensi n arterial sist lica Recuento 130 00 140 00 150 00 160 00 170 00 tension arterial sistolica Gr fico de puntos De manera similar al histograma pue de ser til para detectar valores extre mos simetr a o asimetr a de los datos y localizaci n de modas A diferencia del histograma el gr fico de puntos presenta los valores crudos ubicados sobre un eje continuo El siguiente gr fico corresponde a los mismos datos del histograma presentado previamen te y deja ver la presencia de un posible valor extremo Gr fico de sectores Tambi n llamados gr ficos de torta o ponqu s Estos gr ficos muestran la contribuci n de cada una de las partes a un todo siendo el tama o de cada una de las fracciones proporcional a su frecuencia Permiten analizar variables cualitativas de forma uni bi o multivariada Una manera de utilizar es tructuras d
7. droga 2 15 25 86 51 72 droga 3 12 20 69 72 41 droga 4 16 27 59 100 0 Total 58 100 00 La estructura de la tabla consiste en cuatro columnas la primera Droga usada corresponde al valor o nombre que toma la variable en esa categor a la segunda Frecuencia al n mero de observaciones que quedan ubicadas en cada categor a la tercera al por centaje que se ubica en las diferentes categor as y la cuarta Acumulado suma consecutivamente del primero al ltimo los porcentajes de la columna anterior La informaci n previa presen tada en forma de texto probablemente habr a sido m s dif cil de evaluar e in terpretar La presentaci n gr fica me diante tabla para distribuci n univariada facilita y agiliza el an lisis de esta in formaci n Tablas para distribuciones bivariadas Tablas cruzadas de dos variables Tienen la siguiente estructura Severidad del cuadro Droga Usada Leve Moderado Severo Total droga 1 6 4 5 15 droga 2 5 4 6 15 droga 3 3 5 4 12 droga 4 5 6 5 16 Total 19 19 20 58 Este tipo de tablas cruza dos variables categ ricas Como puede observarse existe una fila y una columna ocupada por totales que se denominan Totales Marginales Estos totales marginales in forman sobre la cantidad de observa ciones que se encuentran en cada uno de los niveles de las variables que se est n cruzando El cruce de una fila y una columna corresponde al n mero de observaciones casos pacientes que
8. e Gr fico de Sectores para an lisis bivariado y multivariado ser a la siguiente Frecuencia de consumo de cigarrillo seg n estado civil Soltero Uni n libre 36 36 38 46 37 50 Los sectores muestran porcentajes Casado 62 50 Este gr fico presenta informaci n simult nea de dos variables H bito de fumar y Estado civil A medida que se introducen m s variables en el procedimiento gr fico se hace m s dif cil el an lisis tal como se muestra en el gr fico de sectores multivariado que incorpora 3 variables H bito de fumar sexo y procedencia masculino femenino Frecuencia de consumo de cigarrillo seg n sexo y procedencia Estado Civil H Sotero W Uni n ibre E Casado Los sectores muestran porcentajes f No se debe perder de vista que la herramienta gr fica busca facilitar en lugar de complicar el an lisis de los datos 107 SECCI N DE EPIDEMIOLOG A Gr ficos de rama y hoja Son herramientas gr ficas de gran uti lidad ya que tienen las mismas aplica ciones que los histogramas pero con las siguientes ventajas adicionales Preserva los valores de los datos es decir al observar el gr fico pueden ubicarse los diferentes valores de las observaciones Es f cil de construir Permite el c lculo de la mediana y el rango Para explicar su construcci n consi d rese el siguiente conjunto de datos 10 12 12 23 24 24 28 30 30 32 33 33 34 34
9. ediante perfiles fila es complementaria con la interpretaci n mediante perfiles columna Tablas para distribuciones multivariadas Permiten el an lisis de m s de dos variables simult neamente Para incorporar m s de tres variables en este tipo de estructura existen recursos como las tablas con capas que ofrecen algunos programas estad sticos 5 La estructura m s simple separa los niveles de alguna de las variables en varias tablas tal como se muestra a continuaci n 105 SECCI N DE EPIDEMIOLOG A gt sexo Mujeres Severidad del cuadro Droga Usada Leve Moderado Severo Total droga 1 4 3 3 10 droga 2 3 2 5 10 droga 3 2 3 2 7 droga 4 3 4 1 8 Total 12 12 11 35 gt sexo Hombres Severidad del cuadro Droga Usada Leve Moderado Severo Total droga 1 2 dh 2 5 droga 2 2 2 1 5 droga 3 1 2 2 5 droga 4 2 2 4 8 Total 7 i 9 23 Igual que en el caso de tablas cruzadas de dos variables puede facilitarse la interpretaci n con el an lisis respectivo de los perfiles fila y columna Los gr ficos Al igual que las tablas los gr ficos pueden utilizarse para an lisis univariados bivariados o multivariados Permiten analizar m s f cilmente la informaci n de variables cuantitativas que las tablas Las herramientas gr ficas de uso m s fre cuente en investigaci n cl nica se resumen en la tabla 1 Multivariados Variable Variable cualitativa cuantitativa Bivariados Variable cualitativa Variable cuantitativa Va
10. ero C Herrera N S nchez R Conceptos b sicos de Bioestad stica Revista de la Facultad de Medicina Universidad Nacional de Colombia 1999 47 4 232 236 2 Bocquier P L essentiel de STATA Paris Ritme Informatique 1998 p 91 145 3 Day R A C mo escribir y publicar trabajos cient ficos Washington Organizaci n Panamericana de la Salud 1996 p 65 78 4 Squires BP Illustrative material What editors and readers expect from authors Canadian Medical Association Journal 1990 142 5 447 449 5 SPSS 9 0 Manual del usuario Shouth en investigaci n cl nica constituyen un recurso muy valioso que ofrece gran des posibilidades Dado el nivel de de sarrollo de los programas estad sticos se tiene al alcance la posibilidad de efec tuar an lisis visuales complejos y de muy buena calidad tarea que hasta hace alg n tiempo era pr cticamente impo sible El an lisis de los datos mediante herramientas gr ficas supone no solo una t cnica sino una actitud en la cual la ausencia de prejuicios la curiosidad REFERENCIAS BIBLIOGR FICAS Wacker SPSS Inc 1999 p173 206 6 Rosner B Fundamentals of Biostatistics 4th ed Belmont Duxbury Press 1995 p 29 30 7 SPSS 9 0 Gr ficos Interactivos Shouth Wacker SPSS Inc 1999 p 103 106 8 Velleman PF Hoaglin DC Applications basics and computing of exploratory data analysis Belmont Duxbury Press 1981 p 65 71 9 Tabachnick BG Fidell LS Using Multivar
11. gr fico el estudiante Cala tiene un perfil de desempe o m s ho mog neo mientras que L pez y Triana solo muestran buenas habilidades en pocas reas Existe una variedad de este tipo de gr fico conocida como Metroglifo en el cual los radios salen de una circunferencia peque a y se dirigen todos en la misma direcci n su interpretaci n se hace de la misma manera que con los gr ficos de estrella Rostros de Chernoff Teniendo en cuenta que las personas reac cionan ante las expresiones faciales Chernoff propuso hacer representaciones multivariadas aprovechando las caracter s ticas del rostro De tal manera diferentes atributos como el tama o de la cabeza la longitud de la nariz la forma de la boca etc podr an representar a diferentes variables 10 13 Un ejemplo de Rostros de Chernoff se muestra a continuaci n Ingresos Mortalidad Gastos 4 Apacientes SL Infecciones Hospital 1 Hospital 2 Hospital 3 109 SECCI N DE EPIDEMIOLOG A Puede verse que en el Hospital 1 hay menores ingresos cabeza m s peque a mayores gastos ojos m s gran des poco n mero de pacientes nariz m s corta y problema de infecciones boca de aspecto triste Teniendo en cuenta estos par metros puede anali zarse con una r pida inspecci n visual la situaci n de los tres hospitales Como se ha visto las herramientas gr ficas utilizadas para el an lisis de datos 1 Quint
12. iate Statistics 3rd ed New York Harper Collins College Publishers 1996 p 73 75 10 Jonson RA Wichern DW Applied Multivariate Statistical analysis 4 th ed Rev Fac Med UN Col 2000 Vol 48N 2 y la creatividad son elementos funda mentales 14 Resumen En el presente art culo se presentan las principales herramientas gr ficas para analizar datos de investigaci n cl nica Se muestran ejemplos de cada uno de los gr ficos junto con los comentarios referentes a sus indicaciones construc ci n e interpretaci n New Jersey Prentice Hall 1998 p 19 24 11 Rencher AC Methods of multivariate analysis New York John Wiley amp Sons 1995 p 57 59 12 Hamilton LC Statistics with STATA 5 Pacific Grove Duxbury Press 1998 p 78 81 13 Gnanadesikan R Methods for statistical data an lisis of multivariate observations 2nd ed New York John Wiley amp Sons 1997 p 62 67 14 Ladiray D Horber E Presentaci n de la metodolog a del an lisis exploratorio de datos Santaf de Bogot Programme PRESTA 1999 Nota Tomado del libro Estrategias de Investigaci n Medica Cl nica E Ardila Sanchez J Echeverry Eds en prensa 110
13. ja La raya que divide a la caja en dos es la mediana Si la distribuci n es sim trica la mediana estar aproximadamente en el centro de la caja Cada uno de los bigotes mide 1 5 rangos intercuart licos 8 Son ti les porque los valores que queden m s all del l mite del bigote pueden consi derarse valores perif ricos o extremos Tales valores est n representados en la gr fica por puntos globulina plasmatica Peso en gramos Rev Fac Med UN Col 2000 Vol 48 N 2 Gr ficos cuantil cuantil Son herramientas utilizadas para eva luar caracter sticas distribucionales de una variable especialmente cuando es tas son de tipo continuo Es un m to do de aplicaci n fundamentalmente univariado Estos gr ficos comparan una distribuci n esperada que es cal culada por una funci n matem tica de terminada con la distribuci n obser vada que es la que muestran los datos Si la distribuci n de los datos se pare ce mucho a la distribuci n te rica es perada los puntos deber n situarse muy cercanamente a una l nea recta 9 Grid lines are 5 10 25 50 75 90 and 95 percentiles 26 0041 35 7 45 3959 45 4 4 4 4 45 35 30 i t F 26 5 25 25 30 35 40 45 Inverse Normal Grid lines are 5 10 25 50 75 90 and 95 percentiles 1745 52 2944 66 4143 79 6000 4000 2000 1000 2000 3000 Inverse Normal 4000 5000 En el primer gr fico los puntos se encuen tran ale
14. jados de la recta Esto hace suponer que en este caso los datos no tengan dis tribuci n normal En el segundo gr fico los puntos se encuentran muy cercanos a la recta lo que hace pensar que esta variable tiene distribuci n normal 3997 2977 F 1790 SANCHEZ R C CERES H Gr ficos de dispersi n Son utilizados con mucha frecuencia para an lisis bivariados donde las ob servaciones est n representadas simul t neamente en un punto como una co ordenada en un plano cartesiano Es tos gr ficos son tiles en el an lisis exploratorio de datos para detectar los valores extremos 10 y para explorar y describir la tendencia general de dos variables correlacionadas 11 pues muestran nubes de puntos en las cua les puede observarse f cilmente la re laci n entre las variables y la cercan a o lejan a de unos puntos a otros Relaci n entre tensi n arterial y peso 180 160 o o tension arterial sistolica 120 4 T T 50 00 60 00 70 00 80 00 90 00 peso El gr fico anterior muestra una clara relaci n entre las dos variables a me dida que aumenta el peso se incrementa la tensi n arterial sist lica Se puede ver tambi n que existe una observaci n re saltada que se aparta de la tendencia general de los otros datos Este tipo de gr ficos suele ser el primer paso antes del desarrollo de modelos de regresi n Para el an lisis multivariado con gr fi cos de dispersi n pueden ensam
15. riable cuantitativa Variable cualitativa HE Histograma x K Xx De puntos De sectores x x Rama y hoja X X ja y bigote X X De dispersi n ooo o x x De estrellas X Rostros de Chernoff x X Gr fico de barras Representa una variable que se divide en categor as discretas permitiendo visualizar f cilmente la distribuci n de las observaciones en las diferentes categor as Cada categor a corresponde a un rect ngulo con una base de tama o constante y altura proporcional a la frecuencia en ese grupo Generalmente los rect ngulos est n separados y a igual distancia uno de otro Dentro de un an lisis bivariado las barras pueden subdividirse de acuerdo con otras variables de agrupaci n o ubi carse en un espacio tridimensional para efectuar an lisis multivariados Algunos ejemplos de gr ficos de barras para an lisis univariado y bivariado se muestran a continuaci n 106 Recuento Rev Fac Med UN Col 2000 Vol 48N 2 Frecuencia de fumadores 17 9 17 9 m 16 d Frecuencia Fumador Frecuencia de fumadores seg n sexo masculino femenino HFenenno W Mascuino Las barras muestran frecuencias Fumador Histograma Muestra c mo se distribuyen los valo res de una variable cuantitativa cuando sta se divide en intervalos uniformes Los rect ngulos del histograma no se encuentran espaciados Su posici n corresponde a la localizaci n
16. tienen simult neamente dos niveles de me dici n de diferentes variables En el presente ejemplo hubo 3 pacientes que pre sentaban cuadro leve y recibieron la droga 3 Para complementar la informaci n y facilitar la interpretaci n se suele incluir el c lculo de porcentajes de la siguien te manera Severidad del cuadro Droga Usada Leve Moderado Severo Total droga 1 6 4 5 15 40 00 26 67 33 33 100 00 droga 2 5 4 6 15 33 33 26 67 40 00 100 00 droga 3 3 5 4 12 25 00 41 67 33 33 100 00 droga 4 5 6 5 16 31 25 37 50 34 25 100 00 Total 19 19 20 58 32 76 32 76 34 48 100 00 Se puede ver que el 40 de los pacientes que recibieron la droga 1 presentaron cuadros leves o que el 37 5 de los que recibieron la droga 4 presentaron cua dros moderados etc Esta forma de interpretaci n de la tabla corresponde a una estructura de Perfil Fila Tambi n podr a generarse una estructura de Perfil Co lumna como en el siguiente caso Severidad del cuadro Droga Usada Leve Moderado Severo Total ERA IAS ER e A e droga 1 6 4 5 15 31 58 21 05 25 00 25 86 droga 2 5 4 6 15 26 32 21 05 30 00 25 86 droga 3 12 15 79 26 32 20 00 20 69 droga 6 5 16 126 32 31 58 25 00 27 59 Total 19 19 20 58 100 00 100 00 100 00 100 00 Con esta estructura es evidente que el 25 de los pacientes con cuadros severos recibieron la droga 1 que el 15 79 de los cuadros leves fueron manejados con la droga 3 etc Obviamente la interpretaci n de la tabla m
Download Pdf Manuals
Related Search
Related Contents
Kompernass KH 6502 DVD Player User Manual Kramer Electronics BC-2S 300m V7 Projector Lamp for selected projectors by MITSUBISHI Impressora HP Color LaserJet Série CP1510 Spectrafuge Mini Centrifuge Origin Storage 36GB 15K SAS Hot Swap Server Drive Boutique en ligne Mode d`emploi Copyright © All rights reserved.
Failed to retrieve file