Home
Red Bayesiana a partir de factores de riesgo de la Hipertensión
Contents
1. Pan D PAM Y 100 00 Estado 0 Estado 0 Estado 1 Estado 1 Estado 2 Estado 2 Estado 3 Estado 3 Estado 4 Estado 4 Estado 5 Estado 5 BB BB 46 995 Estado 0 24 77 Estado 0 51 01 Estado 1 75 23 Estado 1 C_HDL 4 C_HDL 40 023 Estado O 46 42 Estado 0 59 98 Estado 1l 53 58 Estado 1 4 CT c_T 69 945 Estado 0 41 07 Estado 0 30 06 Estado 1 58 93 Estado 1 Fig 3 Caso de un paciente normotenso Fig 4 Caso de un paciente Hipertenso Conclusiones Se consideran resultados del trabajo la red bayesiana obtenida y los distintos an lisis que se pueden hacer con respecto al estudio realizado haciendo uso de la misma El ejemplo de la RB garantiza caracterizar pacientes con distintos valores de la PAM as como ver como se comportan los distintos factores de riesgo que forman parte de la RB Bibliograf a 1 Baldi P Brunak S Assessing the accuracy of prediction Algorithms for classification An Overview Bioinformatics Vol 16 No 5 pages 412 424 2000 2 Barash Y Friedman N Context Specific Bayesian Clsutering for gene expression Data Annual Conference on Research in Computational Molecular Biology Pages 12 21 ISBN 1 58113 353 7 2001 3 Brazma A Jonassen l Context especific independence in Bayesian networks Inc Proc Twelfth Conference on Uncertainty in Artificial Intelligence pages 115 123 1996 4 Castillo Enrique Guti rrez J Manuel Hadi Ali S Expert Systems and Probabilistics Net
2. todo para obtener la topolog a de una red bayesiana la cual utiliza la t cnica del CHAID Chi squared Automatic Interaction Detector como herramienta intermedia y va construyendo rboles de decisi n que muestran las dependencias entre dichas variables Se demuestra como se integran estos rboles para formar la topolog a de la red bayesiana Para completar el modelo probabil stico que conforma la red se calculan las probabilidades condicionales con ayuda de los paquetes SPSS y Mathematica 5 6 Desarrollo Redes de Creencia o Bayesianas Este tipo de redes se define como un grafo que cumple lo siguiente Los nodos de la red est n formados por un conjunto de variables aleatorias que denotamos con la letra X o con sub ndices X4 X2 Xn En principio estas variables pueden ser rasgos pero puede ocurrir tambi n que un mismo rasgo tenga que ser descompuesto en varias variables aleatorias Por ejemplo si el rasgo es multivaluado y se desean las variables aleatorias dicot micas Cada par de nodos se conecta entre s mediante un conjunto de enlaces o flechas El significado de una flecha que vaya del nodo X al nodo Y es el de que X ejerce una influencia directa sobre Y en t rminos de probabilidades esto significa que hay una dependencia condicional de Y respecto a X esto es que la probabilidad de Y es diferente de la probabilidad de Y dado X Por cada nodo hay una tabla de probabilidad condicional que sirve para cuant
3. Red Bayesiana a partir de factores de riesgo de la Hipertension Arterial Autores MSc Maria del Carmen Chavez Cardenas mchavez uclv edu cu Lic Santiago Cuadrado Rodriguez santiagocr uclv edu cu Dra Gladys Casas Cardoso gladita uclv edu cu MSc Natalia Martinez Sanchez natalia ucv edu cu Universidad Central de Las Villas UCLV Santa Clara Villa Clara CUBA C P 54830 Tel 53 422 81515 Fax 53 422 81608 Resumen La hipertensi n arterial HTA es un factor de riesgo para numerosas enfermedades sin embargo ella por s misma representa una enfermedad En esta investigaci n se realizan an lisis a partir de distintos factores de riesgos y atributos que permiten caracterizar los tipos de HTA A partir de casos con su diagn stico se propone un m todo para obtener la topolog a de una red bayesiana la cual utiliza la t cnica del CHAID Chi squared Automatic Interaction Detector como herramienta intermedia y va construyendo rboles de decisi n que muestran las dependencias entre dichas variables Para completar el modelo probabil stico que conforma la red se calculan las probabilidades condicionales con ayuda de los paquetes SPSS Statistical Package for Social Science y Mathematica La red bayesiana obtenida es til para realizar tanto el diagn stico de la Hipertensi n arterial como de analizar cual ser a el comportamiento de los atributos predictores m s significativos Introducci n La hipertensi n arteria
4. abilidades Para la obtenci n de las tablas de probabilidad se propone seguir estos pasos e Calcular las probabilidades de todas las variables que son nodos en el grafo utilizando el comando FREQUENCIES del paquete estad stico SPSS previamente deben ser ponderadas las variables utilizando como pesos los valores de las tasas de la variable dependiente e Para cada nodo del grafo que tenga mas de un padre unir estas variables padres y volver al paso 4 e Una vez calculadas las distribuciones de probabilidad para las variables individuales y para las variables unidas uni n de las variables que son padres de un mismo nodo del grafo utilizar tablas de contingencia simples tabla que muestra el n mero de casos que hay en cada combinaci n de las categor as de dos variables categ ricas 7 para calcular las probabilidades condicionadas Cuando se tiene elaborado el modelo de red Bayesiana para realizar la inferencia se utilizan algoritmos para la propagaci n de evidencias en este trabajo se ha utilizado el software ByShell La variable dependiente es el diagnostico Hipertenso Hiperreactivo vascular y Normotenso La base de datos cuenta con 36 rasgos predictores divididos en factores de riesgo y atributos que representan presi n A partir de la uni n de rboles de decisi n se obtiene el modelo de RB que permite analizar en cada caso En el presente estudio se hicieron varios an lisis para estudiar las influencias de estoa atributos
5. de propagaci n exacta 4 11 Con la propagaci n sobre la red se puede analizar como ante el conocimiento de determinados factores de riesgo cual es el tipo de HTA m s probable y que efecto tiene este conocimiento respecto a otros atributos del estudio En este caso se trabajo con uno de los rboles a modo de RB en la que intervienen los atributos Presi n Arterial Media PAM Bebe BB Colesterol Total C_T Colesterol HDL C_HDL Antecedentes Patol gicos Familiares APF ndice de Masa Corporal IMC Por ejemplo si consideramos que un nuevo paciente tiene PAM menor que 93 33 el caso se identifica como normotenso con probabilidad 1 ver fig 3 si el nuevo paciente tiene PAM mayor a 119 la RB lo identifica como hipertenso con probabilidad 0 97 ver fig 4 si el nuevo paciente bebe y tiene C_T menor igual a 5 4 y C_HDL menor igual a 1 33 la RB lo identifica como normotenso con mayor probabilidad que hipertenso o hiperreactivo esto se debe a que la PAM es la que tiene una incidencia directa sobre la HTA seg n los datos basta con el conocimiento de este atributo para caracterizar la HTA en el trabajo se analizaron redes con los atributos considerados factores de riesgo solamente en estos casos se pueden hacer RB que deben caracterizar a los pacientes acorde a los mismos con mayor credibilidad HTA HTA 0 00 Hipertensa 97 00 Hipertenso 0 005 Hipereacti 3 00 Hipereacti 100 00 Normotensa 0 00 Normotensa
6. enso 100 0 250 Normotenso__0 0__0 Total 29 0 250 Node 8 Category n m Hipertenso E Normotenso 100 091 Total Category n m Hipertenso 36 2 E Normotenso 96 4 53 Total 6 4 55 00 0 10 5 91 Category n Hipertenso 85 7 24 E Normotenso 143 4 Total 3 2 28 Category n m Hipertenso 100 0 48 E Normotenso 0 0 0 Total 5 6 48 Fig 1 rbol obtenido para la PAM que es la de mayor interacci n con respecto a los tipos de HTA para el caso en que est n presentes hipertensos y normotensos Construcci n de la Red Bayesiana Los arboles obtenidos establecen una dependencia directa con respecto a la variable dependiente o tipos de HTA Con la uni n de todos los rboles creados se forma el modelo estructural de la red bayesiana n este caso se trabaja con un ejemplo en el que aparecen solamente seis atributos significativos el modelo probabil stico se construye utilizando el m todo propuesto en 7 en el cual se utiliza el SPSS como herramienta intermedia 5 Fig 2 Ejemplo de una Red Bayesiana Propagaci n sobre la red Bayesiana Se utiliz una primera versi n del sofware ByShell para propagar evidencias en redes bayesianas Este sistema tiene implementado el algoritmo de propagaci n en redes m ltiplemente conexas espec ficamente el de rboles de conglomerados el cual se reporta como uno de los menos complejos pero m s general para cualquier estructura de RB de los algoritmos
7. enso o hipereactivo se infiere a partir del valor de los atributos predictivos De los 38 atributos se mantienen en la RB solamente 20 variables significativas y sus interacciones para el caso en que se consideran los tres diagn sticos y 18 para el caso que solamente se consideran los normotensos e hipertensos El orden de significaci n de las variables en la t cnica del CHAID permite ir construyendo los rboles de decisi n Una vez que la variable pertenece al modelo en cualquiera de los rboles ya construidos no se vuelve a introducir esto permite reducir la complejidad del modelo y evitar que aparezcan ciclos no compatibles con la definici n de red bayesiana Diagn stico de expertos Node 0 Category n E Hipertenso 37 5 324 E Normotenso 62 5 539 Total 100 0 863 E Hipertenso 1 E Normotenso Presi n arterial media PAM Adj P value 0 000 Chi square 1079 027 df 3 lt 102 67 102 67 106 67 106 67 116 67 gt 116 67 Node 1 Node 2 Node 3 Node 4 Category n m Hipertenso 0 0 0 E Normotenso_100 0 391 Total 45 3 391 Adj P value 0 045 Chi square 4 013 _Categoy__ n m Hipertenso 14 2 E Normotenso 98 6 144 Total 16 9 146 Sexo df 1 _Categoy__ n m Hipertenso 94 7 72 E Normotenso 53 4 Total 8 8 76 Antecedentes Patologicos Familiares Adj P value 0 011 Chi square 8 440 df 1 A Masculino Node 5 Femenino Node 6 lt 0 gt 0 Node 7 _Category___ n m Hipert
8. ificar los efectos de los padres sobre el nodo Los padres de un nodo son aquellos nodos cuyas flechas apuntan hacia ste El grafo no tiene ciclos dirigidos por lo tanto es un grafo ac clico dirigido GAD Esto significa que no se presentan ambig edades en el encadenamiento de probabilidades condicionales por el hecho de influencias directas c clicas Vista la red de creencias como el grafo junto con las tablas de probabilidad condicional ella puede ser interpretada como una representaci n de la funci n de distribuci n de probabilidad conjunta DPC de la clase y de todos los rasgos variables El rbol en s codifica un conjunto de aseveraciones de independencia condicional Las tablas de probabilidades condicionales completan la caracterizaci n de la distribuci n conjunta El rbol es importante para construir la red en s Los valores que aparecen en las tablas de probabilidades condicionales son imprescindibles en el procedimiento de inferencia Esta representaci n es a lo que algunos autores llaman I mapa minimal de la distribuci n conjunta 4 11 Una definici n formal se puede ver en 4 En 11 se formula un algoritmo general para la construcci n de las redes de creencia Para los distintos sistemas de inferencia probabilista el objetivo principal es el c lculo de la distribuci n de probabilidad posterior de un conjunto de variables de consulta en base a determinadas variables de evidencia En 4 se hace
9. l es un factor de riesgo para las enfermedades del coraz n pero ella por si misma representa una enfermedad La Organizaci n Mundial de Salud la ha denominado epidemia silenciosa pues por lo regular se presenta de forma asintom tica ocasionando da os como trombosis hemorragias cerebrales infarto del miocardio muerte s bita insuficiencia renal entre otras En la investigaci n se realizan an lisis a partir de distintos factores de riesgos y atributos que permiten caracterizar los tipos de HTA Como parte de un proyecto de investigaci n conjunta entre la Universidad Central de Las Villas y la Universidad de Oviedo hace algunos a os se cre la Proyecci n del Centro de Desarrollo Electr nico hacia la Comunidad PROCDEC cuyo objetivo principal es desarrollar un estudio de personas supuestamente normotensas primero en la ciudad de Santa Clara y luego en toda la naci n En el desarrollo de este proyecto participa un grupo multidisciplinario formado por un psic logo un cardi logo un nefr logo un genetista tres fisi logos dos cl nicos un m dico de laboratorio dos ingenieros y dos cibern ticos Participan adem s especialistas en Medicina Integral General de los centros hospitalarios Jos Ram n Le n Chiqui G mez y Ram n Pando Ferrer Estos especialistas realizan la captura de los datos mientras el grupo multidisciplinario es quien realiza el diagn stico A partir de casos con su diagn stico se propone un m
10. referencia a distintos algoritmos para la propagaci n de evidencias actualizaci n de la distribuci n de probabilidad de las variables de acuerdo a las nuevas evidencias por ejemplo en un problema de diagn stico medico se necesita calcular la distribuci n de probabilidad de enfermedades de inter s dados los s ntomas dentro de estos algoritmos tenemos algoritmos de propagaci n exacta propagaci n de evidencia en poli rboles propagaci n de evidencias en redes m ltiplemente conectadas propagaci n usando m todos para unir rboles algoritmos de propagaci n de evidencias aproximados basados en m todos de simulaci n y algoritmos de propagaci n simb lica Se cuenta con la implementaci n del algoritmo de propagaci n Join Tree Uni n de rboles que permite realizar la inferencia en redes m ltiplemente conectadas a este software se le ha denominado ByShell este m todo de propagaci n es el que m s se ha utilizado en los distintos softwares publicos en Internet en la tem tica La propagaci n de evidencia se hace en forma eficiente combinando la informaci n proveniente de los distintos subgrafos a trav s del paso de mensajes Analizando los pasos de la ingenier a del conocimiento y el algoritmo para construir redes de creencia que se dan en 11 una vez definidas las variables que intervienen en el modelo se definen las relaciones de independencia condicional de estas variables sin embargo cuando se trabaja con los experto
11. s en ocasiones resulta dif cil responder a preguntas como qu variables est n relacionadas en qu orden est n relacionadas Una vez obtenida la topolog a de la red pudiera resultar interesante responder cu les son las tablas de probabilidades asociadas Haciendo un an lisis de estos aspectos se utiliza un m todo para construir la RB a partir de los datos M todo para construir redes de creencia Paso Obtenci n de la topolog a de la red Para obtener la arquitectura de la red aplicamos el paquete de programas CHAID El es particularmente til en todos aquellos problemas en que se quiera subdividir una poblaci n a partir de una variable dependiente y posibles variables predictoras que cambien esencialmente los valores de la variable dependiente en cada una de las subpoblaciones o segmentos 5 Desde esta formulaci n inicial se concibi la posibilidad de aplicaci n a diversos investigaciones de salud La m s t pica de ellas es precisamente en epidemiolog a en el estudio de los factores de riesgo asociados a una enfermedad En tal caso la variable dependiente puede ser simplemente la variable que distingue un grupo de enfermos y sanos y las variables predictivas los posibles factores de riesgo De las respuestas de este software se obtiene un arbol con las caracteristicas mencionadas el brinda la estructura de la red bayesiana con s lo invertir el orden del rbol Paso Il Obtenci n de las tablas de prob
12. work Models 1996 5 CHAID para SPSS sobre Windows T cnicas de segmentaci n basadas en razones de verosimilitud Chi cuadrado Manual de usuario SPSS Soft Inc 1994 6 Ch vez Maria del C Sistemas de Inferencia probabilistica Tesis de Maestr a 1999 7 8 9 10 11 12 13 Jobson J D Applied Multivariate Data Analysis Vol Il Categorical and Multivariate Methods Springer New York 11 54 1992 Joseph Bockhorst Mark Craven David Page Jude Shavlik Jeremy Glasner A Bayesian network approach to operon prediction BIOINFORMATICS Vol 19 no 10 2003 pages 1227 1235 2002 Lam W Bayesian network refinement via machine learning approach IEEE Trans Patt Anal Mach Int Vol 20 No 3 240 251 1998 Rodriguez L O Chavez M C and Bayshell Software para crear redes bayesianas e inferir evidencias en la misma Registro de Software CENDA 09358 9358 mayo 2002 Stuart Rusell Naving P Inteligencia Artificial Un enfoque Moderno 1996 Segal E Taskar B Koller D Probabilistic Classification and Clustering in Relational Data Inc Proc 17 Inter Joint Conference on Artificial Intelligence 2001 Williams W L Wilson R C HancockE R Multiple graph matching with Bayesian inference Pattern Recognition Lett Vol 38 11 13 1998
13. y en que medida permiten caracterizar la HTA despu s de hacer varias corridas con los algoritmos del CHAID se decidi trabajar solamente con la presi n arterial media pues esta est altamente correlacionada con las dem s mediciones de las presiones y de ah que siempre queden en la estructura de la red En el caso de los factores de riesgo el atributo m s discriminante es el ndice de masa corporal que tanto considerando los diagn sticos hiperreactivos e hipertensos o solamente hipertensos sin hiperreactivos permanece con una influencia directa sobre el diagn stico HTA en la estructura de la RB se pueden ver el resto de las variables y la forma en que permanecen en el estudio Construcci n de los rboles de decisi n Se utiliza la t cnica del CHAID como herramienta intermedia para obtener los rboles de decisi n Este m todo permite reducir grandemente el modelo probabil stico pues tiene en cuenta solamente las interacciones fundamentales de las variables predictivas con las familias o clases conformadas ejemplo de rbol se aprecian en las Fig 1 en este caso se tiene el rbol m s significativo a los efectos de la HTA si solamente se tienen en cuenta los normotensos e hipertensos La Base de Datos BD relativa a este estudio esta formada por un conjunto de 38 atributos predictivos que se obtienen de estudios y entrevistas realizadas a los pacientes y un atributo objetivo diagn stico cuyo valor hipertenso normot
Download Pdf Manuals
Related Search
Related Contents
Severin KS 9799 Modulo di ingresso per termocoppia/mV Compact I/O Fujifilm Camcorder F601 User's Manual Fujitsu PRIMERGY RX300 S3 お客様お問い合わせ窓口 プロオーディオ - ヤマハ Nokia E72 User Guide Caldaia murale a condensazione CGB DFseries Novembre 2003 Liahona Copyright © All rights reserved.
Failed to retrieve file