Literature DB >> 26154555

Probabilistic graphic models applied to identification of diseases.

Renato Cesar Sato¹, Graziela Tiemy Kajita Sato².

Abstract

Decision-making is fundamental when making diagnosis or choosing treatment. The broad dissemination of computed systems and databases allows systematization of part of decisions through artificial intelligence. In this text, we present basic use of probabilistic graphic models as tools to analyze causality in health conditions. This method has been used to make diagnosis of Alzheimer´s disease, sleep apnea and heart diseases.

Entities: Chemical Disease Gene Species

Mesh：

Year: 2015 PMID： 26154555 PMCID： PMC4943832 DOI： 10.1590/S1679-45082015RB3121

Source DB: PubMed Journal: Einstein (Sao Paulo) ISSN： 1679-4508

INTRODUCTION

Data collection and decision making are part of the activities pertaining to healthcare organizations. In other words, management of health care activities is based on grasping what is thought to be true and deciding how to acting accordingly. To illustrate this point, healthcare organizations often face scenarios where health care professionals collect data on a given patient (i.e. symptoms, physical characteristics, history, etc.) that ultimately support diagnostic and therapeutic decisions. This paper describes how probabilistic graphical models (PGM), and Bayesian networks in particular, may contribute to decision making in health care. The PGM are widely used in activities involving artificial intelligence, having progressed and gained momentum in this particular area over the last decades. Probabilistic graphical models can be understood as graphs where nodes correspond to variables, while uni-or bidirectional arcs represent the intervariable dependences, a structure that enables the assembly of sets of joint or conditional probabilistic distributions.( The term “Bayesian network” was coined in the 1980s to describe PGM intended for uncertainty management in artificial intelligence. However, advancements in computer sciences and wide applicability potential fostered the adoption of such networks by universities and large business enterprises. Diagnostic systems, gene interaction modelling and detection and quantification of causal relations in epidemiology are among the major applications of Bayesian networks in health care. In spite of its potential applications and benefits, Bayesian networks are briefly mentioned in health-related texts and handbooks and are therefore presented in a limited or superficial form to health professionals. Bayesian networks represent a modeling approach to issues of increasing concern to health organizations over the last decade. Personalized medicine involves the prediction of disease progression based on interpretation of patient data in the light of a disease model( and is one potential area of application of these networks. This paper introduces the application of Bayesian networks in the context of disease; related advantages and disadvantages, limitations and deployment structure are also discussed.

APPLICATION OF BAYESIAN NETWORKS IN DISEASE RECOGNITION

Bayesian networks are models in which causality plays a fundamental role. However, incomplete understanding of the scenario being analyzed is common and probabilistic approaches are often used in an effort to describe causal relations. Probabilistic aspects therefore take on an important dimension in this network of relations to overcome limited knowledge and to help in the decision making process. Bayesian networks are directed acyclic graphs (DAGs) where nodes represent random variables, and assumptions of intervariable independence are maintained. Nodes in graphs correspond to Bayesian network random variables and may vary in nature. Quantitative data, latent variables, unknown parameters and even research hypotheses may therefore be included in the model. One diagram can provide explicit representation of the potential progression of a given situation and may allow inferences about the likely causes of observed effects. Let us examine the diagram represented by Figure 1 to identify risk factors for cardiovascular disease - in this case, smoking, sedentary lifestyle and stress. Latent variables (i.e. not amenable to direct observation but playing an important role in causality) may also be included in the model, although an additional step may be required for this purpose.( For example, socioeconomic status, which combines level of education, professional qualifications and occupation, may not have a direct impact on cardiovascular disease development. However, lower incidence of cardiovascular disease has been correlated with higher socioeconomic status in Eastern European, North American and Japanese studies.( Hence, while income may not impact the development of cardiovascular disease directly, stress factors derived from stress conditions may indeed increase related risk factors, such as alcohol abuse and socioeconomic status (i.e. level of education, professional qualifications and occupation).

Figure 1

Basic assumptions in the model

For simplification purposes, the model displayed in Figure 1 starts with strong assumptions. We are assuming income alone to be a latent factor of sedentary lifestyle, whereas a more complete model should also account for relations with remaining factors in the model. Large numbers of variables in healthcare data add to the difficulties involved in investigation and assessment of related phenomena. Scenarios where one variable depends upon one or more variables represent additional complicating factors. In a model assuming a patient suffering from a cardiovascular condition and indicated by the letter “D”, some variables, such as smoking, sedentary lifestyle and alcohol abuse (letters A, B and C, respectively) may be included. This scenario can be graphically reproduced as in Figure 2.

Figure 2

Conditional structure

The same graphical representation can be described in terms of conditional probabilities. The links between pairs of variables represent conditional dependencies, while nodes that are not connected represent variables, which are conditionally independent of each other. Such terms describe the association of the probability function from a set of values. A data set containing N variables states there are 2N available network models and that Bayes’ theorem can be used to select the best suited model for that particular dataset. The advantages of computerized systems stand out as the number of variables increase. To illustrate this point, let us compare two data sets containing 10 and 15 variables respectively. While 1,024 networks would apply to the first, 32,768 possibilities would be available to the latter. We can clearly see the need for this type of methodology in disease modeling: as we try to improve our models by including new variables, the complexity of the network increases. The search for optimized networks can be divided into three steps( and requires the identification of optimized parent nodes. Parent nodes are those that have nodes below them (child nodes).

APPLICATIONS IN MEDICINE

Bayesian networks have been used to model uncertainty in medicine.( Diagnostic decision making support is one among other applications. The method is based on categorization of responses to specific diagnostic questionnaires and as such may contribute to the diagnosis of Alzheimer's disease.( These questionnaires help to construct judgment matrices and value scales for each fundamental viewpoint previously selected by the clinician in charge.( The model is able to more accurately categorize the diagnostic profile of Alzheimer's disease. Sleep apnea( and cardiovascular diseases( are other potential applications.

STRUCTURE OF A BAYESIAN NETWORK MODEL

The process involved in a Bayesian network model can be described in five steps (Figure 3).(

Figure 3

Steps in a Bayesian network model

Selection of relevant variables

All variables pertaining to the problem must be investigated. This is usually done by means of surveys by an expert in the process area.

Identification of intervariable relations

Identification of variables is followed by investigation of intervariable relations (i.e., definition of cause-and-effect relations between variables). These causalities are also related to expert's knowledge of given events.

Identification of qualitative probabilities and logical restrictions

Identification of probability distributions required for network construction. Logical restriction aims to limit the range of probabilities that must be assessed. This step usually consists of database mapping.

Probability assessment

In this phase, probability distributions are assigned to each node in the network. Qualitative estimates can be obtained and a predetermined scale employed, or attempts can be made at visualizing the probability of an event as an area. In both cases the estimation process is long and susceptible to error; therefore outcomes may not be reliable.(

Sensitivity analysis and evaluation

Network models must be validated. Real data must be submitted to different probabilistic systems and outcomes compared.

CONCLUSION

Better structuring of databases from healthcare and other organizations has led to improvement of health-related causal models. This, in turn, has fostered greater interaction between systems supporting diagnostic, prognostic and therapeutic decision-making, as well as investigation of functional interactions, and medical knowledge, probability and computing. The advent of the so-called “big data” presents a good opportunity to further extend the application of this type of analysis to healthcare. In this context, Bayesian networks stand out as important tools to help overcome limitations imposed by common uncertainties in the field of health. Bayesian networks are graphical models that enable the investigation of intervariable relations. Cause-and-effect relations can be established and probability theory applied to uncertainty issues due to network directional nature. However, isolated application of an algorithm does not provide the best diagnostic structure, and overseeing by expert professionals is required. Potential limitations of Bayesian networks include violations of probability distributions employed for system structuring and limited system update possibilities in the face of the need for novel information. Nevertheless, the major limitation to bear in mind concerns the difficulties pertaining to analysis of an unknown network and calculation of probabilities of all possible pathways, which may actually not be feasible in healthcare scenarios where diagnosis is based on clinical experience and subjective data. Also, outcomes will reflect the quality of a priori data and model selection. Therefore, Bayesian networks should be viewed as ancillary tools rather than substitutes for decision-making processes.

INTRODUÇÃO

Parte das atividades realizadas nas organizações de saúde está relacionada com o processo de obtenção de informações e tomada de decisões. Colocando essa questão de outra maneira, o gerenciamento das atividades de saúde apoia-se no processo de tomar conhecimento daquilo que acredita ser verdade e como agir com base nesse conhecimento obtido. Para ilustrar essa situação, corriqueiramente as organizações de saúde vivenciam a situação em que o profissional da saúde obtém informações sobre um determinado paciente (seus sintomas, características físicas, histórico etc.) e, com base nessas informações, chega a uma determinada conclusão sobre a condição de saúde e qual a melhor conduta a ser tomada. Assim apresentamos, neste artigo, como os modelos gráficos probabilísticos (MGP), em especial as redes bayesianas, podem e são utilizadas no apoio da tomada de decisão na área da saúde. Os MGP possuem uma ampla aplicação nas atividades relacionadas com inteligência artificial, sendo justamente nessa área que essa metodologia ganhou força e se desenvolveu nas últimas décadas. Podemos entender o MGP como um gráfico em que os nós representam as variáveis, e os arcos (direcionais ou não direcionais) representam as dependências que existem entre as variáveis. Essa estrutura permite montar o conjunto das distribuições probabilísticas, sejam elas conjuntas ou condicionais entre as variáveis.( Dentro dos MGP, podemos encontrar as chamadas “redes bayesianas”. Essas redes surgiram por volta dos anos 1980 como modelos probabilísticos para lidar com a incerteza no contexto da inteligência artificial. No entanto, a evolução computacional e as possibilidades de aplicações fizeram com que em pouco tempo esse tema passasse a ser explorado dentro das universidades e de grandes empresas. Algumas das principais aplicações das redes bayesianas na área de saúde estão relacionadas com os sistemas de diagnósticos, modelagem de interações dos genes, e detecção e quantificação das influências causais no contexto epidemiológico. Apesar dessas aplicações e vantagens obtidas pelo uso das redes bayesianas, esse tema ainda é disperso nos textos e manuais para profissionais da saúde. Isso torna o tema relativamente restrito ou apresentado de maneira superficial. As redes bayesianas oferecem uma abordagem de modelar os problemas enfrentados pelas organizações de saúde e que vêm chamando a atenção na última década. Um exemplo de aplicação é o caso da medicina personalizada, que envolve a previsão do progresso da doença com base na interpretação dos dados dos paciente por meio de um modelo de doença.( Neste texto, faremos, a seguir, uma apresentação sobre o funcionamento dessa metodologia no contexto das doenças, bem como suas vantagens, desvantagem, limitações e estrutura de implementação.

USO DAS REDES BAYESIANAS NA IDENTIFICAÇÃO DE DOENÇAS

Podemos entender uma rede bayesiana como um modelo no qual a causalidade é importante, porém não é raro termos um entendimento incompleto sobre o que está acontecendo e, por isso, tentarmos descrever probabilisticamente essas relações. Desse modo, o aspecto probabilístico ganha uma importante dimensão nessa rede de relações na tentativa de superar a limitação do conhecimento e auxiliar o processo de tomada de decisão. As redes bayesianas são gráficos direcionais acíclicos (GDA), nos quais os nós são variáveis aleatórias e as premissas de independência entre as variáveis são mantidas. Os nós do gráfico representam as variáveis aleatórias da rede bayesiana e podem variar quanto à sua natureza. Isso oferece a flexibilidade de incluir dados como quantidades observadas, variáveis latentes, parâmetros desconhecidos ou até mesmo hipóteses levantadas pelo pesquisador. Por um diagrama, podemos obter uma representação explícita sobre o que poderá acontecer em determinada situação e tentar inferir sobre as causas dos efeitos que estão sendo observados. Tomemos como exemplo o diagrama representado pela figura 1 para identificar fatores de risco de doenças cardiovasculares como sendo tabagismo, sedentarismo e estresse. As variáveis latentes, ou seja, aquelas que não podem ser observadas diretamente, mas que possuem um papel importante nas causalidades também podem ser incluídas durante a modelagem, podendo requerer uma etapa adicional para listar esse tipo de variáveis.( Por exemplo, o status socioeconômico, compreendido pelo nível educacional, qualificações profissionais e ocupação, pode não atuar diretamente no desenvolvimento de doença cardiovascular, porém estudos demonstrados na Europa Oriental, Estados Unidos e Japão correlacionam menor incidência de doenças cardiovasculares na população de status mais elevado.( Desse modo, a renda de uma pessoa pode não influenciar diretamente no desenvolvimento de uma doença cardiovascular, mas fatores de estresse oriundos da condição de estresse podem promover aumento de fatores de risco, como maior consumo de bebidas alcoólicas e status socioeconômico (compreendidos como nível educacional, qualificações profissionais e ocupação).

Figura 1

Premissas básicas do modelo

Para fins de simplificação, o modelo descrito na figura 1 parte de fortes premissas. Nesse caso, estamos supondo que apenas a renda é um fator latente do sedentarismo, porém, em um modelo mais completo, temos que considerar que pode haver uma relação da renda e dos outros fatores do modelo também. Os dados na área de saúde possuem grande quantidade de variáveis, o que aumenta a dificuldade no estudo e na avaliação dos fenômenos a eles relacionados. Outro agravante ocorre mediante a presença de situações em que uma variável é dependente de uma ou mais variáveis. Ao supormos a situação de um indivíduo acometido por uma doença cardiovascular e indicando a doença pela letra “D”, para fins de modelagem, podemos associar outras variáveis, como tabagismo, sedentarismo, etilismo representados, respectivamente, pelas letras A, B e C. Graficamente podemos facilmente apresentar essa representação conforme a figura 2.

Figura 2

Estrutura condicional

Essa representação gráfica também pode ser descrita em termos das probabilidades condicionais. As ligações entre os pares de variáveis representam as dependências condicionais; os nós que não são co nectados representam a independência condicional entre eles. Estes são termos para definir a associação da função probabilidade a partir de um conjunto de valores. Um conjunto de dados com N variáveis diz que existem 2N modelos de redes disponíveis e que podemos utilizar o teorema de Bayes para selecionar o modelo mais adequado para os conjunto de dados apresentados. As vantagens computacionais passam a ser visíveis com o aumento no número de variáveis. Por exemplo, um conjunto com 10 variáveis possui 1.024 redes possíveis, enquanto que, para um conjunto com 15 variáveis, o número de possibilidades aumenta para 32.768. Percebe-se, então, a necessidade de aplicar uma metodologia dessa natureza para modelar os problemas de saúde, em razão da velocidade com que a complexidade da rede aumenta conforme tentamos aprimorar nosso modelos adicionando mais variáveis. A tentativa de buscar a rede otimizada pode ser dividida três etapas.( Para isso, é necessário encontrar os nós-pais otimizados. Dizemos que um nó é pai quando outros nós estão associados a eles, e esses nós associados são chamados de “nós-filhos”.

APLICAÇÕES NA MEDICINA

Na medicina, as redes bayesianas vêm sendo utilizadas para modelagem da incerteza.( Um exemplo de aplicação é o apoio a tomada de decisão quanto a um diagnóstico. O diagnóstico de doença de Alzheimer( pode ser beneficiado utilizando esse método, que consiste em classificar respostas de questionários específicos para diagnóstico. Estes, por sinal, auxiliam na construção de matrizes de julgamento e na construção de escalas de valores para cada ponto de vista fundamental, já previamente eleitos pelo clínico.( O modelo classifica com mais acuidade o perfil que diagnostica a doença de Alzheimer. Outros exemplos dessas aplicações podem ser a apneia do sono( e as doenças cardiovasculares.(

ESTRUTURA DE MODELAGEM DE UMA REDE BAYESIANA

O processo de modelagem de uma rede bayesiana pode ser definido em cinco etapas (Figura 3).(

Figura 3

Estágios da modelagem de uma rede bayesiana

Seleção de variáveis relevantes

É necessário fazer um levantamento de todas as possíveis variáveis que fazem parte do problema. Para isso, costumam-se realizar entrevistas com o especialista na área do processo.

Identificação do relacionamento entre as variáveis

Após a identificação das variáveis, é necessário verificar como as mesmas se relacionam, ou seja, definir a causa e o efeito que levam uma variável a interferir em outra. Essas casualidades também estão relacionadas com o conhecimento do especialista sobre o acontecimento de determinados eventos.

Identificação das probabilidades qualitativas e restrições lógicas

Identificar o tipo de distribuição das probabilidades requeridas para a construção da rede. A restrição lógica objetiva limitar o universo de probabilidades que devem ser avaliadas. Geralmente, essa etapa consiste em mapear uma base de dados.

Avaliação das probabilidades

Nesse estágio, a distribuição de probabilidade é atribuída a cada nó da rede. Podem-se obter estimativas qualitativas e utilizar uma escala predeterminada, ou, senão, tentar visualizar a probabilidade de um evento como uma área. Em ambos os casos, esse processo de estimação é longo e suscetível a erros, promovendo resultados que podem não ser confiáveis.(

Análise da sensibilidade e avaliação

Com a rede já modelada, é necessário verificar sua validade. O autor enfatiza que, na avaliação, deve-se, a partir de dados reais, submeter em outros sistemas probabilísticos para comparar os resultados.

CONCLUSÃO

A maior estruturação dos bancos de dados das instituições de saúde e demais organizações passou a permitir o aprimoramento dos modelos de causalidades das condições de saúde. Esse fenômeno abriu um importante espaço para que os sistemas de apoio à decisão nas áreas de análise diagnóstica e prognóstica, decisão sobre tratamentos e estudo das interações funcionais ganhassem espaço na interação dos conhecimentos da medicina, probabilidade e computação. O advento do chamado “big data” surge como uma área promissora para estender ainda mais esse tipo de análise dentro da área de saúde. As redes bayesianas surgem, então, como importante ferramenta, capaz ajudar a superar as limitações impostas pelas incertezas tão normalmente presentes na área da saúde. Podemos considerar que as redes bayesianas são modelos gráficos em que é possível tentar obter as relações entre as variáveis. Devido à sua característica direcional, elas permitem estabelecer claramente a relação de causa-efeito e podem lidar com a incerteza a partir da teoria da probabilidade. No entanto, o uso isolado de um algoritmo não oferece a melhor estrutura diagnóstica, devendo ele ser supervisionado por profissionais especializados. Dentre as principais limitações do uso das redes bayesianas estão associadas as possíveis violações das distribuições de probabilidades, nas quais o sistema foi estruturado, e a limitação do sistema em atualizar seus objetivos diante da necessidade de novas informações. No entanto, a principal limitação a ser considerada diz respeito à dificuldade de analisar uma rede desconhecida, bem como calcular as probabilidades de todos os caminhos possíveis. Isso pode ser, inclusive, impossível de realizar em determinadas situações na área da saúde, nas quais o diagnóstico baseia-se em experiência clínica e depende de informações de natureza subjetiva coletada. Além disso, as respostas obtidas dependem da qualidade das informações a priori, bem como a seleção do modelo que deve ser considerado. Portanto, as redes bayesianas devem ser vistas como uma complementaridade, e não uma substituição da tomada de decisão.

8 in total

1. Bayesian networks in biomedicine and health-care.

Authors: Peter J F Lucas; Linda C van der Gaag; Ameen Abu-Hanna
Journal: Artif Intell Med Date: 2004-03 Impact factor: 5.326

2. A new method for sleep apnea classification using wavelets and feedforward neural networks.

Authors: Oscar Fontenla-Romero; Bertha Guijarro-Berdiñas; Amparo Alonso-Betanzos; Vicente Moret-Bonillo
Journal: Artif Intell Med Date: 2005-05 Impact factor: 5.326

3. Toward prediction of physiological state signals in sleep apnea.

Authors: J Bock; D A Gough
Journal: IEEE Trans Biomed Eng Date: 1998-11 Impact factor: 4.538

4. DIAVAL, a Bayesian expert system for echocardiography.

Authors: F J Díez; J Mira; E Iturralde; S Zubillaga
Journal: Artif Intell Med Date: 1997-05 Impact factor: 5.326

5. Factor analysis for the adoption of nuclear technology in diagnosis and treatment of chronic diseases.

Authors: Renato Cesar Sato; Désirée Moraes Zouain
Journal: Einstein (Sao Paulo) Date: 2012 Jan-Mar

Review 6. Antihypertensive treatment and development of heart failure in hypertension: a Bayesian network meta-analysis of studies in patients with hypertension and high cardiovascular risk.

Authors: Sebastiano Sciarretta; Francesca Palano; Giuliano Tocci; Rossella Baldini; Massimo Volpe
Journal: Arch Intern Med Date: 2010-11-08

7. Risk analysis of a patient monitoring system using Bayesian Network modeling.

Authors: I Maglogiannis; E Zafiropoulos; A Platis; C Lambrinoudakis
Journal: J Biomed Inform Date: 2005-11-15 Impact factor: 6.317

8. Altered default mode network connectivity in Alzheimer's disease--a resting functional MRI and Bayesian network study.

Authors: Xia Wu; Rui Li; Adam S Fleisher; Eric M Reiman; Xiaoting Guan; Yumei Zhang; Kewei Chen; Li Yao
Journal: Hum Brain Mapp Date: 2011-01-21 Impact factor: 5.038

8 in total