| Literature DB >> 35743653 |
Kristof Anetta1, Ales Horak1, Wojciech Wojakowski2, Krystian Wita3, Tomasz Jadczyk2,4.
Abstract
Electronic health records naturally contain most of the medical information in the form of doctor's notes as unstructured or semi-structured texts. Current deep learning text analysis approaches allow researchers to reveal the inner semantics of text information and even identify hidden consequences that can offer extra decision support to doctors. In the presented article, we offer a new automated analysis of Polish summary texts of patient hospitalizations. The presented models were found to be able to predict the final diagnosis with almost 70% accuracy based just on the patient's medical history (only 132 words on average), with possible accuracy increases when adding further sentences from hospitalization results; even one sentence was found to improve the results by 4%, and the best accuracy of 78% was achieved with five extra sentences. In addition to detailed descriptions of the data and methodology, we present an evaluation of the analysis using more than 50,000 Polish cardiology patient texts and dive into a detailed error analysis of the approach. The results indicate that the deep analysis of just the medical history summary can suggest the direction of diagnosis with a high probability that can be further increased just by supplementing the records with further examination results.Entities:
Keywords: Polish language; deep learning; diagnosis prediction; electronic health records; text analysis
Year: 2022 PMID: 35743653 PMCID: PMC9225281 DOI: 10.3390/jpm12060869
Source DB: PubMed Journal: J Pers Med ISSN: 2075-4426
Statistics detailing unit counts and averages in the Polish health record dataset.
| Average word count per record | 472 |
| Average word counts per sections | 132; 249; 86; 64 |
| Records | 50,465 |
| Sentences | 2,583,087 |
| Words | 23,831,785 |
| Tokens | 34,315,153 |
Example of a complete health record in the Polish health record dataset.
| Section 1 (Admission) | Pacjent przyjęty w ramach ostrego dyżuru z powodu zawału mięśnia sercowego ściany dolnej. Spoczynkowe dolegliwości wieńcowe od 29.03. 17:00, w dniu dzisiejszym, w godzinach porannych zgłasił sie do poradni, gdzie rozpoznano zawał. Czynniki ryzyka choroby wieńcowej: Hypercholesterolemia i nadcisnienie leczone skutecznie. Nigdy nie palił. Cukrzycę neguje, ale przy przyjęciu cukier >200 mg% i dodatni wywiad rodzinny—matka chorowała. Skargi dodatkowe i choroby przebyte: Nie zgłasza. Na żółtaczkę nei chorował, nie szczepiony. Alergie i nietolerancje lekowe neguje. Wywiad rodzinny: Matka chorowała na cukrzycę. Bez wczesncyh powikłań miażdżycowych w rodzinie. |
| Section 2 (Physical) | Pacjent przytomny, ułożenie dowolne, kontakt logiczny zachowany. Budowa prawidłowa, nadwaga 170 cm, 90 kg. Skóra prawidłowo ucieplona, bez wykwitów patologicznych. Tkanka podskórna prawidłowo rozwinięta. Węzły chłonne niewyczuwalne. Głowa opukowo niebolesna. Gałki oczne osadzone prawidłowo, symetryczne. Źrenice równe, okrągłe, prawidłowo reagują na światło i nastawność. Nad płucami wypuk jawny, szmer oddechowy pęcherzykowy symetryczny. Drżenie głosowe zachowane. Akcja serca miarowa 80/min. Tony serca głuche, bez szmerów patologicznych. Brzuch miękki, palpacyjnie niebolesny, bez oporów patologicznych. Wątroba pod łukiem żebrowym. Śledziona, nerki niewyczuwalne. Objawy Chełmońskiego i Blumberga ujemne. Objaw Goldflama obustronnie ujemny. Perystaltyka słyszalna. Bez obrzęków obwodowych. Bez zmian żylakowatych. Tętno na tt. kończyn dolnych dobrze wyczuwalne. |
| Section 3 (Discharge) | Pacjent lat 68 przyjęty w ramach ostrego dyżuru z powodu zawału ściany dolnej mięśnia sercowego. Wykonano koronarografię, w której stwierdzono w prawej tętnicy wieńcowej w początkowym odcinku 99% zwężenie. Jednoczasowo wykonano skuteczny zabieg PCI PTW z implantacją stentu. W lewej tętnicy wieńcowej stwierdzono: pień bez zmian, LAD bez zmian, LCx zmiany przyścienne, OM1 dość szeroka i rozległa, medialnie krótka zmiana do 95%. Wskazany w 2-gi etap PCI w OM1. Przeprowadzono wewnatrzszpitalny etap rehabilitacji kardiologicznej. W badanich dodatkowych stwierdzono podwyższone wartości glikemii, rozpoczęto intensywną farmakoterapię (z insuliną). Pacjent wypisany do domu z zaleceniami jw. |
| Section 4 (Recommendations) | Vivacor 6,25 1-0-1 Enarenal 5 1-0-1 Polocard 75 mg 0-0-1 Zocor 20 mg 0-0-1 Ranigast 150 mg 0-0-1 Plavix 1-0-0 (optymalnie 12 miesięcy) Siofor 500 mg 1-1-0 Insulina wg. poziomu glukozy (ostatnie zapotrzebowanie: NovoMix 30: R-20j, W-19j) Normalizacja wagi ciała. Dieta cukrzycowa.Dalsze leczenie w Poradniach: lekarza rodzinnego, kardiologicznej, diabetologicznej (pilne). Pacjent za około 2 miesiące zostanie ponownie przyjęty celem wykonania 2-go etapu leczenia choroby wieńcowej (PCI OM)- konieczne skierowanie do Kliniki. Po zakończeniu leczenia interwencyjnego proponujemy rehabilitacje w warunkach sanatoryjnych. |
| ICD-10 diagnosis | I21.1 |
Figure 1Representation of top 20 concluding ICD-10 categories in the data (bar chart) and proportions of categories with more than 1000 examples (pie chart).
Overview of the 10 most frequent concluding primary ICD-10 categories in the dataset. This distribution does not reflect realistic diagnosis frequencies because the conditions frequently co-occur and one health record in the dataset can only be assigned one diagnosis code.
| ICD-10 Category | Medical Name | Count in Dataset |
|---|---|---|
| I25 | Chronic ischemic heart disease/chronic coronary syndrome | 17,973 (36.03%) |
| I20 | Unstable angina pectoris | 9741 (19.53%) |
| I21 | Acute myocardial infarction | 6262 (12.55%) |
| I50 | Heart failure | 3360 (6.74%) |
| I48 | Atrial fibrillation and flutter | 1678 (3.36%) |
| I35 | Nonrheumatic aortic valve disorders | 1511 (3.03%) |
| I10 | Essential hypertension | 1299 (2.60%) |
| I49 | Other cardiac arrhythmias | 881 (1.77%) |
| Z03 | Suspected condition not found | 804 (1.61%) |
| I34 | Nonrheumatic mitral valve disorders | 777 (1.56%) |
Overview of the training subsets listing individual ICD-10 categories included in the training and coverage of such a subset with respect to the whole dataset.
| Training Subset | Categories Included | Coverage |
|---|---|---|
| 4 + 1 | I25, I20, I21, I50, “other” | 74.8% |
| 6 + 1 | I25, I20, I21, I50, I48, I35, “other” | 81.2% |
| 9 + 1 | I25, I20, I21, I50, I48, I35, I10, I49, Z03, “other” | 87.2% |
| 12 + 1 | I25, I20, I21, I50, I48, I35, I10, I49, Z03, I34, Q21, I42, “other” | 91.0% |
Figure 2Development of the proportions of 5 most frequent primary diagnoses in the dataset between 2003 and 2020.
Overview of the main classification results for the different dataset variations.
| Training Dataset | Training/Testing Examples per Class | Accuracy (Admission Data) | Accuracy (Discharge Data) |
|---|---|---|---|
| 4 + 1 | 15,148/841 | 68.79% | 78.64% |
| 6 + 1 | 6773/376 | 67.71% | 77.00% |
| 9 + 1 | 3533/196 | 59.62% | 71.49% |
| 12 + 1 | 2458/136 | 56.49% | 69.21% |
Figure 3Confusion matrices for the 4 + 1 models trained on (a) admission data and (b) discharge data. Numbers refer to counts of examples in the respective categories, and the color spectrum reflects the contrast in their proportions.
Figure 4Confusion matrices for the 6 + 1 models trained on (a) admission data and (b) discharge data. Numbers refer to counts of examples in the respective categories, and the color spectrum reflects the contrast in their proportions.
Figure 5Chart showing the falloff of accuracy as the number of categories increases. The most frequent category baseline was calculated based on category frequencies in the entire corpus.
Figure 6Sensitivity charts showing the changes in accuracy in relation to learning rate (a) and weight decay (b); training was conducted with the 6 + 1 category dataset version, limited to a maximum of 10 epochs.
Figure 7Rise in accuracy as admission training data are gradually extended with sentences from discharge text.
Performance per category in a 9 + 1 setup fine-tuned on both admission and discharge data, sorted by F1 score, as a harmonic mean of precision and recall.
| ICD-10 Category | F1 Score | Frequently Confused with |
|---|---|---|
| I21 | 0.90 | other |
| I48 | 0.80 | other, I49 |
| I35 | 0.79 | other |
| I49 | 0.74 | I10, other, I48 |
| Z03 | 0.72 | I10 |
| I20 | 0.69 | I25 |
| I50 | 0.69 | other, I48, I35 |
| I10 | 0.63 | Z03, other |
| I25 | 0.56 | Z03, I20, I10 |
| other | 0.53 | I10, I50, I35 |
Figure 8Confusion matrix of a 9 + 1 setup fine-tuned on both admission and discharge data. Numbers refer to counts of examples in the respective categories, and the color spectrum reflects the contrast in their proportions.