Introduzione: L’area di Taranto è caratterizzata dalla presenza di una vasta zona industriale che assegna alla città una specifica peculiarità dettata dalle sue criticità ambientali che colpiscono soprattutto la salute della popolazione residente. L’analisi della mortalita’ dei residenti permette di fornire un quadro dello stato di salute per le patologie letali. Le analisi tramite data mining, che richiedono un cospicuo numero di osservazioni e di variabili, costituiscono un interessante metodo utilizzabile in tali studi. Obiettivi: Esaminare le patologie dominanti nella mortalita’ nei residenti della citta’ di Taranto, e valutare la loro associazione con le condizioni socio economiche relative alla sezione di censimento di residenza al momento del decesso, applicando i metodi di data mining, con la costruzione di modelli di classificazione non supervisionata per l’ identificazione di cluster predominanti Metodi: I dati di mortalita’, di fonte USL, e gia’ utilizzati in precedenti analisi, sono stati linkati ai dati di mortalita’ del comune , in modo da associare ad ogni record la sezione del censimento 2001, e lo stato civile. Per ogni sezione di censimento e’ stato calcolato, su base provinciale, un indice di deprivazione (Caranci et al, 2009 Disuguaglianze sociali di salute. Problemi di definizione e di misura. "Salute e Società", a. VIII, n. 1.) suddiviso in 5 categorie socio-economiche (CSE).Le frequenze dei decessi sono stati standardizzati in base al metodo diretto applicando un opportuno moltiplicatore, basato sulla popolazione regionale al 2001, che tiene conto della popolazione residente nella sezione (Cislaghi C. 2009, Epidemiologia e Prevenzione, in stampa). le analisi di data mining, per ciascun sesso, sono state effettuate applicando i modelli 2step e k-means, per effettuare il clustering, e i modelli apriori ed elenco deciosionale, per valutarne i risultati, tramite il programma spss clementine 11.1; le mappe descrittive dei risultati sono state elaborate tramite Esri Arcgis 9.1 Desktop (ArcView , ArcMap, ArcCatalog) utilizzando i driver odbs per connettersi ai vari data base. La analisi delle patologie si e’ svolta in tre fasi: 1) i grandi gruppi di cause 2) 36 patologie specifiche 3) le patologie specifiche escludendo quelle emerse nella fase due. Risultati: I clusters di variabili emersi indicano come patologie predominanti i tumori, le malattie del circolatorio e respiratorio. Tra le patologie specifiche emergono tra gli uomini il tumore al polmone diffuso su tutto il territorio e senza distinzione di CSE, la bronchite e la cirrosi epatica per CSE scarse/pessime, e le malattie cerebrovascolari e ipertensione per CSE medie/discrete ; tra le donne emergono il tumore al seno per CSE medie con alte frequenze in eta’ < 70 anni, i tumori del sistema linfatico per CSE discrete, le malattie cerebrovascolari senza distinzione di CSE, l’ipertensione, il diabete, la broncopolmonite e la bronchite cronica per CSE scarse/pessime. Verranno presentate le mappe della distribuzione sul territorio. Conclusioni: I risultati sono congruenti con precedenti analisi spazio-temporali . Si evidenzia il ruolo predominante delle scarse/pessime CSE sulla mortalita’ , ma emerge chiaramente come la mortalita’ per tumore al polmone sia per gli uomini la patologia predominante e senza distinzione di CSE e tra le donne quella per tumore al seno, associata invece a buone CSE. Inoltre l’applicazione della tecnica data-mining a questi studi si rivela un promettente strumento di indagine da approfondire.
Data mining: una analisi della mortalità a Taranto 1998-2005, per sezione di censimento
VIGOTTI, MARIA ANGELA;PEDRESCHI, DINO;
2009-01-01
Abstract
Introduzione: L’area di Taranto è caratterizzata dalla presenza di una vasta zona industriale che assegna alla città una specifica peculiarità dettata dalle sue criticità ambientali che colpiscono soprattutto la salute della popolazione residente. L’analisi della mortalita’ dei residenti permette di fornire un quadro dello stato di salute per le patologie letali. Le analisi tramite data mining, che richiedono un cospicuo numero di osservazioni e di variabili, costituiscono un interessante metodo utilizzabile in tali studi. Obiettivi: Esaminare le patologie dominanti nella mortalita’ nei residenti della citta’ di Taranto, e valutare la loro associazione con le condizioni socio economiche relative alla sezione di censimento di residenza al momento del decesso, applicando i metodi di data mining, con la costruzione di modelli di classificazione non supervisionata per l’ identificazione di cluster predominanti Metodi: I dati di mortalita’, di fonte USL, e gia’ utilizzati in precedenti analisi, sono stati linkati ai dati di mortalita’ del comune , in modo da associare ad ogni record la sezione del censimento 2001, e lo stato civile. Per ogni sezione di censimento e’ stato calcolato, su base provinciale, un indice di deprivazione (Caranci et al, 2009 Disuguaglianze sociali di salute. Problemi di definizione e di misura. "Salute e Società", a. VIII, n. 1.) suddiviso in 5 categorie socio-economiche (CSE).Le frequenze dei decessi sono stati standardizzati in base al metodo diretto applicando un opportuno moltiplicatore, basato sulla popolazione regionale al 2001, che tiene conto della popolazione residente nella sezione (Cislaghi C. 2009, Epidemiologia e Prevenzione, in stampa). le analisi di data mining, per ciascun sesso, sono state effettuate applicando i modelli 2step e k-means, per effettuare il clustering, e i modelli apriori ed elenco deciosionale, per valutarne i risultati, tramite il programma spss clementine 11.1; le mappe descrittive dei risultati sono state elaborate tramite Esri Arcgis 9.1 Desktop (ArcView , ArcMap, ArcCatalog) utilizzando i driver odbs per connettersi ai vari data base. La analisi delle patologie si e’ svolta in tre fasi: 1) i grandi gruppi di cause 2) 36 patologie specifiche 3) le patologie specifiche escludendo quelle emerse nella fase due. Risultati: I clusters di variabili emersi indicano come patologie predominanti i tumori, le malattie del circolatorio e respiratorio. Tra le patologie specifiche emergono tra gli uomini il tumore al polmone diffuso su tutto il territorio e senza distinzione di CSE, la bronchite e la cirrosi epatica per CSE scarse/pessime, e le malattie cerebrovascolari e ipertensione per CSE medie/discrete ; tra le donne emergono il tumore al seno per CSE medie con alte frequenze in eta’ < 70 anni, i tumori del sistema linfatico per CSE discrete, le malattie cerebrovascolari senza distinzione di CSE, l’ipertensione, il diabete, la broncopolmonite e la bronchite cronica per CSE scarse/pessime. Verranno presentate le mappe della distribuzione sul territorio. Conclusioni: I risultati sono congruenti con precedenti analisi spazio-temporali . Si evidenzia il ruolo predominante delle scarse/pessime CSE sulla mortalita’ , ma emerge chiaramente come la mortalita’ per tumore al polmone sia per gli uomini la patologia predominante e senza distinzione di CSE e tra le donne quella per tumore al seno, associata invece a buone CSE. Inoltre l’applicazione della tecnica data-mining a questi studi si rivela un promettente strumento di indagine da approfondire.I documenti in IRIS sono protetti da copyright e tutti i diritti sono riservati, salvo diversa indicazione.