Vai al contenuto principale
Coronavirus: aggiornamenti per la comunità universitaria / Coronavirus: updates for UniTo Community

IMMAGINE
NON DISPONIBILE

Biostatistica

Biostatistics

Componenti

Contatti

Settore ERC

LS2_9 - Metabolomics
LS2_12 - Biostatistics
LS7_9 - Public health and epidemiology
LS7_10 - Preventative and prognostic medicine
LS7_11 - Environmental health, occupational medicine
LS7_12 - Health care, including care for the ageing population
PE6_10 - Web and information systems, data management systems, information retrieval and digital libraries, data fusion
PE6_11 - Machine learning, statistical data processing and applications using signal processing (e.g. speech, image, video)
PE6_12 - Scientific computing, simulation and modelling tools
SH2_1 - Political systems, governance
SH2_2 - Democratisation and social movements
SH3_5 - Attitudes and beliefs
SH3_12 - Communication and information, networks, media

Attività

The current research projects of the group are focused on the following topics:

  • Machine Learning Techniques (Artificial Intelligence) applied to clinical data and unstructured text data. Within this topic we had a recent collaboration with the European Space Agency to forecast Covid-19 epidemic behaviour and we are beginning to work with the Meldola Cancer Institute on advanced analytics on administrative healthcare data to support scenario analyses and develop policies evaluation strategies.
  • Graphical models and Statistical Learning with application in a wide range of fields: analysis of routinely collected data (registries), quantitative risk assessment, clinical decision support and phenomapping. On this topic we have several collaborations with clinical groups based in the Molinette and Regina Margherita Hospitals and several DSCB research groups
  • Hierarchical Bayesian models for integrating data from multiple data sources and Bayesian Model Averaging as approach to inference in presence of different competing models. Within this topic we have a collaboration with the Trial Unit of the Mauriziano Hospital and the Clinical Trial Unit at the Department of Cardiac, Thoracic and Vascular Sciences of the University of Padova
  • Bayesian Design and Analysis for Clinical Trials. Within this research topic we have several collaborations with the Candiolo Cancer Institute

Collaborative support and assistance to DSCB research groups is provided in all areas of biostatistical/clinical epidemiology expertise, including designing studies with appropriate sample size and power and statistical analysis of both clinical and biological data.

The Biostatistics Unit is also the DSCB referent for supporting the implementation of research projects on Medcap, the service provided by the School of Medicine for electronic data collection. Currently, the following studies are actively collecting data: TKI Discontinuation Registry (Italian Multicenter study on adult patients with chronic myeloid leukemia who discontinue Tyrosine Kinase Inhibitors); Covid-19 Vaccination in hematological patients (Observational study on the clinical impact of Covid-19 vaccine in hematological patients); Regional Registry of myelofibrosis (Observational study of patients in Piedmont with myelofibrosis).

Ongoing projects

Sector: Machine Learning in Clinical Research (MED/01 Statistica Medica; MED/06 Oncologia Medica; MED/08 Anatomia Patologia)

Funding: Innovo s.r.l., AstraZeneca

Partiecipants: Paola Berchialla, Veronica Sciannameo, Sara Urru, Elisa Ervas (Innovo, S.r.l), Silvia Novello (Department of Oncology, University of Torino), Luisella Righi (Department of Oncology, University of Torino)

Abstract: Phase III studies investigating the efficacy of immunotherapy in addition to CT in neoadjuvant setting are currently ongoing, using surrogate endpoint pathological Complete Response (pCR) and major Pathological Response (mPR) as either primary or secondary endpoints. Percentage of residual viable tumor is identified on routine hematoxylin and eosin staining. In clinical trials it is common that identification of residual viable tumor is performed by a central pathology laboratory. This feasibility aims to understand if the information needed for surrogate endpoint assessment is reported in routine local pathology laboratory reports and can be used for retrospective observations of neoadjuvant treatment effectiveness and to Investigate whether a Natural Language Processing (Artficial Intelligence) algorithm can be trained to carry out such pCR and mPR readings on laboratory reports. Finally, it will be evaluated if a difference exists between routine pathology assessments performed after tumor resection of treatment-naive patients vs neoadjuvant-treated patients. Sources of data: Post-surgery pathologist reports of Non-Small Cells Lung Cancer patients; administrative healthcare data collected at the S. Luigi Hospital.

Sector: Biostatistics (MED/01 Statistica Medica; MED/13 Endocrinologia)

Funding: University of Padova

Participants: Paola Berchialla (Associate Professor), Veronica Sciannameo (Research fellow), Gian Paolo Fadini (Associate Professor, University of Padova)

Abstract: Methods for generalizing RCT results to a target population are based on aggregated data of RCT and individual data of the target population. The main limitation of this approach is that it is not able to consider the probabilistic relationships between variables. Multivariable Bayesian graphical models can instead account for the joint distributions of multiple continuous and categorical variables.

To apply this method, we obtained individual data from both REWIND (RCT) and DARWIN-T2D (target population data) studies. We will combine individual data from the REWIND trial and theDARWIN-T2D to model dependencies between variables in the target population and to estimates appropriate weights for REWIND participants. The Peter–Clark stable algorithm with a 100-fold bootstrap will be employed for the structural learning of the Bayesian graphical models, i.e. for identifying the relationships among variables. A more robust Bayesian graphical model will be obtained by averaging the 100 Bayesian graphical models learned, considering only the relationships among variables present in at least 95% of times. Finally, within the weighted REWIND trial, we will estimate the treatment effect transposed to the target population.

Sector: Machine Learning in Clinical Epidemiology (MED/01 Statistica Medica)

Funding: PhD studentship co-funded by University of Torino, University of Padova

Participants: Paola Berchialla, Sara Urru

Abstract: Randomized clinical trials (RCTs) are the first-choice study design to evaluate a potential causal relationship between a treatment and patient outcomes. However, in the contexts of clinical practice, personalized medicine, or precision medicine, adapted to the characteristics of the individual patient, has questioned the results produced by RCTs. Indeed, the rigid design of clinical trials produces information that is applicable to a relatively narrow spectrum of patients.

In this regard, some of the shortcomings that personalized medicine seeks to address include the analysis of individual differences in response to treatment, the so-called heterogeneity effects. In personalized medicine, the focus is indeed on identifying which approaches / interventions will be effective for patients based on their genetic, environmental and lifestyle factors.

Using machine learning techniques, individuals can be classified into subpopulations that differ in their susceptibility to a particular disease or in their response to a specific treatment and identify those who benefit most from it. The project aims to develop machine learning models for estimating the heterogeneity effect of treatments and to identify groups of patients with differentiated outcomes to implement a personalized treatment. A distinctive feature of the developed models will be their ability to integrate heterogeneous data sources. The methods will be applied on data from clinical trials started.

Sector: Survey Methods (MED/01 – Statistica Medica; MED/42 Igiene generale e applicata; M-PSI/04 Psicologia dello Sviluppo e Psicologia dell’Educazione)

Funding: Independent research within International Consortium

Participants: Paola Berchialla (Department of Clinical and Biological Science, University of Torino), Paola Nardone, Silvia Ciardullo, Daniela Pierannunzio (National Institute of Health), Paola Dalmasso, Lorena Charrier, Rosanna Comoretto, Michela Bersia, Emanuele Koumantakis, Alberto Borraccino (Department of Public Health and Pediatric Sciences, University of Torino), Alessio Vieno, Michela Lenzi, Claudia Marino, Natale Canale (Department of Psychology, University of Padova), Giacomo Lazzeri (Department of Molecular & Developmental Medicine, University of Siena); HBSC Social Inequalities focus group (G. Stevens, Utrecht University; Caroline Residori, Matthias Kern, University of Luxembourg;  Katia Castetbon, Amélie Bellanger, University of Bruxelles; Katarzyna Porwit, University of Warsaw; Lucia Bosakova, Safarik University in Kosice, Slovakia ; Maxim Dierckens, Ghent University; Olga Balakireva, Ukrainan Institute for Social Research, Kiev; Maria-Conception Moreno Maldonato, University of Seville; Colleen Davidson, Queen’s University, Kingston, Canada)

Abstract: Health Behaviour in School-aged Children (HBSC) is an international multicentre study conducted in over 40 countries across Europe and North America, in partnership with the Regional Office for Europe of the World Health Organization (WHO). It is a cross-sectional survey based on a closed-ended questionnaire administered to adolescents in the sampled schools. The population selected for sampling consists of adolescents aged 11, 13 and 15 years. The study aims to gain greater insight into determinants of health and well-being in adolescents so as to better guide (national and international) prevention and health promotion policies targeting young people. In 2022 will start the sixth data collection with an additional set of items focusing on Covid-19 impact on health behaviours.

Currently, from the data collected in latest survey in 2018, the following studies are on-going: (i) the assessment of the association between obesity, physical activity, and greenness in adolescents living in built environment on Italian data; (ii) explore temporal trend health complaints and well-being among Italian adolescents; (iii) assess the detrimental effects that problematic social media use can have on adolescents’ well-being; (iv) validating International Survey items using Eurostat microdata within the International Focus Group on Social Inequalities (chaired by G. Stevens, Utrecht University); (v) developing methodological methods to compare surveys with different level of representativeness

Sector: Machine Learning (MED/01 Statistica Medica)

Funding: Terraria, s.r.l.

Participants: Paola Berchialla, Veronica Sciannameo

Abstract: We have developed a Deep Learning approach for spatio-temporal forecasting of mew cases and new hospitalizations of COVID-19 spread, which has been adopted by the Epidemiology Unit of Reggio-Emilia. We implemented a ConvLSTM, which is a spatio-temporal deep learning approach, to perform a 7-day moving average to forecast the 7th day after. We used as training and validation set the new daily infections and hospitalizations from August 2020 to March 2021. Finally, we assessed the models in terms of Mean Absolute Error compared with Mean Observed Value and Root Mean Squared Error on data from April to September 2021. We tested the performance of different combinations of input variables to find the best forecast model. ConvLSTM achieved good performances in forecasting new SARS-COV-2 infections and new COVID-19 hospitalizations. The spatio-temporal representation allows to borrow strength from data neighboring to forecast at the level of the square cell (12 km)2, getting accurate predictions also at county level, which is paramount to help in optimizing the real-time allocation of health care resources. Data-driven prediction models are often mistakenly used to draw causal effects, but neither their parameters nor their predictions necessarily have a causal interpretation. Therefore, the premise that data-driven prediction models lead to trustable decisions/interventions for precision medicine is questionable. In this project we aim to extend the ConvLSTM model to embed scenario analysis, by means of Deep Learning of Potential Outcomes and Integral Probability Metrics.

Sector: Machine Learning (MED/15 Malattie del Sangue; MED/01 Statistica Medica)

Funding: Pfizer

Participants: Carmen Fava (PI), Berchialla Paola, Sara Urru

Abstract: Philadelphia positive Chronic Myeloid Leukemia (CML) treatment is based on targeted drugs called tyrosine-kinase inhibitors (TKIs), which have dramatically improved long-term survival rates. Although these drugs are generally well tolerated, TKIs are not free from side effects, especially gastrointestinal such as diarrhea, constipation, abdominal pain, malabsorption, bleeding and increase in liver and pancreatic enzymes. In recent years, the study of the human microbiota has acquired increasing importance, due to the great development of the omics sciences. The microbiota influences many biological processes, including participating in drug biotransformation and stimulating immune system development and homeostasis.

The primary objective of the project is to assess the association between genotypes of the intestinal microbiota of patients with CML and response to treatment with TKI.

An integrative analysis framework to investigate patients’ complex risk profiles, arising from multiple data sources, will be developed. We will implement a Deep Belief Network (DBN) to encode relationships among inherent features of each data source (multi-omics data and no-omics data) into multiple layers of hidden variables. A joint latent model will be used to integrate common features from all data sources. Finally, the contrastive divergence learning algorithm will be applied to train the parameters of the DBN model in an unsupervised fashion. To investigate how molecular and biological features cluster together and to derive microbiota subtype, a consensus clustering will be performed on the top hidden layer representations.

Gli attuali progetti di ricerca del gruppo sono incentrati sui seguenti temi:

  • Tecniche di Machine Learning (Intelligenza Artificiale) applicate a dati clinici e dati testuali non strutturati. Nell’ambito di questo tema abbiamo avuto una recente collaborazione con l'Agenzia spaziale europea per prevedere il comportamento epidemico di Covid-19 e stiamo iniziando a lavorare con l’Istituto Tumori della Romagna su analytics su dati sanitari amministrativi per supportare analisi di scenario e sviluppare strategie di valutazione delle politiche.
  • Modelli grafici e apprendimento statistico con applicazione in un'ampia gamma di campi: analisi dei dati raccolti di routine (registri), valutazione quantitativa del rischio, supporto alle decisioni cliniche e phenomapping. Nell’ambito di questo tema abbiamo diverse collaborazioni con gruppi clinici dell’Ospedale Molinette e Regina Margherita e diversi gruppi di ricerca DSCB.
  • Modelli bayesiani gerarchici per l'integrazione di dati provenienti da fonti di dati e Bayesian Model Averaging come approccio all'inferenza in presenza di diversi modelli concorrenti. In questo ambito abbiamo una collaborazione con Trial Clinic Unit dell’Ospedale Mauriziano e la Trial Clinic Unit del Dipartimento di Scienze Cardiache, Toraciche e Vascolari dell'Università di Padova
  • Disegno di studio e analisi bayesiana di studi clinici. Nell’ambito di questo tema di ricerca abbiamo diverse collaborazioni con l’Istituto di Ricerca di Candiolo

L'Unità di Biostatistica fornisce inoltre supporto e assistenza ai gruppi di ricerca del DSCB in tutte le aree di competenza biostatistica/epidemiologica clinica, inclusi il disegno di studio con il calcolo della dimensione campionaria e la potenza statistica e l’analisi statistica dei dati sia clinici che biologici.

L'Unità di Biostatistica è anche referente DSCB per il supporto alla realizzazione di progetti di ricerca su Medcap, il servizio fornito dalla Scuola di Medicina per la raccolta elettronica dei dati. Attualmente sulla piattaforma Medcap stanno attivamente raccogliendo dati i seguenti studi: TKI Discontinuation Registry (studio multicentrico italiano pazienti con leucemia mieloide cronica che discontinuano gli inibitori delle Tirosinchinasi); Vaccinazione Covid-19 in pazienti ematologici (Studio osservazionale sull'impatto clinico del vaccino Covid-19 in pazienti ematologici); Registro Regionale delle mielofibrosi (Studio Osservazionale su pazienti piemontesi con mielofibrosi).

Progetti in corso

Breve descrizione divulgativa dei principali progetti di ricerca del gruppo, avendo cura di sottolinearne razionale e obiettivi.

Settore: Machine Learning in Clinical Research (MED/01 Statistica Medica; MED/06 Oncologia Medica; MED/08 Anatomia Patologia)

Ente finanziatore: Innovo s.r.l., AstraZeneca

Partecipanti al progetto: Paola Berchialla, Veronica Sciannameo, Sara Urru, Elisa Ervas (Innovo, S.r.l), Silvia Novello (Department of Oncology, University of Torino), Luisella Righi (Department of Oncology, University of Torino)

Abstract: Sono attualmente in corso studi di fase III che valutano l'efficacia dell'immunoterapia in aggiunta alla TC in ambito neoadiuvante, utilizzando l'endpoint patologico surrogato della risposta completa (pCR) e la risposta patologica maggiore (mPR) come endpoint primari o secondari. La percentuale di tumore vitale residuo viene identificata sulla colorazione di routine dell'ematossilina e dell'eosina. Negli studi clinici è comune che l'identificazione del tumore vitale residuo sia eseguita da un laboratorio di patologia centrale. Questa fattibilità mira a capire se le informazioni necessarie per la valutazione dell'endpoint surrogato sono riportate nei referti di laboratorio di patologia locale di routine e possono essere utilizzate per osservazioni retrospettive dell'efficacia del trattamento neoadiuvante e per indagare se un algoritmo di elaborazione del linguaggio naturale (intelligenza artificiale) può essere addestrato per trasportare fuori tali letture pCR e mPR sui rapporti di laboratorio. Infine, si valuterà se esiste una differenza tra le valutazioni patologiche di routine eseguite dopo la resezione del tumore di pazienti naïve al trattamento rispetto ai pazienti trattati con neoadiuvante. Fonti di dati: referti post-chirurgici di patologi di pazienti con carcinoma polmonare non a piccole cellule; amministrativo Ospedale S. Luigi.

Settore: Biostatistics (MED/01 Statistica Medica; MED/13 Endocrinologia)

Ente finanziatore: University of Padova

Partecipanti al progetto: Paola Berchialla (Associate Professor), Veronica Sciannameo (Research fellow), Gian Paolo Fadini (Associate Professor, University of Padova)

Abstract: I metodi per generalizzare i risultati degli studi clinici randomizzati (RCT) a una popolazione target si basano sui dati aggregati degli RCT stessi e dati individuali della popolazione target. Il principale limite di questo approccio è che non è in grado di considerare le relazioni probabilistiche tra variabili. I modelli grafici Bayesiani multivariabili possono invece tenere conto delle distribuzioni congiunte di più variabili continue e categoriali.

Per applicare questo metodo, abbiamo ottenuto i dati individuali degli studi REWIND (RCT) e DARWIN-T2D (dati di popolazione target). Combineremo i dati individuali dello studio REWIND e del DARWIN-T2D per modellare le dipendenze tra le variabili nella popolazione target e per stimare la probabilità di essere selezionati nell’RCT  REWIND. L'algoritmo stabile di Peter-Clark volte sarà utilizzato per l'apprendimento strutturale dei modelli grafici Bayesiani, ovvero per identificare le relazioni tra le variabili. Un modello grafico Bayesiano più robusto sarà ottenuto una procedura bootstrap, considerando solo le relazioni tra variabili presenti in almeno il 95% dei modelli. Infine, all'interno dello studio REWIND, valuteremo l'effetto del trattamento trasposto alla popolazione target.

Settore: Machine Learning in Clinical Epidemiology (MED/01 Statistica Medica; MED/13 Endocrinologia)

Ente finanziatore: PhD studentship co-funded by University of Torino, University of Padova

Partecipanti al progetto: Paola Berchialla, Sara Urru

Abstract: Gli studi clinici randomizzati (RCT) sono il disegno di studio di prima scelta per valutare una potenziale relazione causale tra un trattamento e gli esiti del paziente. Tuttavia, nei contesti della pratica clinica, la medicina personalizzata o medicina di precisione, adattata alle caratteristiche del singolo paziente, ha messo in discussione i risultati ottenuti dagli RCT. Il rigido disegno degli studi clinici produce infatti informazioni che sono applicabili a uno spettro relativamente ristretto di pazienti. A questo proposito, alcune delle carenze che la medicina personalizzata cerca di affrontare includono l'analisi delle differenze individuali nella risposta al trattamento, i cosiddetti effetti di eterogeneità. Nella medicina personalizzata, l'attenzione si concentra sull'identificazione di quali approcci/interventi saranno efficaci per i pazienti in base ai loro fattori genetici, ambientali e di stile di vita.

Utilizzando tecniche di machine learning si possono classificare gli individui in sottopopolazioni che differiscono nella loro suscettibilità a una particolare malattia o nella loro risposta a un trattamento specifico. Il progetto si propone di sviluppare modelli di machine learning per la stima dell’effetto di eterogeneità dei trattamenti e di identificare i gruppi di pazienti con esiti differenziati al fine dell’implementazione di un trattamento personalizzati. Un elemento distintivo dei modelli sviluppati sarà la loro capacità di integrare fonti di dati eterogenee. I metodi saranno applicati su dati di sperimentazioni cliniche avviate.

Settore: Survey Methods (MED/01 – Statistica Medica; MED/42 Igiene generale e applicata; M-PSI/04 Psicologia dello Sviluppo e Psicologia dell’Educazione)

Ente finanziatore: Independent research within International Consortium

Partecipanti al progetto: Paola Berchialla (Department of Clinical and Biological Science, University of Torino), Paola Nardone, Silvia Ciardullo, Daniela Pierannunzio (National Institute of Health), Paola Dalmasso, Lorena Charrier, Rosanna Comoretto, Michela Bersia, Emanuele Koumantakis, Alberto Borraccino (Department of Public Health and Pediatric Sciences, University of Torino), Alessio Vieno, Michela Lenzi, Claudia Marino, Natale Canale (Department of Psychology, University of Padova), Giacomo Lazzeri (Department of Molecular & Developmental Medicine, University of Siena); HBSC Social Inequalities focus group (G. Stevens, Utrecht University; Caroline Residori, Matthias Kern, University of Luxembourg;  Katia Castetbon, Amélie Bellanger, University of Bruxelles; Katarzyna Porwit, University of Warsaw; Lucia Bosakova, Safarik University in Kosice, Slovakia ; Maxim Dierckens, Ghent University; Olga Balakireva, Ukrainan Institute for Social Research, Kiev; Maria-Conception Moreno Maldonato, University of Seville; Colleen Davidson, Queen’s University, Kingston, Canada)

Abstract: Health Behaviour in School-aged Children (HBSC) è uno studio multicentrico internazionale condotto in oltre 40 paesi in Europa e Nord America, in collaborazione con l'Ufficio regionale per l'Europa dell'Organizzazione mondiale della sanità (OMS). Si tratta di un'indagine trasversale basata su un questionario a risposta chiusa somministrato agli adolescenti nelle scuole campionate. La popolazione selezionata per il campionamento è composta da adolescenti di 11, 13 e 15 anni. Lo studio mira a ottenere una maggiore comprensione dei determinanti della salute e del benessere negli adolescenti in modo da guidare meglio le politiche (nazionali e internazionali) di prevenzione e promozione della salute rivolte ai giovani. Nel 2022 inizierà la sesta raccolta di dati con un ulteriore set di voci incentrate sull'impatto del Covid-19 sui comportamenti sanitari.

Attualmente, dai dati raccolti nell'ultima indagine del 2018, sono in corso i seguenti studi: (i) la valutazione dell'associazione tra obesità, attività fisica e verde negli adolescenti che vivono in ambiente costruito su dati italiani; (ii) esplorare l'andamento temporale dei disturbi e del benessere degli adolescenti italiani; (iii) valutare gli effetti dannosi che l'uso problematico dei social media può avere sul benessere degli adolescenti; (iv) convalida degli elementi dell'indagine internazionale utilizzando i microdati Eurostat nell'ambito dell'International Focus Group sulle disuguaglianze sociali (presieduto da G. Stevens, Università di Utrecht); (v) sviluppare metodi metodologici per confrontare indagini con diverso livello di rappresentatività statistica.

Settore: MED-01

Ente finanziatore: Terraria, s.r.l.

Partecipanti al progetto: Paola Berchialla, Veronica Sciannameo

Abstract: Abbiamo sviluppato un approccio di Deep Learning per la previsione spazio-temporale dei nuovi casi e dei nuovi ricoveri di COVID-19, che è stato adottato dall’Azienda Unità Sanitaria Locale-Istituto di Ricovero e Cura a Carattere Scientifico di Reggio Emilia. Abbiamo implementato un modello ConvLSTM, che è un approccio di deep learning con una componente spazio-temporale, per fare una previsione a 7 giorni dell’andamento dell’epidemia. Abbiamo utilizzato come set di addestramento e validazione del modello i casi ed i ricoveri giornalieri da agosto 2020 a marzo 2021. Infine, abbiamo testato il modello in termini di errore medio assoluto sui dati da aprile a settembre 2021. Abbiamo testato le prestazioni di diverse combinazioni di variabili di input per selezionare il miglior modello di previsione. ConvLSTM ha ottenuto buone performance nella previsione di nuove infezioni da SARS-COV-2 e nuovi ricoveri per COVID-19. La rappresentazione spazio-temporale permette di sfruttare la distribuzione geografica dei dati vicini ad un livello di precisione di 12 km 2, ottenendo previsioni accurate anche a livello provinciale, fondamentale per aiutare a ottimizzare l'allocazione in tempo reale delle risorse per l'assistenza sanitaria. I modelli di previsione basati sui dati sono spesso utilizzati erroneamente per trarre effetti causali, ma le loro previsioni hanno necessariamente un'interpretazione causale. In questo progetto miriamo ad estendere il modello ConvLSTM per incorporare l'analisi di scenario, mediante l’introduzione degli outcome potenziali e metodi di Integral Probability Metrics.

Settore: Machine Learning (MED/15 Malattie del Sangue; MED/01 Statistica Medica)

Ente finanziatore: Pfizer

Partecipanti al progetto: Carmen Fava (PI), Berchialla Paola, Sara Urru

Abstract: Il trattamento della leucemia mieloide cronica (CML) positiva a Filadelfia si basa su farmaci mirati chiamati inibitori della tirosin-chinasi (TKI), che hanno notevolmente migliorato i tassi di sopravvivenza a lungo termine. Sebbene questi farmaci siano generalmente ben tollerati, i TKI non sono esenti da effetti collaterali, soprattutto gastrointestinali come diarrea, costipazione, dolore addominale, malassorbimento, sanguinamento e aumento degli enzimi epatici e pancreatici. Negli ultimi anni lo studio del microbiota umano ha acquisito sempre maggiore importanza. Il microbiota influenza molti processi biologici, inclusa la partecipazione alla biotrasformazione dei farmaci e la stimolazione dello sviluppo del sistema immunitario e dell'omeostasi.

L'obiettivo principale del progetto è valutare l'associazione tra i genotipi del microbiota intestinale di pazienti con CML e la risposta al trattamento con TKI.

A tale scopo verrà sviluppata un quadro di analisi integrativa per indagare i complessi profili di rischio dei pazienti, derivanti da molteplici fonti di dati. Implementeremo una Deep Belief Network (DBN) per codificare le relazioni tra le caratteristiche intrinseche di ciascuna fonte di dati (dati multi-omici e dati non-omici) in più livelli di variabili nascoste. Verrà utilizzato un modello latente congiunto per integrare caratteristiche comuni da tutte le fonti di dati. Infine, l'algoritmo di apprendimento della divergenza contrastiva verrà applicato per addestrare il modello DBN in modo non supervisionato. Per studiare come le caratteristiche molecolari e biologiche si raggruppano insieme e per derivare i sottotipi del microbiota potenzialmente associati agli outcome clinici, verrà applicato un approccio basato sul consensus clustering.

Prodotti della ricerca

Berchialla, P., Sciannameo, V., Urru, S., Lanera, C., Azzolina, D., Gregori, D., & Baldi, I. (2021). Adjustment for baseline covariates to increase efficiency in RCTs with binary endpoint: A comparison of Bayesian and frequentist approaches. International Journal of Environmental Research and Public Health, 18(15). https://doi.org/10.3390/ijerph18157758

Sciannameo, V., Berchialla, P., Avogaro, A., Fadini, G. P., & Network, D.‑ (2021). Transposition of cardiovascular outcome trial effects to the real‑world population of patients with type 2 diabetes. Cardiovascular Diabetology, 20(1), 103. https://doi.org/10.1186/s12933-021-01300-y

Berchialla, P., Chiffi, D., Valente, G., & Voutilainen, A. (2021). The power of meta‑analysis: A challenge for evidence‑based medicine. European Journal for Philosophy of Science, 11(1). https://doi.org/10.1007/s13194-020-00321-w

Berchialla, P., Zohar, S., & Baldi, I. (2019). Bayesian sample size determination for phase IIA clinical trials using historical data and semi‑parametric prior’s elicitation. Pharmaceutical Statistics, 18(2), 198–211 https://doi.org/10.1002/pst.1914

Lanera, C., Berchialla, P., Sharma, A., Minto, C., Gregori, D., & Baldi, I. (2019). Screening PubMed abstracts: Is class imbalance always a challenge to machine learning? Systematic Reviews, 8(1). https://doi.org/10.1186/s13643-019-1245-8

Ultimo aggiornamento: 16/02/2022 15:55
Non cliccare qui!