Abstract | Alzheimerova bolest karakterizirana kao stanje progresivnog gubitka
kognitivnih funkcija, uključujući pamćenje, orijentaciju i prosuđivanje,
predstavlja vodeći oblik demencije u svijetu. Iako točan uzrok bolesti još
nije potpuno razjašnjen, ključni patološki mehanizmi bolesti uključuju
nakupljanje izvanstaničnih beta-amiloidnih plakova i hiperfosforiliranog Tau
proteina unutar živčanih stanica, što dovodi do neurofibrilarnih čvorova sa
posljedicom atrofije mozga i odumiranjem živčanih stanica te gubitkom
neurona i sinapsi. Cilj ovog diplomskog rada bio je istražiti potrencijalne
genetske markere i klasificirati status Alzheimerove bolesti pomoću
strojnog učenja, korištenjem podataka dobivenih RNA sekvenciranjem
pojedinačnih stanica (scRNA-seq). Visoko-propusno RNA sekvenciranje na
pojedinačnim stanicama revolucionarna je tehnika koja je omogućila
analizu cijelokupnog transkripcijskog profila pojedinačnih stanica u velikom
obujmu, što je ključna prednost u proučavanju heterogenosti stanica u
kompleksnim tkivima poput mozga. Za potrebe rada podatci RNA
sekvenciranja pojedinačnih stanica entorinalnog korteksa i superiornog
frontalnog girusa mozga post mortem (Braak stadiji 0, 2 i 6) bili su
prikupljeni i prethodno obrađeni korištenjem računalnog alata Seurat.
Uporabom alata strojnog učenja kao što su modeli logističke regresije i
nasumičnih šuma, analizirali smo podatke kako bi identificirali ključne gene
i signalne puteve povezane s progresijom bolesti. Analizom podataka
identificirali smo nekoliko gena kao potencijalne markere ovisno o stadiju
bolesti poput UTP8 gena za ranij stadij ili HNRNPH1, RPL10A i CLOCK gene
za kasniji stadij bolesti. |
Abstract (english) | Alzheimer’s disease, characterized by the progressive loss of cognitive
functions, including memory, orientation, and judgment, represents the
leading form of dementia worldwide.
Although the exact cause of the disease remains unclear, key pathological
mechanisms include the accumulation of extracellular beta-amyloid plaques
and hyperphosphorylated Tau protein within neurons, leading to
neurofibrillary tangles, brain atrophy, neuronal death, and the loss of
neurons and synapses. The aim of this thesis was to investigate potential
genetic markers and classify Alzheimer’s disease status using machine
learning, based on data obtained from single-cell RNA sequencing (scRNAseq). High-throughput single-cell RNA sequencing is a revolutionary
technique that has enabled the large-scale analysis of the entire
transcriptional profile of individual cells, which is a key advantage in
studying the heterogeneity of cells in complex tissues such as the brain.
For the purposes of this study, RNA sequencing data from single cells of
the entorhinal cortex and superior frontal gyrus of post-mortem brains
(Braak stages 0, 2, and 6) were collected and preprocessed using the
computational tool Seurat. Using machine learning tools such as logistic
regression models and random forests, we analyzed the data to identify
key genes and signaling pathways associated with disease progression. Our
analysis identified several genes as potential markers depending on the
disease stage, such as the UTP8 gene for earlier stages and the HNRNPH1,
RPL10A, and CLOCK genes for advanced stages. |