Titelaufnahme

Titel
Random Forest based in vivo tumor characterization from PET and CT images / Vorgelegt von: Spielvogel Clemens
Weitere Titel
Random Forest basierte in vivo Tumorcharakterisierung anhand von PET- und CT-Bildern
AutorInnenSpielvogel, Clemens
GutachterHolzmann, Gerald
Erschienen2018
HochschulschriftWien, FH Campus Wien, Masterarb., 2018
Anmerkung
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers
Datum der AbgabeJuni 2018
SpracheEnglisch
DokumenttypMasterarbeit
Schlagwörter (DE)Maschinelles Lernen / Medizinische Bildgebung / Krebs / Tumor / Glioma / Brustkrebs / Random Forest / Algorithmus / C++ / Softwareentwicklung / Medizin
Schlagwörter (EN)Machine Learning / Medical Imaging / Cancer / Tumor / Glioma / Breast cancer / Random Forest / Algorithm / C++ / Softwaredevelopment / Medicine
URNurn:nbn:at:at-fhcw:1-4353 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Random Forest based in vivo tumor characterization from PET and CT images [3.07 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Hintergrund

Krebs zählt weltweit zu den häufigsten Todesursachen. Die Fortschritte im Bereich des maschinellen Lernens haben gezeigt, dass diese Techniken ein potentiell hilfreiches Werkzeug zur Diagnose, Prognose und der Behandlung von Krebs darstellen. Die medizinische Bildgebung stellt aufgrund seiner nicht-invasiven Abläufe eine vielversprechende Datenquelle für die Anwendung von maschinellem Lernen bei der Tumorcharakterisierung dar. Eine mögliche Herangehensweise dieser, auf dem maschinellen Lernen basierten Strategien, ist die Verwendung von quantitativen Attributen, welche mithilfe der Positronen-Emissions-Tomographie und der Positronen-Emissions-Tomographie/Computertomographie gewonnen wurden.

Zielsetzung

Das Ziel dieser Studie war die Anwendung des Random Forest (RF) Algorithmus für die Vorhersage von Überlebensraten in Glioma Patienten, sowie die Vorhersage von entscheidenden Indikatoren, welche für die Auswahl der Behandlungsmethode für Brustkrebspatientinnen herangezogen werden. Diese Indikatoren inkludieren Estrogenrezeptorstatus, Progesteronrezeptorstatus, humanen epidermalen Wachstumsrezeptorstatus, den Ki-67 Proteinstatus und das Tumorgrading. Weiters war es das Ziel dieser Studie, den RF Algorithmus mithilfe mehrerer neu entwickelter Ansätze zu verbessern. Die Leistung dieses erweiterten RFs wurde anschließend mit dem originalen RF verglichen, sowie mit einem weiteren Algorithmus, welcher bereits erfolgreich für die Tumorcharakterisierung verwendet wurde. Zusätzlich wurden Messungen zur Einschätzung der Bedeutung der Attributgruppen vorgenommen und einen Einblick in deren Vorhersageleistung zu erhalten.

Material

Es wurden 41 PET-Bild basierte, ex vivo und generelle Patientenattribute von 70 Gliomapatienten in die Vorhersage der Überlebensdauer miteinbezogen. Für die Vorhersage der Brustkrebsindikatoren wurden 112 PET/CT basierte Attribute von 138 weiblichen Patienten generiert. Alle resultierenden Datensätze waren höchst unausgewogenen bezüglich ihrer vorherzusagenden Klassen.

Ergebnisse und Fazit

Die Messung der Attributbedeutung legt eine hohe Gewichtung der Vorhersageleistung von generellen Patientenattributen, gefolgt von ex vivo Attributen und in vivo Attributen nahe. Für den Brustkrebsdatensatz zeigte die Attributbedeutungsmessung eine hohe Vorhersageleistung der Computertomographiemodalität. Bezüglich der Vorhersage anhand des Gliomadatensatzes, wurde die beste Vorhersage mithilfe von Kerndichteschätzern in Kombination mit einem gleichmäßigen Baggingansatz erreicht. Die Vorhersagegenauigkeit lag bei 0.92, die Fläche unter der Grenzwertoptimierungskurve lag bei 0.92 und die Grenzwertoptimierungskurvendistanz bei 0.14. Der erweiterte RF führte damit zu leicht besseren Ergebnissen im Vergleich zum genetischen Algorithmus mit Nelder-Mead Optimierung. Die Algorithmen mit der besten Vorhersageleistung bezüglich des Brustkrebsdatensatzes waren alle Version des erweiterten RFs. Trotzdem muss die Vorhersageleistung des resultierenden Modells weiter verbessert werden um klinisch relevante Ergebnisse zu liefern.

Zusammenfassung (Englisch)

Background

Cancer is one of the leading causes of death worldwide. Recent advances in machine learning have been proven to be a potentially powerful tool to improve the diagnosis, prognosis and treatment of cancers. Due to its non-invasive nature, medical imaging provides a promising data source for the application of machine learning in the characterization of tumors. One possible approach for these machine learning based strategies is the use of quantitative features derived from positron emission tomography (PET) and PET/computed tomography (PET/CT) images.

Objectives

The aim of this study was to apply the random forest (RF) machine learning algorithm for the prediction of survival in glioma patients and the prediction of treatment decision markers in breast cancer patients. The markers included estrogen receptor (ER) status, progesterone receptor (PR) status, human epidermal growth factor 2 (HER2) status, Ki-67 (Ki-67 protein) status and tumor grading. Additionally, the study's aim was the improvement of the RF using several newly developed approaches. This extended RFs performance was subsequently compared to the original RF and another algorithm which previously has successfully been used for tumor characterization. Further, feature importance measurements were conducted to gain insights on the predictive power of the different feature categories used for the analysis.

Material

41 PET image-derived, ex vivo and general patient features from 70 glioma patients were included in the survival prediction. For the prediction of the breast cancer markers, 112 PET/CT image derived features were acquired from 138 female patients. All breast cancer data sets were highly imbalanced with respect to their labels.

Results and Conclusion

Feature importance measurements indicated a strong predictive power of general patient features for modelling glioma survival, followed by ex vivo features and in vivo features. For the breast cancer data, the feature importance suggested CT to be the modality with the highest predictive power. For the glioma data, the kernel density estimation (KDE)-based feature selection in combination with an equalized bagging approach led to the best results. Accuracy (ACC) was 0.92, area under the receiver operating curve (AUC) 0.92 and receiver operating curve distance (ROCD) was 0.14. Using these new abilities, the extended RF was able to slightly outperform the genetic algorithm with Nelder-Mead optimization (GANM). The best performing algorithms on the breast cancer data sets were all extended RFs. Nevertheless, the predictive performance of the resulting models has to be further improved to reach clinically relevant levels.

Statistik
Das PDF-Dokument wurde 4 mal heruntergeladen.
Lizenz
CC-BY-Lizenz (4.0)Creative Commons Namensnennung 4.0 International Lizenz