O projekcie
FAZA 1
Kluczowym zagadnieniem badawczym pierwszej fazy projektu będzie opracowanie referencyjnego zbioru danych obrazowych, złożonego z obrazów mpMRI gruczołu stercza wraz pełnym opisem medycznym oraz zbiorem adnotacji. Docelowo planuje się retrospektywny zbiór danych o wielkości 400-600 przypadków. Ta część prac realizowana będzie przy współpracy z Dolnośląskim Centrum Onkologii we Wrocławiu. Na etapie wspólny zespół radiologów, klinicystów oraz badaczy opracuje kryteria włączenia pacjentów do bazy danych, odnoszące się do podstawowych założeń projektu. Określone zostaną grupy badawcze (pacjentów z istotnymi i nieistotnymi klinicznie zmianami w gruczole prostaty) wraz z ich oczekiwaną licznością oraz innymi kryteriami charakteryzującymi rozkład pacjentów w grupach (wiek, stężenie PSA w surowicy, wynik badania per rectum, zmiany w określonych strefach prostaty itp.).
Pacjenci (grupa retrospektywna) wybrani zostaną spośród chorych, którym w Dolnośląskim Centrum Onkologii wykonano biopsję stercza (w latach 2017 – 2021) i dla których dostępne są badania mpMRI. Z dostępnej grupy badań w DCO nastąpi wyselekcjonowanie optymalnej grupy pacjentów zgodnie z założeniami dla poszczególnych grup badawczych. Przeprowadzana zostanie pełna weryfikacja poprawności danych wraz z określeniem, czy badania obrazowe są kompletne oraz poprawne jakościowo. Pod kierunkiem eksperta (klinicysty), w oparciu o dokumentację historyczną, przygotowany zostanie szczegółowy opis medyczny przypadków zgromadzonych w bazie danych, zawierający informację o podejrzeniu i wstępnym rozpoznaniu (historyczna ocena PI-RADS), diagnozie (rodzaj histopatologiczny nowotworu i histologiczne czynniki ryzyka wznowy i rozsiewu, klasyfikacja TNM, stopień złośliwości, liczba ognisk w gruczole), prognozie (grupa ryzyka wg EAU, oczekiwana długość życia wg WHO), współchorobowości i przyjmowanych lekach oraz podjętej terapii i jej efektach i skutkach. Zebrane zostaną także dostępne historyczne dane kliniczne (historyczne wartości PSA, poprzednie zabiegi na sterczu, czynniki ryzyka itp.).
Dane obrazowe zostaną poddane pełnej anonimizacji wraz z połączeniem danych z różnych formatów celem przygotowania kompletnych, spójnych przypadków do bazy danych. Tak przygotowane dane będą sukcesywnie przekazywane do włączenia do bazy danych, gdzie będą musiały przejść proces dalszej adnotacji. Proces adnotacji danych zakłada wykonanie obrysów gruczołu prostaty oraz obrysów zmian na odpowiednich sekwencjach i warstwach każdego badania mpMRI. Obrysy wykonywane będą na zewnętrznej platformie MD.ai, umożliwiającej tworzenie wysokiej jakości zestawów danych treningowych i walidacyjnych z etykietami. Dodatkowo każda zmiana zostanie opisana w sposób ustrukturyzowany, poprzez wykorzystanie standaryzowanego leksykonu pojęć zgodnego z PI-RADS. Do adnotacji strukturalnej wykorzystany zostanie szablon raportu strukturalnego dostępny na platformie eRADS, rozwijanej w OPI PIB. Adnotacja danych wykonywana będzie równolegle przez trzech niezależnych radiologów posiadających doświadczenie w opisie badań mpMRI prostaty oraz ocenie zmian w skali PI-RADS.
W pierwszej fazie nastąpi także dobór odpowiednich modeli uczenia maszynowego w relacji do różnych form komputerowej analizy obrazów mpMRI gruczołu stercza. Wykonane zostaną prace badawcze o charakterze przeglądowym (przegląd literaturowy, ustalenie state-of-the-art) oraz dopasowanie metod i architektur rozwiązań z obszaru uczenia maszynowego do specyfiki rożnych scenariuszy użycia. Wiarygodna ocena tworzonych rozwiązań wymaga zdefiniowania kryteriów ich oceny, doboru odpowiednich miar porównawczych, reguł walidacji oraz ustalenia poziomów akceptacji rozwiązań.
Na poziomie rozwoju systemu raportowania strukturalnego, w pierwszej fazie projektu opracowana zostanie koncepcja działania systemu oraz założenia dla rozwiązania proof of concept. Wypracowane muszą zostać założenia funkcjonalne i niefunkcjonalne działania systemu, w tym adaptacja funkcjonowania systemu do obsłużenia wszystkich scenariuszy użycia. Opracowana zostanie wstępna wersja systemu, posiadająca podstawowe funkcjonalności (integracja z bazą danych obrazowych, wykonanie raportu strukturalnego), bez integracji z algorytmami analizy obrazów.
FAZA 2
Główny problem badawczy tej fazy dotyczyć będzie uczenia wstępnie opracowanych modeli pokrywających różne scenariusze użycia przy wykorzystaniu pełnej bazy danych i odpowiednio przygotowanych zbiorów uczących i testowych. Zakłada się także wykonanie optymalizacji modeli, a w przypadku nieosiągnięcia akceptowalnych wyników efektywności modeli, poszukiwanie rozwiązań alternatywnych. Prace koncentrować będą się na zasadniczym rozwoju algorytmów analizy obrazów mpMRI prostaty. Algorytmy te z założenia wpisują się w różne obszary aplikacyjne, które określają przykładowe scenariusze użycia wspomagające pracę radiologa. Można je scharakteryzować w następujący sposób:
1. Automatyczna segmentacja gruczołu stercza.
Tradycyjny pomiar objętości gruczołu prostaty oparty jest zwyczajowo na pomiarach trzech długości (maks. wymiar przednio-tylny, maks. wymiar poprzeczny oraz maks. wymiar podłużny) oraz przybliżonej estymacji objętości ze wzoru na standardową wydłużoną elipsę. Podejście to stosowane jest z uwagi na ogromną czasochłonność procesu manualnej segmentacji gruczołu prostaty, jednak w naturalny sposób obarczone jest pewnym błędem przybliżenia, co przenosi się z kolei na błąd estymacji gęstości PSA, stanowiącego istotny marker prognostyczny wystąpienia raka prostaty. Automatyczna segmentacja gruczołu prostaty pozwala na szybką i precyzyjną ocenę objętości i gęstości PSA. Ponadto regiony obrazów z automatycznie wysegmentowaną prostatą mogą stanowić wejście dla kolejnych algorytmów.
2. Automatyczna detekcja zmian.
Detekcja zmian na obrazach mpMRI jest zadaniem trudnym, wymagającym dużego doświadczenia. Detekcja zmian może odbywać się według różnych schematów – począwszy od punktowego wskazywania potencjalnej lokalizacji (np. centrum zmiany), przez dostarczanie informacji o przestrzennym prawdopodobieństwie jej występowania (np. heatmapy obrazujące rozkład prawdopodobieństwa), aż po pełną segmentację regionów zmian (pełne maski segmentacji dostarczające informacji o rozległości i objętości zmian).
3. Automatyczne rozpoznawanie zmian.
Najprostszym wynikiem działania algorytmów rozpoznawania może być klasyfikacja binarna – zmiana istotna lub nieistotna klinicznie. Alternatywną wersję stanowi automatyczne przypisanie wartości w skali PI-RADS, co bardziej odpowiada realnemu scenariuszowi pracy radiologa. W przypadku automatycznego rozpoznawania zmian szczególnie istotny staje się problem wyjaśnialności decyzji algorytmów. Alternatywną wersją rozpoznania może być wieloklasowe wyjście z algorytmu, w którym poszczególne wyjścia skojarzone są z rozpoznaniem określonych cech zmian. Ocena PI-RADS stanowi wypadkową określonych cech zmian na różnych sekwencjach mpMRI, przy dodatkowym uwzględnieniu informacji o ich lokalizacji. Wyniki rozpoznania cech można zatem przełożyć na finalną ocenę zmian (np. poprzez wykorzystanie zestawu reguł decyzyjnych), co prowadzi do bardziej wiarygodnego określenia ich istotności klinicznej lub uwiarygodnienia wcześniejszego, automatycznego przypisania wartości PI-RADS uprzednio wykrytym zmianom.
4. Automatyczne określanie zaawansowania zamian.
W przypadku diagnostyki opartej o obrazowanie mpMRI rzeczywista ocena zawansowania procesu nowotworowego dokonywana jest poprzez biopsję i ocenę histopatologiczną w skali Gleasona. Współczesne możliwości analizy radiomicznej obrazów otwierają nowe perspektywy stratyfikacji zaawansowania procesów nowotworowych bezpośrednio z danych obrazowych. Radiomika polega na wyodrębnieniu dużej liczby cech z obrazów radiograficznych, tzw. cech radiomicznych, które mogą ujawniać cechy procesów patologicznych, niewidoczne gołym okiem na obrazach. Połączenie radiomiki oraz siły uczenia maszynowego pozwala, poprzez analizę dużych zbiorów obrazów, konstruować i wyodrębniać sygnatury radiomiczne, których mapowanie dystrybucji w przestrzeni obrazów, pozwala tworzyć mapy obszarów o zróżnicowanej charakterystyce lub stopniu progresji zmian.
5. Automatyczne wyszukiwanie przypadków podobnych oraz śledzenie progresji.
W klasycznym ujęciu podejście CBIR (ang. content-based image retrieval) pozwala na wyszukiwanie w bazie danych obrazowych przypadków wizualnie podobnych. Wykorzystanie automatycznego rozpoznawania, które poprzez analizę obrazową i zastosowanie metod uczenia maszynowego rozpoznaje określone cechy zmian, może być wykorzystane jako element definiujący profil przypadków o określonych cechach wizualnych. Z uwagi na fakt, że określone kombinacje cech przekładają się na różne oceny PI-RADS, zastosowanie takiego profilu do wyszukiwania przypadków podobnych powinno prowadzić do selekcji przypadków o podobnym zaawansowaniu procesu nowotworowego. W przypadku oceny tych samych pacjentów w różnych chwilach czasowych, profil taki może posłużyć do oceny stopnia progresji zmian.
Dla każdego z algorytmów przygotowane zostaną indywidualne zbiory danych uczących i treningowych w oparciu o technikę stratyfikacji. Warto zauważyć, że w zbiorze danych występować będą przypadki o bardzo zróżnicowanych atrybutach, takich jak zróżnicowany wiek, zróżnicowana ocena PI-RADS, zróżnicowana lokalizacja zmian w strefach prostaty itd. Losowy podział danych na zbiory uczące i testowe może prowadzić do kumulacji w ramach jednego zbioru przypadków, np. o podobnej lokalizacji zmian w prostacie. Aby w pełni kontrolować proces tworzenia zbiorów uczących i testowych wytworzone zostaną algorytmy stratyfikacji, które będą dobierać optymalny podział danych do zbiorów, dbając o ich odpowiednie zbalansowanie i reprezentatywność.
W obszarze bazy danych obrazowych, w drugiej fazie projektu nastąpi rozszerzenie referencyjnego zbioru danych obrazowych, złożonego z obrazów mpMRI gruczołu stercza. Celem jest pozyskanie nowych przypadków z innych źródeł (innych ośrodków), które pozwolą zadbać o generalizację opracowywanych modeli analizy obrazów. Plan prac obejmuje zgromadzenie 150-300 nowych badań z najlepiej dwóch różnych ośrodków. Adnotacja danych zostanie wykonana przy uwzględnieniu tej samej metodologii co w przypadku bazy podstawowej. Obrysy adnotowane będą na zewnętrznej platformie MD.ai, umożliwiającej tworzenie wysokiej jakości zestawów danych treningowych i walidacyjnych z etykietami. Każda zmiana zostanie opisana w sposób ustrukturyzowany, poprzez wykorzystanie standaryzowanego leksykonu pojęć zgodnego z PI-RADS. Do adnotacji strukturalnej wykorzystany zostanie szablon raportu strukturalnego dostępny na platformie eRADS, rozwijanej w OPI PIB. Adnotacja danych wykonywana będzie równolegle przez trzech niezależnych radiologów posiadających doświadczenie w opisie badań mpMRI prostaty oraz ocenie zmian w skali PI-RADS.
W drugiej fazie nastąpi także kontynuacja prac nad rozwojem systemu raportowania strukturalnego, przede wszystkim poprzez integrację z modelami pozwalającymi dokonać analizy obrazów mpMRI.
FAZA 3
Główne prace trzeciej fazy koncentrować będą się na finalnej optymalizacji systemu poprzez uwzględnienie dodatkowych funkcjonalności oraz przygotowanie wersji, która będzie przedmiotem wdrożenia (platformy e-learningowej). System zostanie uzupełniony o zaktualizowane modele rozpoznawania obrazów (o potencjalnie poprawionej zdolności do generalizacji). Udoskonalona zostanie też funkcjonalność generacji raportu badania poprzez dodanie do opisu strukturalnego różnych wyników wspomagania, przedstawionych w sposób zapewniający możliwie pełną wyjaśnialność ich efektów działania. Dalszym elementem prac realizowanych w ramach tego zadania będzie przygotowanie wersji systemu, która będzie przedmiotem wdrożenia. Według założeń projektu, wdrożeniu podlegać będzie wersja systemu stanowiąca platformę e-learningową. Platforma zapewniać będzie każdemu zalogowanemu użytkownikowi dostęp do przypadków zgormadzonych w bazie, z wydzielonymi oddzielnie przypadkami do nauki oraz do treningu. Platforma dostarczy także funkcjonalności śledzenia swoich postępów oraz porównania swoich wyników z wynikami innych użytkowników.
Na platformie e-learnigowej planuje się dostępność różnych scenariuszy edukacyjnych.
1. Scenariusz atlasu przypadków (wykorzystanie samej bazy przypadków).
Klasyczny scenariusz przeglądania wybranych przypadków z bazy, w którym oglądając przypadek (dane obrazowe przeglądane są w zintegrowanej z systemem i platformą przeglądarce DICOM) mamy dostęp do klasycznego opisu przypadku zawierającego informacje o diagnozie (rozpoznane ogniska wraz z oceną PI-RADS, wyniki biopsji) i podjętej terapii.
2. Scenariusz atlasu przypadków z raportem strukturalnym z systemu oraz wynikami wspomagania algorytmami AI.
W scenariuszu tym, oglądając wybrany przypadek z bazy, obok klasycznego opisu przypadku prezentowany jest także pełen raport z systemu raportowania strukturalnego, zintegrowany z wynikami zaimplementowanych w systemie algorytmów analizy obrazów mpMRI. W raporcie wszystkie istotne ogniska opisane są w sposób standaryzowany, ze wskazaniem ich kluczowych cech według słownika PI-RADS. Raport zawiera dodatkowo m.in. mapy wskazujące potencjalne lokalizacje zmian, automatyczną sugestię oceny PI-RADS, sugestię oceny istotności klinicznej. Wszystkie te elementy są wynikiem działania dostępnych w systemie algorytmów analizy obrazów mpMRI. Radiolog może zatem skonfrontować wynik działania systemu raportowania (raport strukturyzowany wspomagany AI) z danymi historycznymi i własnymi przypuszczeniami co do oceny danego przypadku.
3. Scenariusz interaktywnej pracy w systemie bez wspomagania AI.
W scenariuszu tym odchodzimy od pracy atlasowej na rzecz pracy własnej z różnymi przypadkami. Radiolog najpierw sam ogląda przypadek i dokonuje opisu badania w systemie raportowania strukturalnego (oznacza zmiany, wskazuje ich cechy, określa ocenę PI-RADS). Dopiero po skończeniu opisu przypadku, efekt pracy radiologa jest walidowany z danymi referencyjnymi dostępnymi w systemie. Radiolog może skonfrontować swój raport (wygenerowany automatycznie przez system na podstawie wprowadzonych danych i oznaczonych na formularzu raportu cech zmian) z raportem referencyjnym oraz porównać różnice i rozbieżności. W tym scenariuszu nie są dostępne wyniki wspomagania algorytmami AI, a raport tworzony jest jedynie w oparciu o formularz raportu strukturyzowanego, standaryzowany według PI-RADS.
4. Scenariusz interaktywnej pracy w systemie ze wspomaganiem AI.
Scenariusz ten jest podobny do poprzedniego. Kluczowa różnica polega na wykorzystaniu podczas pracy własnej z przypadkiem nie tylko formularza raportu strukturalnego, ale także dodatkowych podpowiedzi generowanych przez algorytmy analizy obrazów mpMRI (mapy wskazujące potencjalną lokalizację zmian, automatyczną sugestię oceny PI-RADS, sugestię oceny istotności klinicznej itd.). Radiolog może skonfrontować swój raport (wygenerowany automatycznie przez system na podstawie wprowadzonych danych, oznaczonych na formularzu raportu cech zmian oraz wyników automatycznej analizy obrazów) z raportem referencyjnym oraz ocenić, na ile elementy wspomagania AI pomogły mu w podjęciu decyzji.
5. Scenariusz wyszukiwania przypadków podobnych.
W oparciu o dostępną podobną funkcjonalność w systemie raportowania strukturalnego, system e-learningowy umożliwi wyszukiwanie przypadków podobnych. Platforma stanowi rolę pośrednika w łączeniu się z systemem przez zalogowanych użytkowników. Kluczowym do opracowania elementem jest zatem integracja platformy e-learnigowej z systemem raportowania strukturalnego, która pozwoli wykorzystać wszystkie funkcjonalności systemu, realizowane jednak w scenariuszu kształcenia, a nie w scenariuszu realnej pracy diagnostycznej.
W trzeciej fazie nastąpi także szereg prac przedwdrożeniowych. Podjęta zostanie próba klasyfikacji systemu jako wyrobu medycznego wraz z jego kwalifikacją do określonej klasy oraz uzyskania oznakowania CE. Przeprowadzone zostaną także testy finalnego rozwiązania. Docelowa wersja systemu zostanie przekazana do testów w środowisku medycznym. Procedura weryfikacji systemu obejmuje selekcję grupy przypadków do weryfikacji. Docelowa grupa to około 200 pacjentów Weryfikację systemu raportowania poprzez procedurę analizy wskazań systemu i raportowania rozbieżności. Eksperci porównają historyczne dane pacjenta (opis badania mpMRI, oszacowaną objętość prostaty, liczbę opisanych ognisk w gruczole, ocenę PI-RADS dla ognisk, wyniki biopsji i klasyfikacji TMN) z informacjami dostępnymi we wstępnej wersji raportu z systemu, które powstają poprzez wykorzystanie opracowanych algorytmów analizy obrazów mpMRI. Dane historyczne zostaną zatem porównane z wynikiem automatycznej segmentacji gruczołu prostaty (automatycznego szacowania objętości), algorytmami automatycznego rozpoznawania zmian i automatycznej klasyfikacji PI-RADS. Eksperci odnotują rozbieżności pomiędzy danymi historycznymi a danymi z systemu raportowania strukturalnego. W przypadku automatycznego rozpoznawania cech zmian (dane te mogą nie być dostępne w historii pacjenta), eksperci ocenią, czy zgadzają się ze wskazaniami systemu, a w przypadkach spornych, wskażą w których cechach nastąpiły rozbieżności. W ramach prac przedwdrożeniowych przeprowadzone zostaną także testy UX. Testy wykonane zostaną przez OPI PIB w Laboratorium Interaktywnych Technologii, które dysponuje niezbędnymi zasobami sprzętowymi i osobowymi do realizacja badań z zakresu UX. W następnej kolejności planowane jest zaangażowanie pięciu zewnętrznych radiologów, którzy przeprowadzą testy UX oraz wezmą udział w panelu ekspertów celem oceny użyteczności aplikacji i wypracowania rekomendacji w zakresie tworzenia indywidualnych preferencji użytkowników w systemie. Testy UX pozwolą zoptymalizować interfejs systemu i uwzględnić potrzeby użytkowników końcowych (radiologów), co może przełożyć się na dalsze usprawnienie ergonomii pracy, szczególnie w kontekście efektywnego wykorzystania wspomagania przez AI. Element wspomagania przez AI jest nowy i nieoczywisty. Sposób efektywnego włączania podpowiedzi generowanych przez algorytmy, w interfejs systemu i przepływ danych w systemie, wymaga empirycznej weryfikacji i optymalizacji. W ramach udziału w testach UX radiolodzy otrzymają także otwarty dostęp do platformy, warunkowany koniecznością wypełnienia ankiety ewaluacyjnej, co pozwoli im na samodzielne testowanie platformy (testy platformy w środowisku zbliżonym do docelowego na docelowej grupie odbiorców).