© 2022 Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy
Baza – AI4AR I
Kwestie techniczne
Dane obrazowe pochodzą z Dolnośląskiego Centrum Onkologii, Pulmonologii i Hematologii we Wrocławiu. W DCOPiH wykorzystywany jest 1.5 T aparat MRI Siemens Avanto Fit. Badania gromadzono przy następujących parametrach technicznych:
T2W
Płaszczyzny obrazowania (imaging planes): axial, sagital, coronal
Grubość warstwy (slice thicknes): 3 mm
Pole widzenia (FOV): od 19 do 25 cm (w zależności od protokołu badania)
Rozdzielczość (in-plane resolution): dla FOV 19 cm rozmiar voksela 0,7 x 0,7 x 3 mm
DWI
Płaszczyzny obrazowania (imaging planes): axial
Grubość warstwy (slice thicknes): 4 mm
Pole widzenia (FOV): od 38 cm
Rozdzielczość (in-plane resolution): 2,3 x 2,3 x 4 mm
Niska wartość b (low b-value): 50
Średnie wartości b (intermediate b-value): 400, 800
Wysoka wartość b (high b-value): 1200
DCE
Płaszczyzny obrazowania (imaging planes): axial
Grubość warstwy (slice thicknes): 2 mm
Pole widzenia (FOV): 20 cm
Rozdzielczość (in-plane resolution): 0,9 x 09 x 2 mm
Rozdzielczość czasowa (temporal resolution): 1 min
Czas obserwacji (total observation time): 6 min
Dawka kontrastu (dose of contrast): 0,1 mmol/kg
Szybkość dozowania (injection rate): 2 cc/s
Fat suppresion: tak
Procedura i standard wykonywania adnotacji
Każde badanie zostało niezależnie opisane przez 3 doświadczonych radiologów z minimum 3-letnim doświadczeniem w opisywaniu badań mpMRI miednicy onkologicznych (prostata) oraz praktyczną znajomością standardu PI-RADS 2.1. Radiolodzy w trakcie wykonywania opisów byli wzajemnie zaślepieni i nie posiadali dostępu do danych historycznych (nie znali historii pacjentów ani lokalizacji ognisk poddawanych biopsji fuzyjnej). W całym procesie gromadzenia danych udział wzięło łącznie 4 radiologów.
Standard danych
Zgromadzony zbiór danych składa się z:
- obrazów źródłowych w formie plików DICOM zawierających 11 sekwencji (T2W agial, sagital, coronal), ADC, DWI (hbv – high b-valu dwi), DCE (6 punktów czasowych)
- adnotacji anatomicznych stref prostaty (Anatomical_Labels)
- afs (anterior fibromuscular stroma – strefa włóknisto-mięśniowa)
- cz (central zone – strefa centralna)
- pg (prostate gland – cały gruczoł)
- pz (peripheral zone – strefa obwodowa)
- sv_l (pęcherzyki nasienne lewe)
- sv_r (pęcherzyki nasienne prawe)
- tz (transition zone – strefa przejściowa)
- ur (urethra – cewka moczowa)
- adnotacji lokalizacji zmian podejrzanych (Lesion_Labels)
- lesion1 – leson4 (w zależności od ilości ognisk w badaniu)
Dane zgromadzono i przygotowano w formie struktury katalogowej, w której podfoldery odpowiadają odpowiednio rodzajowi danych (dane obrazowe, adnotacje anatomiczne i adnotacje zmian) a dalej numerowi kolejnych badań. Dodatkowo w przypadku zmian adnotacje rozdzielone są na podfoldery skojarzone z konkretną zmiana oraz typem sekwencji, na której została wykonana adnotacja. Dla zmian dostępne są adnotacje wykonane przez wszystkich radiologów, którzy wykryli daną zmianę.
Przygotowano dwie formy standardu reprezentacji danych:
- DICOM – dane obrazowe w oryginalnych plikach DICOM, zaś adnotacje wizualne zostały skonwertowane do standardu DICOM SEG
- MHA/ NIfTI – dane obrazowe skonwertowane do plików mha ITK MetaImage (mha) oraz wizualne adnotacje skonwertowane do plików NIfTI (nii). Schemat struktury danych zgodny z mha/ NIfTI
Schematy obu struktur danych pokazano poniżej.
W bazie zawarte są obrysy wykonywane przez wszystkich radiologów, stąd poszczególne zmiany posiadają do trzech unikalnych obrysów wykonywanych na wszystkich sekwencjach (pliki z adnotacjami zmian mają zakodowany w nazwie id radiologa). Na chwilę obecną przygotowana baza jest chyba jedyną bazą obrazów mpMRI prostaty, która zawiera obrysy wykonane przez kilku ekspertów. Interesującą koncepcją może być wykorzystanie różnych obrysów zmian, jako formy naturalnej augmentacji danych w procesie uczenia modeli.
W trakcie gromadzenia danych medycznych do bazy danych zbierano zatem możliwie szeroki zakres zmiennych klinicznych, mogących definiować poziom istotności klinicznej (wartość GS, grupa ISUP, liczba i długość odcinków pobranych, liczba i długość odcinków zajętych, objętość prostaty i gęstość PSA, grupa ryzyka wg. EUA, itd.). Pozostawia się zatem dużą swobodę oraz elastyczność w możliwości selekcji podzbiorów uwzględniających różne kryteria istotności klinicznej zmian.
W DCOPiH badanie histopatologiczne przeprowadzane jest wg standardów Polskiego Towarzystwa Patologicznego. Określany jest stopień złośliwości wg systemu Gleasona oraz WHO/ISUP, jednakże w odniesieniu do pacjenta – stanowi on wypadkową z całego materiału biopsyjnego.
Pliki do pobrania (dane, ostatnia modyfikacja 01.03.2024):
Dane DICOM/DICOM SEG: AI4AR_I_dicom.zip
Dane MHA/NIfTI: AI4AR_I_cont.zip
Pliki do pobrania (opis, ostatnia modyfikacja 01.03.2024):
Licencja
Zbiór danych został udostępniony w sposób otwarty na stronie internetowej projektu (https://ai4ar.opi.org.pl) na licencji Creative Commons Corporation „Uznanie autorstwa 4.0 Międzynarodowa”.
Zarządzanie zbiorem danych
Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy, Laboratorium Stosowanej Sztucznej Inteligencji, Warszawa, Polska
Informacje kontaktowe
dr inż. Rafał Jóźwiak – Rafal.Jozwiak@opi.org.pl
dr n. med. Jakub Mitura – Jakub.Mitura@opi.org.pl