Baza – AI4AR I

Kwestie techniczne

Dane obrazowe pochodzą z Dolnośląskiego Centrum Onkologii, Pulmonologii i Hematologii we Wrocławiu. W DCOPiH wykorzystywany jest 1.5 T aparat MRI Siemens Avanto Fit. Badania gromadzono przy następujących parametrach technicznych:

T2W

Płaszczyzny obrazowania (imaging planes): axial, sagital, coronal

Grubość warstwy (slice thicknes): 3 mm

Pole widzenia (FOV): od 19 do 25 cm (w zależności od protokołu badania)

Rozdzielczość (in-plane resolution): dla FOV 19 cm rozmiar voksela 0,7 x 0,7 x 3 mm

DWI

Płaszczyzny obrazowania (imaging planes): axial

Grubość warstwy (slice thicknes): 4 mm

Pole widzenia (FOV): od 38 cm

Rozdzielczość (in-plane resolution): 2,3 x 2,3 x 4 mm

Niska wartość b (low b-value): 50

Średnie wartości b (intermediate b-value): 400, 800

Wysoka wartość b (high b-value): 1200

DCE

Płaszczyzny obrazowania (imaging planes): axial

Grubość warstwy (slice thicknes): 2 mm

Pole widzenia (FOV): 20 cm

Rozdzielczość (in-plane resolution): 0,9 x 09 x 2 mm

Rozdzielczość czasowa (temporal resolution): 1 min

Czas obserwacji (total observation time): 6 min

Dawka kontrastu (dose of contrast): 0,1 mmol/kg

Szybkość dozowania (injection rate): 2 cc/s

Fat suppresion: tak

Procedura i standard wykonywania adnotacji

Każde badanie zostało niezależnie opisane przez 3 doświadczonych radiologów z minimum 3-letnim doświadczeniem w opisywaniu badań mpMRI miednicy onkologicznych (prostata) oraz praktyczną znajomością standardu PI-RADS 2.1. Radiolodzy w trakcie wykonywania opisów byli wzajemnie zaślepieni i nie posiadali dostępu do danych historycznych (nie znali historii pacjentów ani lokalizacji ognisk poddawanych biopsji fuzyjnej). W całym procesie gromadzenia danych udział wzięło łącznie 4 radiologów.

Standard danych

Zgromadzony zbiór danych składa się z:

  • obrazów źródłowych w formie plików DICOM zawierających 11 sekwencji (T2W agial, sagital, coronal), ADC, DWI (hbv – high b-valu dwi), DCE (6 punktów czasowych)
  • adnotacji anatomicznych stref prostaty (Anatomical_Labels)
    • afs (anterior fibromuscular stroma – strefa włóknisto-mięśniowa)
    • cz (central zone – strefa centralna)
    • pg (prostate gland – cały gruczoł)
    • pz (peripheral zone – strefa obwodowa)
    • sv_l (pęcherzyki nasienne lewe)
    • sv_r (pęcherzyki nasienne prawe)
    • tz (transition zone – strefa przejściowa)
    • ur (urethra – cewka moczowa)
  • adnotacji lokalizacji zmian podejrzanych (Lesion_Labels)
    • lesion1 – leson4 (w zależności od ilości ognisk w badaniu)

Dane zgromadzono i przygotowano w formie struktury katalogowej, w której podfoldery odpowiadają odpowiednio rodzajowi danych (dane obrazowe, adnotacje anatomiczne i adnotacje zmian) a dalej numerowi kolejnych badań. Dodatkowo w przypadku zmian adnotacje rozdzielone są na podfoldery skojarzone z konkretną zmiana oraz typem sekwencji, na której została wykonana adnotacja. Dla zmian dostępne są adnotacje wykonane przez wszystkich radiologów, którzy wykryli daną zmianę.

Przygotowano dwie formy standardu reprezentacji danych:

  • DICOM – dane obrazowe w oryginalnych plikach DICOM, zaś adnotacje wizualne zostały skonwertowane do standardu DICOM SEG
  • MHA/ NIfTI – dane obrazowe skonwertowane do plików mha ITK MetaImage (mha) oraz wizualne adnotacje skonwertowane do plików NIfTI (nii). Schemat struktury danych zgodny z mha/ NIfTI

Schematy obu struktur danych pokazano poniżej.

Schemat struktury danych według DICOM/DICOM SEG
Schemat struktury danych zgodny z mha/ NIfTI

W bazie zawarte są obrysy wykonywane przez wszystkich radiologów, stąd poszczególne zmiany posiadają do trzech unikalnych obrysów wykonywanych na wszystkich sekwencjach (pliki z adnotacjami zmian mają zakodowany w nazwie id radiologa). Na chwilę obecną przygotowana baza jest chyba jedyną bazą obrazów mpMRI prostaty, która zawiera obrysy wykonane przez kilku ekspertów. Interesującą koncepcją może być wykorzystanie różnych obrysów zmian, jako formy naturalnej augmentacji danych w procesie uczenia modeli.

W trakcie gromadzenia danych medycznych do bazy danych zbierano zatem możliwie szeroki zakres zmiennych klinicznych, mogących definiować poziom istotności klinicznej (wartość GS, grupa ISUP, liczba i długość odcinków pobranych, liczba i długość odcinków zajętych, objętość prostaty i gęstość PSA, grupa ryzyka wg. EUA, itd.). Pozostawia się zatem dużą swobodę oraz elastyczność w możliwości selekcji podzbiorów uwzględniających różne kryteria istotności klinicznej zmian.

W DCOPiH badanie histopatologiczne przeprowadzane jest wg standardów Polskiego Towarzystwa Patologicznego. Określany jest stopień złośliwości wg systemu Gleasona oraz WHO/ISUP, jednakże w odniesieniu do pacjenta – stanowi on wypadkową z całego materiału biopsyjnego.

Pliki do pobrania (dane, ostatnia modyfikacja 01.03.2024):

Dane DICOM/DICOM SEG: AI4AR_I_dicom.zip

Dane MHA/NIfTI: AI4AR_I_cont.zip

Pliki do pobrania (opis, ostatnia modyfikacja 01.03.2024):

Opis medyczno-radiologiczny

Dane kliniczne

Dane radiologiczne

Licencja

Zbiór danych został udostępniony w sposób otwarty na stronie internetowej projektu (https://ai4ar.opi.org.pl) na licencji Creative Commons Corporation „Uznanie autorstwa 4.0 Międzynarodowa”.

Zarządzanie zbiorem danych

Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy, Laboratorium Stosowanej Sztucznej Inteligencji, Warszawa, Polska

Informacje kontaktowe

dr inż. Rafał Jóźwiak – Rafal.Jozwiak@opi.org.pl

dr n. med. Jakub Mitura – Jakub.Mitura@opi.org.pl