Baza – AI4AR II

Procedura i standard wykonywania adnotacji

Każde badanie zostało niezależnie opisane przez 3 doświadczonych radiologów z minimum 3-letnim doświadczeniem w opisywaniu badań mpMRI miednicy onkologicznych (prostata) oraz praktyczną znajomością standardu PI-RADS 2.1. Radiolodzy w trakcie wykonywania opisów byli wzajemnie zaślepieni i nie posiadali dostępu do danych historycznych (nie znali historii pacjentów ani lokalizacji ognisk poddawanych biopsji fuzyjnej). W całym procesie gromadzenia danych udział wzięło łącznie 4 radiologów.

Standard danych

Zgromadzony zbiór danych składa się z:

  • obrazów źródłowych w formie plików DICOM zawierających 11 sekwencji (T2W agial, sagital, coronal), ADC, DWI (hbv – high b-valu dwi), DCE (6 punktów czasowych)
  • adnotacji anatomicznych stref prostaty (Anatomical_Labels)
    • afs (anterior fibromuscular stroma – strefa włóknisto-mięśniowa)
    • cz (central zone – strefa centralna)
    • pg (prostate gland – cały gruczoł)
    • pz (peripheral zone – strefa obwodowa)
    • sv_l (pęcherzyki nasienne lewe)
    • sv_r (pęcherzyki nasienne prawe)
    • tz (transition zone – strefa przejściowa)
    • ur (urethra – cewka moczowa)
  • adnotacji lokalizacji zmian podejrzanych (Lesion_Labels)
    • lesion1 – leson4 (w zależności od ilości ognisk w badaniu)

Dane zgromadzono i przygotowano w formie struktury katalogowej, w której podfoldery odpowiadają odpowiednio rodzajowi danych (dane obrazowe, adnotacje anatomiczne i adnotacje zmian) a dalej numerowi kolejnych badań. Dodatkowo w przypadku zmian adnotacje rozdzielone są na podfoldery skojarzone z konkretną zmiana oraz typem sekwencji, na której została wykonana adnotacja. Dla zmian dostępne są adnotacje wykonane przez wszystkich radiologów, którzy wykryli daną zmianę.

Przygotowano dwie formy standardu reprezentacji danych:

  • DICOM – dane obrazowe w oryginalnych plikach DICOM, zaś adnotacje wizualne zostały skonwertowane do standardu DICOM SEG
  • MHA/ NIfTI – dane obrazowe skonwertowane do plików mha ITK MetaImage (mha) oraz wizualne adnotacje skonwertowane do plików NIfTI (nii). Schemat struktury danych zgodny z mha/ NIfTI

Schematy obu struktur danych pokazano poniżej.

Schemat struktury danych według DICOM/DICOM SEG
Schemat struktury danych zgodny z mha/ NIfTI

W bazie zawarte są obrysy wykonywane przez wszystkich radiologów, stąd poszczególne zmiany posiadają do trzech unikalnych obrysów wykonywanych na wszystkich sekwencjach (pliki z adnotacjami zmian mają zakodowany w nazwie id radiologa). Na chwilę obecną przygotowana baza jest chyba jedyną bazą obrazów mpMRI prostaty, która zawiera obrysy wykonane przez kilku ekspertów. Interesującą koncepcją może być wykorzystanie różnych obrysów zmian, jako formy naturalnej augmentacji danych w procesie uczenia modeli.

W trakcie gromadzenia danych medycznych do bazy danych zbierano zatem możliwie szeroki zakres zmiennych klinicznych, mogących definiować poziom istotności klinicznej (wartość GS, grupa ISUP, liczba i długość odcinków pobranych, liczba i długość odcinków zajętych, objętość prostaty i gęstość PSA, grupa ryzyka wg. EUA, itd.). Pozostawia się zatem dużą swobodę oraz elastyczność w możliwości selekcji podzbiorów uwzględniających różne kryteria istotności klinicznej zmian.

W DCOPiH badanie histopatologiczne przeprowadzane jest wg standardów Polskiego Towarzystwa Patologicznego. Określany jest stopień złośliwości wg systemu Gleasona oraz WHO/ISUP, jednakże w odniesieniu do pacjenta – stanowi on wypadkową z całego materiału biopsyjnego.

Pliki do pobrania (dane, ostatnia modyfikacja 01.03.2024):

Uwaga! Pliki poniżej posiadają strukturę multi-zip (każdy plik jest częścią archiwum). Należy pobrać je do jednego katalogu i rozpakować programem 7zip.

Dane DICOM/DICOM SEG: AI4AR_II_dicom.zip

Dane MHA/NIfTI: AI4AR_II_cont.zip

Pliki do pobrania (opis, ostatnia modyfikacja 01.03.2024):

Opis medyczno-radiologiczny

Dane kliniczne

Dane radiologiczne

Licencja

Zbiór danych został udostępniony w sposób otwarty na stronie internetowej projektu (https://ai4ar.opi.org.pl) na licencji Creative Commons Corporation „Uznanie autorstwa 4.0 Międzynarodowa”.

Zarządzanie zbiorem danych

Ośrodek Przetwarzania Informacji – Państwowy Instytut Badawczy, Laboratorium Stosowanej Sztucznej Inteligencji, Warszawa, Polska

Informacje kontaktowe

dr inż. Rafał Jóźwiak – Rafal.Jozwiak@opi.org.pl

dr n. med. Jakub Mitura – Jakub.Mitura@opi.org.pl