Apprendimento automatico | Stampante Inc.

Dati scientifici, volume 10, numero articolo: 558 (2023) Citare questo articolo

278 accessi

1 Altmetrico

Dettagli sulle metriche

Nel nostro studio, abbiamo deciso di raccogliere un set di dati annotati multimodali per il telerilevamento dell’archeologia Maya, adatto per il deep learning. Il set di dati copre l’area intorno a Chactún, uno dei più grandi centri urbani Maya nella penisola centrale dello Yucatán. Il set di dati comprende cinque tipi di record di dati: visualizzazioni raster e modello di altezza della chioma da dati di scansione laser aerea (ALS), dati satellitari Sentinel-1 e Sentinel-2 e annotazioni manuali dei dati. Le annotazioni manuali (usate come maschere binarie) rappresentano tre diversi tipi di antiche strutture Maya (etichette di classe: edifici, piattaforme e aguadas - serbatoi artificiali) all'interno dell'area di studio, le loro esatte posizioni e confini. Il set di dati è pronto per l'uso con l'apprendimento automatico, comprese le reti neurali convoluzionali (CNN) per il riconoscimento degli oggetti, la localizzazione degli oggetti (rilevamento) e la segmentazione semantica. Vorremmo fornire questo set di dati per aiutare più team di ricerca a sviluppare i propri modelli di visione artificiale per le indagini sull'archeologia Maya o a migliorare quelli esistenti.

Le indagini con scansione laser aerea (ALS) si sono rivelate cruciali per il progresso della conoscenza sulla distribuzione dei “siti” archeologici, in particolare nelle regioni boscose degli antichi Maya1,2,3, poiché hanno notevolmente accelerato e ampliato le tradizionali indagini sul paesaggio archeologico. L'uso della ricerca ALS nell'archeologia del paesaggio implica tipicamente l'identificazione, la localizzazione, la registrazione e l'indagine delle caratteristiche naturali e culturali per una varietà di contesti, solitamente interconnessi, inclusi ma non limitati alla mappatura e all'analisi degli insediamenti, dell'urbanistica, della produzione agricola e gestione dell’acqua4,5,6,7,8,9,10,11.

Gli archeologi in genere ispezionano i dati ALS sotto forma di visualizzazioni raster, che migliorano la percezione delle caratteristiche della superficie12,13,14. L’analisi visiva e la digitalizzazione umana richiedono molto tempo e l’esame di centinaia di chilometri quadrati può richiedere mesi, a seconda del livello di dettaglio, del numero di strutture e del metodo di registrazione. Nonostante la mancanza di set di dati ALS su larga scala, ad alta risoluzione e pubblicamente disponibili dell'antica regione Maya, i finanziamenti pubblici e privati dispersi hanno reso possibile non solo condurre studi paesaggistici site-specific su pochi chilometri quadrati, ad esempio7,15,16 ,17,18, ma anche studi su larga scala su diverse centinaia o addirittura diverse migliaia di chilometri quadrati es.3,5,11,19,20,21,22,23. Il volume dei dati rende difficile annotare interi set di dati, soprattutto se si deve indicare non solo la posizione degli oggetti, ma anche la loro forma. Anche la soggettività dell’ispezione visiva umana e della digitalizzazione e la variabilità tra gli interpreti umani costituiscono un problema24. Esiste quindi un urgente bisogno di impiegare metodi di visione artificiale in grado di trovare oggetti archeologici e delinearne automaticamente i confini25,26. Tra i vari approcci di machine learning, le reti neurali convoluzionali profonde (CNN) rappresentano l’attuale stato dell’arte per la visione artificiale, ma di solito richiedono un gran numero di campioni già etichettati27 per l’addestramento. Ciò rende i set di dati etichettati cruciali per lo sviluppo e il test dei metodi.

In uno dei nostri studi precedenti, abbiamo già dimostrato che le CNN possono classificare gli antichi oggetti archeologici Maya dalle visualizzazioni DEM, raggiungendo una precisione fino al 95%28. Tuttavia, i modelli di classificazione non hanno il potenziale per sostituire l’ispezione e l’etichettatura manuali, per le quali è richiesta la segmentazione semantica. La segmentazione semantica è facilmente applicata nel telerilevamento, come riportato da una revisione27, ma ancora di più nell'imaging medico, dove le CNN spesso superano gli esperti29,30,31,32,33,34.

L'intento originale per la raccolta dei dati ALS nell'area intorno a Chactún, uno dei più grandi centri urbani Maya finora conosciuti nelle pianure centrali della penisola dello Yucatan, era quello di comprendere meglio la gestione delle acque, l'agricoltura, le dinamiche degli insediamenti e le politiche socio-politiche. organizzazione degli antichi Maya che vivevano in questa zona11,35.

_.tif, where the data source can specify a mask, ALS visualisations (lidar), CHM, or Sentinel data (S1 or S2). The sequential number is a unique identifier of a data record; all files with the same sequential number represent the same geographical area, but differ in the number of pixels (480 × 480 pixels, 240 × 240 pixels or 24 × 24 pixels) and bit depth (8-bit integer or 32-bit float) (Table 7)./p>