Dati leggibili dalla macchina - Machine-readable data
I dati leggibili da una macchina , o dati leggibili da computer , sono dati in un formato che può essere elaborato da un computer . I dati leggibili dalla macchina devono essere dati strutturati .
Negli Stati Uniti, l' OPEN Government Data Act del 14 gennaio 2019 definisce i dati leggibili dalla macchina come "dati in un formato che può essere facilmente elaborato da un computer senza l'intervento umano, garantendo al contempo che non venga perso alcun significato semantico". La legge ordina alle agenzie federali statunitensi di pubblicare i dati pubblici in questo modo, garantendo che "qualsiasi risorsa di dati pubblici dell'agenzia sia leggibile dalla macchina".
I dati leggibili da una macchina possono essere classificati in due gruppi: dati leggibili dall'uomo contrassegnati in modo che possano essere letti anche da macchine (ad es. microformati , RDFa , HTML ) e formati di file di dati destinati principalmente all'elaborazione da parte di macchine ( CSV , RDF , XML , JSON ). Questi formati sono leggibili da una macchina solo se i dati in essi contenuti sono formalmente strutturati; l'esportazione di un file CSV da un foglio di calcolo strutturato male non soddisfa la definizione.
Leggibile dalla macchina non è sinonimo di accessibile digitalmente . Un documento accessibile digitalmente può essere online, rendendo più facile l'accesso per gli esseri umani tramite computer, ma il suo contenuto è molto più difficile da estrarre, trasformare ed elaborare tramite la logica di programmazione del computer se non è leggibile dalla macchina.
Extensible Markup Language (XML) è progettato per essere leggibile sia dall'uomo che dalla macchina e l' Extensible Stylesheet Language Transformation (XSLT) viene utilizzato per migliorare la presentazione dei dati per la leggibilità umana. Ad esempio, XSLT può essere utilizzato per eseguire il rendering automatico di XML in formato PDF ( Portable Document Format ). I dati leggibili dalla macchina possono essere trasformati automaticamente per la leggibilità umana ma, in generale, non è vero il contrario.
Ai fini dell'attuazione della legge sulla modernizzazione del Government Performance and Results Act (GPRA), l' Office of Management and Budget (OMB) definisce il "formato leggibile dalla macchina" come segue: "Formato in un linguaggio informatico standard (non testo inglese) che può essere letti automaticamente da un browser Web o da un sistema informatico (ad es. xml). I tradizionali documenti di elaborazione testi e i file PDF (Portable Document Format) sono facilmente letti dagli esseri umani ma in genere sono difficili da interpretare per le macchine. Altri formati come il linguaggio di markup estensibile ( XML), (JSON) o fogli di calcolo con colonne di intestazione che possono essere esportati come valori separati da virgola (CSV) sono formati leggibili dalla macchina. Poiché HTML è un linguaggio di markup strutturale, etichettando in modo discreto parti del documento, i computer sono in grado di raccogliere i componenti del documento per assemblare sommari, schemi, bibliografie di ricerca bibliografica, ecc. È possibile rendere i documenti di elaborazione testi tradizionali e altri formati leggibili da una macchina ma i documenti deve includere elementi strutturali migliorati."
Guarda anche
Riferimenti