Contenuto in:
Capitolo

Procedure informatiche di tutela della trasparenza e riservatezza dei dati

  • Simone Marinai

This chapter initially describes the possible types of anonymization and analyzes the document formats on which it is necessary to operate. After analyzing the state of the art of automatic document anonymization techniques, a prototype of a semi-automatic sentence anonymization application is described in detail. Finally, experimental results related to the use of the prototype within the Agile Justice project are analyzed.

  • Keywords:
  • anonymisation,
  • prototip,
+ Mostra di più

Simone Marinai

University of Florence, Italy - ORCID: 0000-0002-6702-2277

  1. Csányi, Gergely Márk, Dániel Nagy, Renátó Vági, János Pál Vadász, and Tamás Orosz. 2021. "Challenges and Open Problems of Legal Document Anonymization" Symmetry 13, no. 8: 1490.
  2. Di Martino, B., Marulli, F., Lupi, P., & Cataldi, A. 2021. A machine learning based methodology for automatic annotation and anonymisation of privacy-related items in textual documents for justice domain. In Complex, Intelligent and Software Intensive Systems: Proceedings of the 14th International Conference on Complex, Intelligent and Software Intensive Systems (CISIS-2020) (pp. 530-539). Springer International Publishing.
  3. Garat, Diego, and Dina Wonsever. 2022. "Automatic Curation of Court Documents: Anonymizing Personal Data" Information 13, no. 1: 2
  4. Gemelli Andrea, Vivoli Emanuele, Marinai Simone. 2022. Graph neural networks and representation embedding for table extraction in PDF documents. In 2022 26th International Conference on Pattern Recognition (ICPR) (pp. 1719-1726). IEEE.
  5. Gupta, D., Saul, M., & Gilbertson, J. 2004. Evaluation of a deidentification (De-Id) software engine to share pathology reports and clinical documents for research. American journal of clinical pathology, 121(2), 176-186.
  6. Jurafsky Daniel and Martin James H.. 2000. Speech and Language Processing: An Introduction to Natural Language Processing, Computational Linguistics, and Speech Recognition (1st. ed.). Prentice Hall PTR, USA.
  7. Lison, P., Pilán, I., Sánchez, D., Batet, M., & Øvrelid, L. 2021. Anonymisation models for text data: State of the art, challenges and future directions. In Proceedings of the 59th Annual Meeting of the Association for Computational Linguistics and the 11th International Joint Conference on Natural Language Processing (Volume 1: Long Papers) (pp. 4188-4203).
  8. Smith, R. 2007. An overview of the Tesseract OCR engine. In Ninth international conference on document analysis and recognition (ICDAR 2007) (Vol. 2, pp. 629-633). IEEE.
  9. Venkatesan T. Chakaravarthy, Himanshu Gupta, Prasan Roy, and Mukesh K. Mohania. 2008. Efficient techniques for document sanitization. In Proceedings of the 17th ACM Conference on Information and Knowledge Management, CIKM 2008, pages 843–852, Napa Valley, California, USA.
  10. Witten, Ian H. 2004. Text Mining. The Practical Handbook of Internet Computing
PDF
  • Anno di pubblicazione: 2023
  • Pagine: 213-228

XML
  • Anno di pubblicazione: 2023

Informazioni sul capitolo

Titolo del capitolo

Procedure informatiche di tutela della trasparenza e riservatezza dei dati

Autori

Simone Marinai

Lingua

Italian

DOI

10.36253/979-12-215-0316-6.14

Opera sottoposta a peer review

Anno di pubblicazione

2023

Copyright

© 2023 Author(s)

Licenza d'uso

CC BY 4.0

Licenza dei metadati

CC0 1.0

Informazioni bibliografiche

Titolo del libro

Giustizia sostenibile

Sottotitolo del libro

Sfide organizzative e tecnologiche per una nuova professionalità

Curatori

Paola Lucarelli

Opera sottoposta a peer review

Numero di pagine

270

Anno di pubblicazione

2023

Copyright

© 2023 Author(s)

Licenza d'uso

CC BY 4.0

Licenza dei metadati

CC0 1.0

Editore

Firenze University Press

DOI

10.36253/979-12-215-0316-6

ISBN Print

979-12-215-0315-9

eISBN (pdf)

979-12-215-0316-6

Collana

Studi e saggi

ISSN della collana

2704-6478

e-ISSN della collana

2704-5919

209

Download dei libri

179

Visualizzazioni

Salva la citazione

1.408

Libri in accesso aperto

in catalogo

2.649

Capitoli di Libri

4.459.874

Download dei libri

5.048

Autori

da 1080 Istituzioni e centri di ricerca

di 66 Nazioni

70

scientific boards

da 380 Istituzioni e centri di ricerca

di 43 Nazioni

1.311

I referee

da 402 Istituzioni e centri di ricerca

di 38 Nazioni