Gestión documental en la Inteligencia Artificial.

Gestión documental en la Inteligencia Artificial.

Cuando se habla de inteligencia artificial,  se comienza por una serie de herramientas y resultados, por norma general, la gestión documental en la inteligencia artificial, es el principio de todo.

Los datos no se transmiten en cazuelas, si no en documentos (paquetes de información, para que nos entendamos). Una buena definición de documento sería la siguiente: “Cualquier conjunto de información que conforme una unidad significativa independiente, registrada en un soporte electrónico, constituye también un documento.

Inteligencia Artificial

Es un sistema para el análisis de datos que podría identificar patrones  y que tomaría decisiones analíticas, como un analista humano usaría su conocimiento y entrenamiento experto, hace algo inteligente.

Relationship of AI, ML, and DL.https://www.frontiersin.org/articles/10.3389/frai.2019.00012/full

La diferencación entre sistemas de Machine Learning o Deep Learning está relacionada con la capacidad, mientras el Machine Learning  es un sistema que mediante la experiencia (analiza datos de un modelo, los evalúa y crea un modelo óptimo), permite a un sistema aprender a reconocer patrones por sí mismo y hacer predicciones.

En 2016 Google inició un proyecto en Google Open Source: Quick, Draw! Dataset, se recogieron aproximadamente, 50 millones de dibujos de 15 millones de personas de diferentes paises para utilizar como base de un proyecto para el reconocimiento de imágenes.

imagen de un dibujo de tijeras
Google Open Source. Quick Draw! The data

Me tranquiliza pensar que no soy la única torpe con los dibujos, ya hice un curso con Myriam Artola, y voy a ir a por el segundo. Se supone que son unas tijeras, todavía estamos discutiendo si darle al flag as inappropriate…  La imagen nos sirve para explicar lo diferente que puede ser una cosa, imagináos una mesa, las hay de 3, patas, de 4, sin patas (adosadas a una pared)… y la cosa es tener imágenes para enseñarle a la máquina a meter todas en el mismo grupo, las mesas.

El Deep Learning utiliza técnicas de machine learning para resolver problemas, imitando la capacidad humana de toma de decisiones. Es muy costoso por la gran cantidad de información que hace falta para entrenar el sistema, para abaratar este coste se suelen usar lo que se llaman transferencias de aprendizaje.

La gestión documental en un sistema de Machine Learning para el reconocimiento y clasificación de imágenes.

Entrenar un sistema de Machine  Learning para que reconozca imágenes implica, alimentar una base de datos con imágenes que sirvan para que el sistema aprenda a reconocerlas.

¿Cómo reconoce las imágenes?

Cuando recibe la imagen crea un mapa de pixeles, en los que se ve la diferencia de color, rango tonal, profundidad de bits, resolución y crea una matriz. En esta imagen vamos a ver la representación original y su matriz.

Enfocar

Enfocar
GIMP Documentation.https://docs.gimp.org/2.10/es/gimp-filter-convolution-matrix.html

Utilizamos un sistema de convolución para que devuelva una imagen de los bordes y que se puedan identificar objetos en la fotografía. Devuelve una especie de negativo. Lee la diferencia entre los  píxeles para crear esta imagen. Quedaría aproximadamente así:

Detectar bordesDetectar bordes

¿Qué necesita para hacerlo?

Esto solo ocurriría si el rango tonal de la imagen es lo suficientemente alto, esto quiere decir que si la diferencia tonal entre pixeles no es la suficiente, la máquina no va a leer la diferencia y no va a poder dibujar el borde de esa cosa. ¿qué tiene que ver esto con la gestión documental?

1º Si esa imagen va a provenir de la digitalización de material analógico, el proyecto de digitalización deberia contemplar un rango tonal lo suficientemente alto.

2º Si la imagen proviene de imágenes digitales, el sistema de validación debería incluir el parámetro rango tonal para aceptar o no la imagen en la base de datos.

Aunque la imagen no se vaya a usar para Machine learning, si la vas a usar en RRSS o publicaciones on line, este requisito, lo vas a seguir necesitando, puesto que la imágenes de lo que se cuelga on line son indexadas por motores de búsqueda que utilizan sistemas de Inteligencia Artificial para etiquetarlas. Si no pueden hacerlo por el rango tonal bajo, vas a perder visibilidad, encontrabilidad. A Google le gusta lo que reconoce y lo premia enseñándolo más.

Es muy común en procesos de digitalización de imágenes que la calidad de las mismas no valga para este tipo de bases de datos, sobre todo en proyectos antiguos, en los que se usaban escáneres sin posibilidad de configuración manual.

La preingesta y la documentalista.

La fase en la que hace falta una persona documentalista  en un proceso de IA, es la de seleccionar y aportar los estándares necesarios para el proyecto. Seleccionar los datos y documentos con la información necesaria.

Definir qué tipo de datos, el formato, las calidades… Un buen comienzo son las ISO, determinar qué ISO se pueden usar en ese proyecto. Por ejemplo, para digitalizar material de Patrimonio cultural tendríamos la ISO/TS 19264-1:2017, las recomendaciones de Fadgi, etc.

Si quieres saber más, piensas  que te hace falta una consultoría para tu proyecto o crees que algo no funciona en tu sistema, contáctanos, seguro que podemos ayudarte.

 

BIBLIOGRAFÍA

9.2. Matriz de convolución. (s. f.). Recuperado 28 de febrero de 2021, de https://docs.gimp.org/2.10/es/gimp-filter-convolution-matrix.html
Moore, J. H., Raghavachari, N., & Speakers, W. (2019). Artificial Intelligence Based Approaches to Identify Molecular Determinants of Exceptional Health and Life Span-An Interdisciplinary Workshop at the National Institute on Aging. Frontiers in Artificial Intelligence, 2. https://doi.org/10.3389/frai.2019.00012
GIMP Documentation. (s. f.). Recuperado 28 de febrero de 2021, de https://docs.gimp.org/
Google Colaboratory. (s. f.). Recuperado 9 de febrero de 2021, de https://colab.research.google.com/notebooks/welcome.ipynb?hl=es
Google Open Source. (s. f.). Opensource.Google. Recuperado 28 de febrero de 2021, de https://opensource.google/

ISO/TS 19264-1:2017(en), Photography — Archiving systems — Image quality analysis — Part 1: Reflective originals. (s. f.). Recuperado 28 de febrero de 2021, de https://www.iso.org/obp/ui/#iso:std:iso:ts:19264:-1:ed-1:v2:en

Nuevas jornadas formativas sobre los estándares de digitalización de documentación histórica para preservación digital: ISO 19264 – FADGI – METAMORFOZE | LIBNOVA: La plataforma de preservación digital más avanzada. (s. f.). Recuperado 28 de febrero de 2021, de https://es.libnova.com/formacion-sobre-los-estandares-de-digitalizacion-de-documentacion-historica-para-preservacion-digital-iso-19264-fadgi-metamorfoze/

Quick, Draw! The Data. (s. f.). Recuperado 17 de febrero de 2021, de https://quickdraw.withgoogle.com/data

Quiénes somos. (2017, abril 25). Muxote Potolo bat. https://muxotepotolobat.com/conoce-al-equipo/

Sisinfo.sri. (2011, octubre 19). Recuperación de Información en Internet…: ¿Qué es un documento digital? Recuperación de Información en Internet… https://sisinfo-sri.blogspot.com/2011/10/que-es-un-documento-digital.html

Transferir aprendizaje y ajuste fino | TensorFlow Core. (s. f.). TensorFlow. Recuperado 28 de febrero de 2021, de https://www.tensorflow.org/tutorials/images/transfer_learning?hl=es-419

Dh, M., & e. (2020, julio 3). What is the difference between AI , machine learning, and deep learning. Geospatial World. https://www.geospatialworld.net/blogs/difference-between-ai-machine-learning-and-deep-learning/

 

 

 

 

Los inventarios y la protección de datos personales

Los inventarios y la protección de datos personales

Antes de empezar a hablar de los inventarios necesarios para cumplir con las leyes de protección de datos, hay que hablar de la gestión de archivo, de los inventarios y catálogos que se generan en un archivo, y, en general de cómo funciona un archivo.

Hace miles de años que las personas encargadas de la gestión de archivos ya se dieron cuenta de que lo importante no es almacenar documentos, convirtiendo el archivo en depósito, si no crear un sistema que permita guardar esa información, pero también conservarla y, por supuesto, recuperarla y comunicarla. Toda información que no se comunica, tarde o temprano, se pierde, que se lo cuenten a los de la NASA, que han perdido las grabaciones originales de la llegada del hombre a la luna, un despiste que podían haber evitado con un sistema de preservación, que ya han incluido en sus procesos.

En gestión documental usamos índice de documentos y catálogo de documentos, vamos a explicarlo:

El índice es la una lista en la que se ubican, clasifican y ordenan los materiales. Mientras que el catálogo es la lista de todos estos materiales disponibles.

Ejemplo: FraEF aparecerá en el índice como el código que usamos para determinar las facturas emitidas de Formación, mientras que la lista de las facturas emitidas será el catálogo, el índice es la clave para codificar y el catálologo es la referencia a cada documento, el inventario de cada documento con esa referencia.

Todos los documentos que generamos son pruebas de las acciones que llevamos a cabo, es por eso, que en las empresas y las organizaciones, se llevan a cabo procesos que generan ingente cantidad de documentación, como los procesos de seguridad laboral, y que se estandariza tanto el contenido, como el flowchart, el flujo de los mismos. Se adaptan a las normativas y a la legalidad vigente, muy importante, adaptarse a la legalidad.

Cuando creamos un sistema de archivo, revisamos las funciones que vamos a llevar a cabo y las leyes que tenemos que cumplir para poder llevarlas a cabo, solo entonces, determinamos qué documentos necesitamos, su formato, su contenido, el calendario de retención documental a cumplir, el flujo que ha de seguir este documento…

Mapa de flujo de trabajo para gestión documental

¿Qué inventario necesitamos para cumplir con las leyes de protección de datos?

El inventario de los documentos.

En el cual vamos a poner en qué lugar o lugares se encuentra el documento, y que nos va a servir:

  • para encontrarlo rápidamente
  •  poder destruir esa información en todas las bases de datos en la que esté, si se nos pide
  •  saber si ese documento puede haber sido alterado al sufrir un ataque la aplicación en la que lo almacenamos, etc.

Lo vamos a usar en muchos de los protocolos y procesos de la organización.

El inventario de bases de datos.

Tenemos que tener bien localizadas las bases de datos que tenemos, con su protocolo de duplicado para cumplir con la obligación del art. 24 del REGLAMENTO (UE) 2016/679 DEL PARLAMENTO EUROPEO Y DEL CONSEJO de 27 de abril de 2016 relativo a la protección de las personas físicas en lo que respecta al tratamiento de datos personales y a la libre circulación de estos datos y por el que se deroga la Directiva 95/46/CE (Reglamento general de protección de datos) “2. Cuando sean proporcionadas en relación con las actividades de tratamiento, entre las medidas mencionadas en el apartado 1 se incluirá la aplicación, por parte del responsable del tratamiento, de las oportunas políticas de protección de datos. “. Y con todos los sistemas de seguridad adecuados para protegerlas.

El inventario de dispositivos.

Desde la ISO 17799 ya se venía pidiendo a las organizaciones que se inventaríen de manera adecuada los dispositivos en los que se crea , almacena o comparte información, esto, actualmente, incluye que en esa tabla aparezca cómo se ha destruído la información, ya que el borrado en los dispositivos electrónicos, no es tan sencillo como la destrucción de papeles. Hoy en día con el teletrabajo, tener ese inventario al día es muy importante para llevar a cabo acciones de contención en caso de ciberataque.

El inventario de software.

En el que vamos a poner todos los programas y aplicaciones, la fecha de adquisición, el tipo de licencia, la empresa que lo ha creado, las actualizaciones, la baja… Este inventario es muy importante para la seguridad de los datos, en autónomos y micropymes les pido que se den de alta en el sistema de avisos de la OSI, para que cuando alguno de estos recursos tenga un problema de seguridad actúen lo antes posible y pongan remedio (bien con un parche o con las recomendaciones de la OSI)lo antes posible. Este inventario va a darnos una visión muy certera de las necesidades de la organización, ya que en él vamos a poder comprobar de un vistazo, todas las herramientas de ciberseguridad que se usan, y las que no también.

El inventario de plugins.

Mención a parte merece el inventario de los plugins de las páginas web, por dos razones, puede que la organización no gestione el mantenimiento de su web, con lo cual ha de pedirle este documento a la empresa proveedora, y porque, aunque es software, muchas de las organizaciones no tienen una idea exacta de para qué valen ni qué riesgos entrañan.  Yo utilizo el plugin de seguridad Wordfence que me envía comunicaciones de problemas de seguridad con otros plugins y que me sirve para actualizarlos rápidamente, revisar que no haya habido problemas de seguridad o cambiarlos si los considero inseguros. Aquí comparto el de mi web.Web. dokusare.Inventario Plugins_signed

Todos los inventarios han de seguir el mismo sistema:

  • Creas una cabecera como esta :
    Imagen de la cabecera de un inventario.

    Se pone el logo de la empresa, el título del documento, la versión, la fecha y las hojas que tiene. Es muy importante guardar las diferentes versiones del documento, ya que van a probar que se hacen las actualizaciones necesarias en materia de seguridad. Además nos van a dar la posiblidad de escalar nuestros proyectos y detectar el momento exacto en el que suceden las cosas, para mejorar y para poder documentar qué acciones llevamos a cabo.

  • Luego haces una tabla, tipo hoja de EXCEL con toda la información que necesitas para cada inventario.
  • Lo firmas, con firma electrónica y lo cierras para que no se pueda manipular, recuerda que , además de ser un documento de gestión es un documento probatorio, que presentarías ante la Agencia Española de Protección de Datos, el INCIBE, etc.

Estos inventarios son parte del Documento de Seguridad que deberías tener. Si no los tienes, no tienes documento de seguridad, lo más posible es que no estés cumpliendo con las leyes de protección de datos, y quizás con otras tampoco. Puedes consultarmos llamando por teléfono o enviándonos tus preguntas a través de nuestro formulario de contacto. No cobramos las consultas.

Bibliografía.

  • «Avisos de seguridad | Oficina de Seguridad del Internauta». Accedido 19 de diciembre de 2020. https://www.osi.es/es/actualidad/avisos
  • Piñar Manas, José Luis (dir). Memento Práctico. Protección de datos. Francis Lefebvre. Lefebvre-El derecho s.a. Monasterio de Yuso y Suso 34, 28049. Madrid, 2019.
  • Hermida Mondelo, Alexandre, y Inmaculada Iglesias Fernández. Gestión de archivos. Técnicas documentales y sistemas de gestores de bases de datos. Ideas propias editorial. Vigo, 2016.
  • Nuñez Fernandez, Eduardo. Archivos y normas ISO. Ediciones TREA s.l. 33393 Somonte-Cenero, Gijón (Asturias), 2007.
  • CCM. «ISO 17799». Accedido 19 de diciembre de 2020. https://es.ccm.net/contents/600-iso-17799.
  • 14:00-17:00. «ISO 999:1996». ISO. Accedido 19 de diciembre de 2020. https://www.iso.org/cms/render/live/en/sites/isoorg/contents/data/standard/00/54/5446.html
  • Bonal Zazo, José Luis. La descripción archivística normalizada. Ediciones TREA s.l. Donoso cortés, 7, bajo. 33204. Gijón (Asturias), 2001.
  • Magonia. «La NASA da por perdidas las grabaciones originales del primer alunizaje», 16 de julio de 2009. https://magonia.com/2009/07/16/la-nasa-da-perdidas-grabaciones-originales-del-primer/
  • «RGPD: BOE», s. f. https://www.boe.es/doue/2016/119/L00001-00088.pdf.

Implementación de un sistema de gestión documental

Implementación de un sistema de gestión documental

Mapa de flujo de trabajo para gestión documental

Todo el contenido de tu empresa organizado y seguro durante todo el ciclo de vida de los documentos, totalmente sincronizado y cumpliendo con la LOPDPDD antiguo RGPD

Pasos para implementar un sistema de gestión documental

Para completar la implantación de un sistema de gestión documental pueden seguirse diferentes metodologías.

1. Entender las necesidades y los procesos

Los sistemas de gestión documental no se adaptan a todo tipo de organizaciones. Un análisis previo del flujo de información de la compañía será necesario para comprender cómo y qué debe implementarse. Los puntos débiles de la compañía son aquellos aspectos en los que el gestor documental debe hacer más hincapié. Tenemos que revisar todo el sistema de gestión de la información para conocer las necesidades, antes de tomar decisiones. Hay que hacer una evaluación del sistema actual, ver lo que se necesita y crear el nuevo, o las mejoras para el actual.

2. Usuarios

Antes de comenzar con el proceso de implementación se debe evaluar el elemento clave de toda organización, las personas que van a usar ese sistema. No todos las personas realizan el mismo uso de la información. Las personas deben formar parte del plan de implementación y mantenerlas, en todo momento, informadas e involucradas en el proceso.Para esto usamos metodologías Kanban, Scrumherramientas como visual thinking, design thinking, etc.

3. Metodologías de implantación

Las metodologías más comúnmente utilizadas para instalar un sistema de gestión documental son las denominadas waterfall (o desarrollo en cascada) y agile.

En el caso concreto de los gestores documentales, la adaptación de los trabajadores suele ser el mayor problema al que se enfrenta una organización. Tecnológicamente no supone un gran reto, sobre todo comparado con otras soluciones TIC. Pero sí requiere que las personas cambien su manera de trabajar y adopten nuevos hábitos. En dokusare contamos con personas especialistas es gestión de conflictos, para que los cambios sean más fluidos y los sistemas para implicar a la plantilla en los cambios hacen del proceso un sistema ágil.

Es por ello que se suele optar por un enfoque colaborativo a la hora del diseño e implementación, siguiendo las pautas proporcionadas por, por ejemplo, el modelo Scrum o Kanban. Ya que la plantilla de la empresa serán los usuarios finales del gestor documental,  que participen en el proceso de diseño es una necesidad.

4. Automatiza y simplifica los procesos

Mejorar la eficiencia de una compañía mediante la simplificación y automatización de sus procesos es una de las funciones clave de los gestores documentales. En las etapas previas a la implementación de un sistema de gestión documental la compañía identificará los procesos poco eficientes con los que trabaja la empresa. Esto ocurre, por ejemplo, con la creación de documentos. Multitud de personas dentro de una organización pueden acceder y modificar un documento durante su creación. Controlar cada versión de ese archivo provoca grandes esfuerzos que pueden incidir negativamente en la productividad empresarial. Con el control de versiones automático que incluyen la mayoría de gestores documentales, este problema desaparece.

5. Integración

La integración del sistema de gestión documental con otras aplicaciones, como ERP, CRM o email existentes previamente en la compañía, es fundamental. Sacar el máximo provecho a estas herramientas pasa por conseguir que todos los sistemas de información de la empresa trabajen unidos. La información ubicada en documentos es, en muchos aspectos, la base de trabajo de una organización. Los canales en los que se almacenan y gestionan los flujos de información de la compañía son muy diversos. Por ello, un gestor documental debe ser capaz de conectar con los todos los sistemas con la intención de acceder al mayor número de documentos posible y de tener localizada la información necesaria para cada sección de la empresa.

Implantar un sistema de gestión documental es un proceso que cambiará la forma de trabajar de la compañía, va a mejorar los procesos, vamos a tener la oportunidad de crear mejoras y adaptarnos a todas las leyes que rigen cada sección de la empresa.

Si quieres saber cómo podemos ayudar a tu empresa consúltanos, sin compromiso, seguro que podemos solventar tus dudas, aquí

Si eres autónomo/a y necesitas ayuda para crear tu archivo y tu plan de gestión de la documentación, tenemos planes y precios adaptados a tí, contactanos