Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning"

Abstract
El siguiente trabajo final tiene como objetivo analizar el “framework” provisto por “OpenMined” como solución a los problemas de privacidad y acceso a múltiples conjuntos de datos que manejan los modelos de Aprendizaje Automático (“Machine Learning”) e Inteligencia Artificial, los cuales mayoritariamente son generados en forma centralizada debido a las limitaciones mencionadas. Se propone el concepto de «Descentralización de la Información» en forma segura y con las garantías para el mantenimiento tanto de la privacidad de los datos como de la calidad de los modelos. Las soluciones se basan en el uso de técnicas de “Federated Learning” (FL), “Homomorphic Encryption” (HE) y “Decentralized Learning” (DL). Se propone utilizar el “framework” provisto por “OpenMined” para generar un modelo de clasificación de detección de ataques maliciosos creando modelos para el análisis de errores y comportamiento en “logs” de “Apache Web Servers”, ya que estos contienen información sensible. Se estudia la robustez y limitaciones de los algoritmos planteados por el “framework” en cuanto a cómo anonimizar los datos y marcos de gobernanza mediante una prueba de concepto. A partir de dicha prueba se concluye que el “framework” garantiza que no se pueden identificar registros específicos a partir de las técnicas usadas de “Homomorphic Encryption”. La funcionalidad de la creación de usuarios y de un sistema de permisos sobre los datos publicados no cuenta al momento de la entrega de este trabajo con un mecanismo firme para la gobernanza de datos. En la implementación realizada el “framework” no presenta mayor complejidad al momento de ser utilizado por el “Data Science” con respecto al modelo de referencia utilizado. Tampoco se observaron impactos negativos en la calidad de los resultados. Es un “framework” en construcción por lo que se espera continuar ampliando las funcionalidades disponibles, entre ellas el entrenamiento remoto, que está en desarrollo y la función de activación de la red, en la cual se tuvo que aplicar la unidad lineal rectificada (ReLU, por sus siglas en inglés).
En
Thesis note
Trabajo final (Master). Universidad ORT Uruguay, Facultad de Ingeniería
Thesis degree name
Master en Big Data
61 p. diagrs., tbls., grafs.
Notes
Incluye bibliografía y anexos.
Subject
PROYECTOS-MD, BIG DATA, APRENDIZAJE AUTOMÁTICO, SEGURIDAD DE DATOS, SEGURIDAD INFORMÁTICA, PRIVACIDAD DIFERENCIAL
Type
Trabajo final de carrera
Access the full text
Citation
Ampuero Velando, P., & Sánchez Salvagno, J. F. (2021). Prueba de concepto del "framework" de "OpenMined" para modelos de "Machine Learning" (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.
Rights license