Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales

Abstract

El presente trabajo final tiene como objetivo investigar las posibilidades que brinda la Inteligencia Artificial. En particular, se focaliza en analizar las diferentes técnicas de “Batch Reinforcement Learning” pasivo. Su implementación buscará abordar un caso de uso real basado en sistemas de recomendación. Esto implicó la realización de una evaluación de los diferentes algoritmos capaces de resolver esta y otras problemáticas, así como también las diferentes opciones de métricas de desempeño que pueden ser implementadas. Así, se buscará generar un marco de referencia para la aplicación de “Batch Reinforcement Learning”. El mismo abordará los siguientes pilares fundacionales: tratamiento del conjunto de datos, los algoritmos y posibles métricas de desempeño. Estos puntos forman un grupo indispensable para la aplicación de la técnica antes mencionada. Estos tres pilares se abordarán desde distintas ópticas. Por una parte, en lo que refiere a conjunto de datos, se utilizarán algoritmos que permitirán generarlos para mantener un escenario de pruebas controlado, sobre el cual puedan desarrollarse distintos experimentos. Por otra parte, se explorarán algoritmos que se consideran las bases para la aplicación de “Batch Reinforcement Learning” pasivo (e.g. Neural Fitted Q-Iteration), todos ellos basados en redes neuronales artificiales. Por último, será necesario evaluar métricas de desempeño que permitan conocer si un agente logró aprender a resolver la tarea propuesta. Finalmente, se dejan sentadas las bases para poder aplicar dichas técnicas a un caso real sobre una temática relevante en la industria: sistemas de recomendación.

En

Thesis note

Trabajo final (Master). Universidad ORT Uruguay, Facultad de Ingeniería

Thesis degree name

Master en Big Data
88 p. diagrs., tbls., grafs.

Notes

Incluye bibliografía y anexos.

Subject

PROYECTOS-MD, BIG DATA, APRENDIZAJE AUTOMÁTICO, APRENDIZAJE PROFUNDO, INTELIGENCIA ARTIFICIAL, APRENDIZAJE POR REFUERZO

Type

Trabajo final de carrera

Access the full text

Citation

Derderian Dostourian, M., Milano Taibo, J. G., & Mottini d'Oliveira, B. L. (2021). Análisis e implementación de técnicas de “Batch Reinforcement Learning” pasivo para aplicación sobre casos reales (Trabajo final). Universidad ORT Uruguay, Facultad de Ingeniería.

Rights license

Teléfono central:
(598) 2902 1505
Campus Centro
Cuareim 1451, Montevideo, Uruguay
Campus Pocitos
Bvar. España 2633, Montevideo, Uruguay