Fabián Yovine, Sergio2025-10-172025-10-172025Kidd Schenck, J. D. (2025). Efficient probabilistic model learning techniques for application to the verification of Large Language Models (Proyecto). Universidad ORT Uruguay, Facultad de Ingeniería. Recuperado de https://rad.ort.edu.uy/handle/20.500.11968/7713https://hdl.handle.net/20.500.11968/7713Incluye bibliografía y anexos.En esta tesis se propone un enfoque para la verificación formal de Grandes Modelos de Lenguaje (LLMs, por sus siglas en inglés) mediante la extracción de modelos probabilísticos, específicamente autómatas probabilísticos (PDFAs), que permitan representar de manera aproximada la distribución generada por el LLM. Se utiliza una estrategia de aprendizaje activo inspirada en el marco MAT (Minimally Adequate Teacher), garantizando propiedades de corrección probablemente aproximada (PAC). Posteriormente, el modelo extraído se traduce a estructuras de verificación (por ejemplo, cadenas de Markov de tiempo discreto) con el fin de emplear herramientas de model checking (e.g., PRISM) para verificar propiedades temporales en lógicas como PCTL. Así, se logra un flujo sistemático que integra la extracción de modelos desde un LLM bajo restricciones definidas por autómatas guía, la formalización de propiedades deseadas y la aplicación de técnicas de verificación exhaustiva. Se presentan resultados experimentales que evidencian la factibilidad del método y su aplicabilidad a escenarios concretos, junto con desafíos referentes a la complejidad de las consultas al LLM y a la necesidad de optimizaciones para el aprendizaje de autómatas.120 p., diagrs., tbls., grafs.PDFAcceso abiertoPROYECTOS-IDVERIFICACIÓN FORMALMODELOS DE LENGUAJE GRANDEEfficient probabilistic model learning techniques for application to the verification of Large Language ModelsTrabajo final de carrera