En los análisis de datos contemporáneos, un tema común ha sido el big data y las muchas “V”, que incluyen variedad, velocidad y volumen, y la amplia gama de herramientas y técnicas que evolucionan para manejar entornos ricos en datos. Sin embargo, si los datos son escasos, difíciles de obtener o incompletos, ¿qué tipos de enfoques son más eficaces? Blanka Horvath del King’s College London y The Alan Turing Institute abordaron esta pregunta en el seminario BBQ (Bloomberg Quant) para una audiencia en línea. En su trabajo, la simulación de mercado basada en datos y en redes neuronales proporciona un método flexible para modelar series de tiempo financiero sin hacer suposiciones sobre la dinámica estocástica que se realiza debajo de la superficie. Esta llamada simulación de mercado generativa es independiente del modelo, aunque las opciones específicas influenciarán las características de las trayectorias en la simulación. Si el modelo Black Scholes se utiliza para la capacitación, el proceso rendirá estrategias de cobertura bajo Black Scholes. Si se elige el modelo Heston, las estrategias se adaptan en consecuencia. Llevando esta observación un paso más allá, Horvath pregunta, “¿Qué pasa si los datos de entrenamiento se parecen a los datos del mercado mismo?”. De hecho, explorar esta pregunta produce resultados realistas que no padecen de las deficiencias de Black Scholes o Heston.
¿Cómo funciona el modelado generativo?
El modelo generativo se construye sobre un tema central, el teorema de aproximación universal, que sostiene que, si suficientes nodos están en la red, es posible aproximar cualquier función o distribución. Luego, ya sea que la distribución es uniforme o normal estándar, se mapeará a la distribución de rendimientos objetivo que se ve en los datos. Las formas más comunes de modelo generativo son Máquinas de Boltzmann Restringidas (RBM) y, más recientemente, Redes Generativas Antagónicas (RANS), que exhiben un buen desempeño en imágenes. Sin embargo, esa capacidad es costosa e innecesaria cuando se trabaja con datos de series de tiempo financiero. En cambio, los Autocodificadores Variacionales (VAE) son el mejor candidato aquí, ya que tienen una clara ventaja de ser frugal y de poder operar en entornos en los que se dispone de pocos datos.
Naturalmente, el mercado tiene muchos casos en los que existe una gran cantidad de datos, pero hay desafíos cuando ese no es el caso o los datos son privados y no se puede acceder a ellos fácilmente. En esos casos pueden surgir restricciones y cuellos de botella a la hora de utilizar datos reales para el motor de cobertura. Además, cuando se modela un proceso estocástico completo, la observación se realiza en una red de tiempo discreta y habrá lagunas donde lo que sucedió entre los pasos de tiempo no queda claro. Un modelo generativo proporciona flexibilidad en cada punto de observación sin hacer suposiciones sobre lo que sucede entre los puntos. El análisis converge rápido, incluso con un pequeño conjunto de datos.
Para estudiar el rendimiento, Horvath ejecutó un modelo generativo basado en los rendimientos y un modelo generativo basado en la trayectoria y calculó los rendimientos diarios, semanales y mensuales. Al realizar una configuración basada en los rendimientos, se están explorando elementos de dos distribuciones y si se aplica una prueba de dos partes, sus orígenes serán evidentes, ya sea que se originaron en las mismas distribuciones o en diferentes distribuciones. Además, la prueba puede decir con un nivel de confianza determinado si se originan en el mismo proceso estocástico o en otros diferentes, sin dejar de ser robusto con respecto a datos faltantes o datos de muestra irregulares. Horvath encontró que el desempeño fue bueno en términos de cobertura profunda; un caso de uso sería negociación de alta frecuencia, donde las observaciones pueden variar significativamente día a día. La investigación futura abordará las trayectorias del mercado, lo que implica trabajo con VAE condicional y posprocesamiento
En el turno de preguntas y respuestas, el anfitrión Bruno Dupire preguntó sobre los conceptos de firmas, descomposición y comparación de resultados en diferentes mercados. Horvath sugirió el trabajo de Terry Lyons sobre la codificación determinista de trayectoria aproximada. Es evidente que el mercado se está moviendo todo el tiempo, donde tanto el ruido como los eventos extremos dificultan la interpretación. Sin embargo, el modelo generativo puede capturar colas gordas, tan pronto como proyectemos de la trayectoria del mercado, las colas estarán allí, dijo.
Charlas relámpago
Tras la breve sesión de preguntas y respuestas, Bruno Dupire inició una serie de “charlas relámpagos”, presentaciones de 5 minutos en la que los expertos, investigadores y académicos de la industria presentan una amplia gama de temas para estimular el pensamiento nuevo y la interacción entre varias disciplinas. Cada charla examina una manera de cómo está evolucionando la industria y sirve como un aspecto exploratorio esencial para la serie Bloomberg Quant Seminar.
En esta sesión, Dhruv Madeka de Amazon describió el pronóstico de múltiples horizontes basados en la atención, Michael Ang de Bloomberg L.P. proporcionó una visión general de la cadena de Markov Monte Carlo, y Anna Bogolubova de la Escuela Juillard y BOMAA reveló la presencia de criptogramas en la música de Bach.
Además, Julien Guyon de Bloomberg L.P. presentó un contraejemplo de correlación local en términos de un simple modelo de volatilidad estocástica. Arka Bandyopadhyay de la City University de Nueva York y la Escuela de Negocios Zicklin de Baruch College explicó cómo la Ley CARES está mal alineada con la tolerancia, con hallazgos de comportamiento oportunista y estratégico. Por último, Antoine Savine, de Danske Bank, abordó el aprendizaje automático diferencial, centrándose en el desarrollo de un motor de fijación de precios rápido y en cómo se desarrolla en un entorno de producción.
Información sobre la serie de seminarios de Bloomberg Quant
La serie de seminarios Bloomberg Quant (BBQ) se realiza todos los meses y abarca una amplia gama de temas en finanzas cuantitativas. El seminario BBQ se ofrece en un formato virtual y está programado para albergar a participantes de EMEA y las Américas. Cada sesión está presidida por Bruno Dupire, director de Investigación cuantitativa de Bloomberg L.P., y cuenta con un orador principal que presenta su investigación actual. Después de esta presentación siguen varias “charlas relámpago” de cinco minutos cada una en rápida sucesión. Este formato brinda a la audiencia la oportunidad de exponerse a una amplia variedad de temas.
Inscríbase para recibir invitaciones a futuros eventos de esta serie.
The post Encontrar agujas en pequeños pajares: Simulación de mercado en pequeños entornos de datos appeared first on Servicio Bloomberg Professional.