Aplicación de la clasificación binaria en el contexto de las finanzas



Kevin Andrey Villada Cuervo: kevinvillada251639@correo.itm.edu.co

Estefanía Cruz Ramírez: estefaniacruz249474@correo.itm.edu.co

Jonathan Cano Bedoya: jonathancano@itm.edu.co



Resumen

La clasificación binaria es una técnica fundamental del aprendizaje de máquina para resolver problemas de dos posibles escenarios, es aplicable en las finanzas para predecir eventos, para anticiparse a la ocurrencia del evento. El objetivo de este artículo es reconocer su aplicación e importancia en el ámbito financiero. Se indagó en literatura relacionada a la clasificación binaria para finanzas, y se complementa con la aplicación de un ejercicio empírico para la predicción de la bancarrota aplicando la regresión logística y Random Forest (bosques aleatorios). El método con mejor desempeño general fue Random Forest, aunque particularmente, se observó que estos modelos requieren un balance adecuado en las dos clases de la variable a predecir para mejoras su predicción. Se concluye que los modelos aplicados demostraron buen desempeño usando información financiera de las empresas de la muestra, su aplicación en finanzas puede abarcarse en otros contextos diferente a la bancarrota.

Abstract

Binary classification is a fundamental machine learning technique for solving two-case scenario problems. It is applicable in finance to predict events and anticipate their occurrence. The objective of this article is to recognize its application and importance in the financial field. Literature related to binary classification for finance was investigated, complemented by an empirical exercise for bankruptcy prediction using logistic regression and Random Forest. The method with the best overall performance was Random Forest, although it was particularly observed that these models require an adequate balance between the two classes of the variable to be predicted to improve their prediction. It is concluded that the applied models demonstrated good performance using financial information from the sample companies. Their application in finance can be extended to contexts other than bankruptcy.

Palabras clave:

Clasificación binaria, regresión logística, random forest.

Keywords:

Binary classification, logistic regression, random forest.