Comprender c贸mo funcionan y la ventaja de emplear los intervalos de confianza, intervalos de predicci贸n y predicci贸n por cuartiles a la hora de emplear modelos de ML para soluciones de negocio.
A d铆a de hoy son cada vez m谩s las empresas que se apoyan en modelos y t茅cnicas de Machine Learning y anal铆tica avanzada para tomar sus decisiones de negocio. No hay duda de que los datos son el petr贸leo de esta nueva era y tomar decisiones basadas en ellos supone una ventaja competitiva considerable. No obstante siguen existiendo escenarios (fluctuaci贸n de la bolsa, precio de la energ铆a y commodities ...) cuya gran complejidad hace que sea complicado de modelar hasta con los algoritmos m谩s punteros.
En estas situaciones la soluci贸n m谩s viable suele pasar por cuantificar la incertidumbre del modelo o asignando unos intervalos de confianza en las predicciones para poder tomar decisiones de negocio m谩s precisas.
Esta charla plantea, a partir de un caso de uso en Python, entrar en el detalle de los conceptos de intervalo de confianza, intervalo de predicci贸n y predicci贸n basada en cuartiles. Para cada uno de los conceptos explicados se definir谩n las ventajas y desventajas de su empleo tanto a nivel de interpretabilidad como a nivel de coste computacional, focaliz谩ndose en el valor a帽adido aportado a la soluci贸n de negocio planteada.
Librer铆as:
- Xgboost: https://xgboost.readthedocs.io/en/stable/
- Catboost: https://catboost.ai/
- Lightgbm: https://lightgbm.readthedocs.io/en/v3.3.2/
- Ngboost: https://github.com/stanfordmlgroup/ngboost
- sklearn: https://scikit-learn.org/stable/
Definiciones y referencias:
- Ngboost: https://arxiv.org/abs/1910.03225
- Regresi贸n cuant铆lica: http://www.econ.uiuc.edu/~roger/research/rq/QRJEP.pdf
- intervalo de credibilidad: https://en.wikipedia.org/wiki/Credible_interval
- intervalo de confianza: https://es.wikipedia.org/wiki/Intervalo_de_confianza
- intervalo de predicci贸n: https://es.wikipedia.org/wiki/Intervalo_de_predicci%C3%B3n