La biblioteca pandas ha sido uno de los factores decisivos para el crecimiento de Python en la década pasada dentro de la industria del análisis de datos y continúa ayudando a data scientists a resolver problemas 15 años después de su creación. Gracias a su éxito, ahora hay varios proyectos open-source que afirman mejorar pandas de diversas maneras: en esta charla haremos un repaso de dichas alternativas.
Durante la charla - Haremos una breve introducción a pandas, hablaremos de su importancia, y señalaremos algunas de sus limitaciones, [como ya hizo su autor hace un lustro](https://wesmckinney.com/blog/apache-arrow-pandas-internals/). - Enumeraremos algunas de sus alternativas y las clasificaremos (pandas-like o diferente, nodo único vs distribuido). Mencionaremos RAPIDS, Dask, Modin, y Spark por encima. - Mostraremos fragmentos de código de Arrow, Vaex, y Polars a través de notebooks de Jupyter almacenados en [Orchest Cloud](https://www.orchest.io/) y hablaremos de los puntos fuertes de las bibliotecas anteriores. - Concluiremos dando una serie de pautas para elegir un proyecto u otro en función del caso y las necesidades. Al final de la charla la audiencia tendrá más información de cómo algunas de las alternativas modernas a pandas encajan dentro del ecosistema, entenderá cuáles proveen un camino para migrar más sencillo, y estará más preparada para juzgar cuál usar para próximos proyectos. Conocimientos básicos de pandas ayudarán a entender el resto de la presentación. Los materiales de la charla se encuentran [en GitHub](https://github.com/astrojuanlu/talk-dataframes), y una serie de artículos de blog desarrollan los conceptos que se verán durante la charla: - [Arrow](https://www.orchest.io/blog/the-great-python-dataframe-showdown-part-1-demystifying-apache-arrow) - [Vaex](https://www.orchest.io/blog/the-great-python-dataframe-showdown-part-2-out-of-core-processing-with-vaex) - [Polars](https://www.orchest.io/blog/the-great-python-dataframe-showdown-part-3-lightning-fast-queries-with-polars)
Speakers: Juan Luis Cano Rodríguez