Curso de introducción a la programación con Python

Autor: Luis Fernando Apáez Álvarez

Clase 4: Gráficos lineales con Matplotlib

En el proyecto del primer módulo trabajamos con gráficos utilizando el módulo matplotlib, lo cual representa un primer encuentro con este módulo de Python. Ahora, parece obvia la necesidad de trabajar con gráficos una vez que hemos abordado los temas sobre los DataFrames, con lo cual conseguiremos información valiosa sobre nuestros datos visualizando gráficas.

Visualizando información de un DataFrame

Comencemos trabajando con el siguiente DataFrame

Gráfico de líneas

Dentro del plano cartesiano graficaremos una serie de puntos y los conectaremos mediante líneas. Al gráfico resultante se le conoce como gráfica de líneas. Así, con la información de nuestro DataFrame buscaremos crear un Gráfico de líneas, donde el eje $x$ estará representado por las letras del alfabeto y el eje $y$ la su respectiva frecuencia.

Para ello utilizaremos plt.plot() para crear la gráfica colocando como parámetros los valores correspondientes al eje $x$ y después los valores correspondientes al eje $y$. Recordemos que podemos acceder a los valores de una columna de un DataFrame usando d1['Nombre_de_la_columna'], por lo que d1['Letra'] serán los valores que asignemos al eje $x$ y d1['Frecuencia'] los valores que asignemos al eje $y$. Esto es

Agregando etiquetas y legendas

Aunque sabemos bien todo lo relacionado al gráfico anterior, debemos asegurarnos que la información o los gráficos puedan ser entendidos por más personas, y no sólo nosotros que hemos escrito el código. Por ende es necesario imprimir, al menos, en nuestro gráfico información clave que ayude a entenderlo mejor. Por ejemplo, podemos ponerle nombre a los ejes coordenados utilizando plt.xlabel() o plt.ylabel() como sigue

Por otro lado, podemos agregar más de un gráfico a nuestras gráficas, por ejemplo podemos agregar otra frecuencia obtenida de algunas letras del siguiente DataFrame

luego, podemos mostrar los gráficos correspondientes a los dos DataFrames como sigue

donde Python en automático cambia el color de los gráficos para poder distinguirlos. Ahora, de acuerdo a la gráfica anterior podemos ver que no es claro qué gráfico corresponde a cada DataDrame, por ello es que recurrimos al uso de las legendas. Para ello modificamos el código anterior escribiendo

Asimismo, podemos agregar texto arbitrario dentro de nuestra gráfica valiéndonos de coordenadas y escribiendo plt.text(coord_x, coord_y, texto). Por ejemplo

donde podemos notar cómo hemos cambiando el color de la letra utilizando color='red'. Podemos modificar el texto cambiando el tamaño de la letra y la fuente

Socialmedia.PNG