Notebook para pruebas y aprender data visualization

Este notebook lo he creado para hacer pruebas de visualización de datos. Como hasta ahora solamente había hecho cursos y ejercicios guiados he creado este notebook para ir respondiendo preguntas que me hago sobre un dataset por mi cuenta sin supervisión.

Plataformas disponibles en el dataset

Cuantos juegos vendió Wii por año

Comparativa de ventas de juegos por año

La idea de esta grafica era buena. Ver una comparativa de ventas de todas las plataformas a lo largo del tiempo pero una vez calculado no se puede diferenciar cada plataforma. Los colores de la leyenda se repiten porque son muchas plataformas.

A pesar de esto, podemos observar que hubo tres puntos donde despuntaron las ventas, aproximadamente: 1997, entre 2002 y 2005 y 2010

Mapa de calor

Los mapas de calor necesitan un conjunto de datos el cual todo su contenido sean números para poder comparar sus valores y asignar colores en función de esto. Dónde único se puede tener valores no numéricos es en el índice y la cabecera.

Como podemos ver en el gráfico anterior el groso de ventas de videojuegos ha sido por parte de las plataformas Wii, DS, X360, PS3, PS2, PS, N64, 3DS. Además de esto, vemos como estas ventas se centran desde el año 1995 hasta el 2017.

Por esta razón vamos a hacer un nuevo mapa de calor solamente con estos datos.

La query que hacemos para obtener estos datos no es nada "elegante" escribimos muchos or para las distintas plataformas. ¿Se puede mejorar de alguna forma?

Grafico de puntos por genero y ventas totales, agrupados por color dependiendo de la plataforma

Queremos saber si hay una relacion entre el genero y la plataforma. Para esto tenemos que agrupar las ventas globales por plataforma y genero. De tal manera, que solamente tengamos una entrada de datos con una plataforma y un genero, no debe repetirse esta combinacion.

Con la operación groupby juntamos por la unión de estos dos campos Genre Platform, y sumamos el resto de valores de la fila. En este caso, las ventas globales. Para evitar que cree un índice nuevo con estos dos campos por los que agrupamos usamos la función reset_index. De esta forma los campos por los que hacemos la unión quedan accesibles mediante su columna correspondiente.

¿El genero de acción vende igual en todas las plataformas?

¿En Wii vende todos los generos por igual?

En este caso el pico de ventas en juegos de deportes en la plataforma Wii se debe a que el juego "Wii sports" se "vendia" junto con la consola.

¿Que genero destaca en cada plataforma?