Fundamentos de Python¶
Python es uno de los lenguajes más ampliamente usados (si no el que más) en el campo del análisis de datos o el data science. Por tanto, es conveniente tener unas nociones mínimas de este lenguaje antes de profundizar más con él en esta rama. A continuación enlazamos con unos recursos de otra web que pueden ser de utilidad para empezar con Python y conocer qué es lo que se necesita saber.
- Primeros pasos e instalación. En primer lugar necesitamos conocer qué es Python e instalarlo, junto con alguna herramienta o IDE que nos permita desarrollar programas.
- Elementos básicos. A continuación conviene conocer los elementos básicos del lenguaje: uso de variables, operaciones matemáticas, mostrar datos por pantalla o leer datos de teclado
- Estructuras de control. También es necesario conocer las estructuras de control de flujo presentes en Python, tanto selectivas como iterativas (bucles)
- Manejo de textos. En este documento se explican las operaciones más habituales e importantes cuando estemos trabajando con datos textuales.
- Manejo de listas. Las listas son un componente esencial en muchos programas en Python, pues permiten almacenar colecciones de datos de forma sencilla.
- Otras colecciones. En este documento se explican otros tipos de colecciones de datos presentes en Python además de las listas, como son las tuplas, los diccionarios o los conjuntos.
- Uso de funciones. Es necesario aprender a definir funciones para modularizar nuestro código y poder invocar esos módulos siempre que lo necesitemos
- Clases y objetos. Aunque no es una característica fundamental (ni a menudo necesaria) de Python, aquí se explica cómo definir clases para modelar el problema a resolver, y cómo crear objetos de esas clases para que interactúen en el programa.
- Gestión de módulos. Otra característica esencial para el análisis de datos es saber trabajar con módulos o librerías, ya que será necesario instalar y utilizar algunas librerías externas.
- Acceso a ficheros de texto. Los ficheros de texto son una forma sencilla de almacenar y recuperar información en un programa, y conviene saber cómo hacerlo.
Además de estos aspectos, que podemos considerar troncales, en la web de Python se explican otras nociones adicionales, como el trabajo con fechas y horas, la conexión con distintos sistemas de bases de datos o el desarrollo de aplicaciones con interfaz gráfica. Ninguno de estos conceptos son vitales para el trabajo con datos que vamos a hacer en esta web, por eso no los enlazamos directamente en esta página. Pero se pueden consultar para ampliar los conocimientos sobre Python.
1. Ejercicio introductorio¶
Ejercicio 1
Para el desarrollo de los ejercicios de esta web será necesario contar con ciertas librerías, y es necesario asegurarnos de que sean compatibles entre sí y con el entorno de Python que tengamos. Así que, siguiendo los pasos vistos en este documento, instala la herramienta conda
si no la tienes ya instalada, y crea un entorno con Python 3.9 en él. Llama al entorno data_science. Resumimos aquí los pasos a seguir:
- Instalar Miniconda si no tienes ningún entorno conda disponible. En el enlace anterior se explica cómo
- Crear el entorno con el siguiente comando:
conda create -n data_science python=3.9
- Activa el entorno creado:
conda activate data_science
- Instala en el entorno las librerías principales que utilizaremos en estas sesiones (aunque puede que en algún caso concreto instalemos alguna más adicional):
pip install numpy scipy matplotlib seaborn pandas scikit-learn
En los siguientes apartados explicaremos con detalle cómo utilizar estas librerías.