Saltar a contenido

Fundamentos de Python

Python es uno de los lenguajes más ampliamente usados (si no el que más) en el campo del análisis de datos o el data science. Por tanto, es conveniente tener unas nociones mínimas de este lenguaje antes de profundizar más con él en esta rama. A continuación enlazamos con unos recursos de otra web que pueden ser de utilidad para empezar con Python y conocer qué es lo que se necesita saber.

  1. Primeros pasos e instalación. En primer lugar necesitamos conocer qué es Python e instalarlo, junto con alguna herramienta o IDE que nos permita desarrollar programas.
  2. Elementos básicos. A continuación conviene conocer los elementos básicos del lenguaje: uso de variables, operaciones matemáticas, mostrar datos por pantalla o leer datos de teclado
  3. Estructuras de control. También es necesario conocer las estructuras de control de flujo presentes en Python, tanto selectivas como iterativas (bucles)
  4. Manejo de textos. En este documento se explican las operaciones más habituales e importantes cuando estemos trabajando con datos textuales.
  5. Manejo de listas. Las listas son un componente esencial en muchos programas en Python, pues permiten almacenar colecciones de datos de forma sencilla.
  6. Otras colecciones. En este documento se explican otros tipos de colecciones de datos presentes en Python además de las listas, como son las tuplas, los diccionarios o los conjuntos.
  7. Uso de funciones. Es necesario aprender a definir funciones para modularizar nuestro código y poder invocar esos módulos siempre que lo necesitemos
  8. Clases y objetos. Aunque no es una característica fundamental (ni a menudo necesaria) de Python, aquí se explica cómo definir clases para modelar el problema a resolver, y cómo crear objetos de esas clases para que interactúen en el programa.
  9. Gestión de módulos. Otra característica esencial para el análisis de datos es saber trabajar con módulos o librerías, ya que será necesario instalar y utilizar algunas librerías externas.
  10. Acceso a ficheros de texto. Los ficheros de texto son una forma sencilla de almacenar y recuperar información en un programa, y conviene saber cómo hacerlo.

Además de estos aspectos, que podemos considerar troncales, en la web de Python se explican otras nociones adicionales, como el trabajo con fechas y horas, la conexión con distintos sistemas de bases de datos o el desarrollo de aplicaciones con interfaz gráfica. Ninguno de estos conceptos son vitales para el trabajo con datos que vamos a hacer en esta web, por eso no los enlazamos directamente en esta página. Pero se pueden consultar para ampliar los conocimientos sobre Python.

1. Ejercicio introductorio

Ejercicio 1

Para el desarrollo de los ejercicios de esta web será necesario contar con ciertas librerías, y es necesario asegurarnos de que sean compatibles entre sí y con el entorno de Python que tengamos. Así que, siguiendo los pasos vistos en este documento, instala la herramienta conda si no la tienes ya instalada, y crea un entorno con Python 3.9 en él. Llama al entorno data_science. Resumimos aquí los pasos a seguir:

  1. Instalar Miniconda si no tienes ningún entorno conda disponible. En el enlace anterior se explica cómo
  2. Crear el entorno con el siguiente comando:
conda create -n data_science python=3.9
  1. Activa el entorno creado:
conda activate data_science
  1. Instala en el entorno las librerías principales que utilizaremos en estas sesiones (aunque puede que en algún caso concreto instalemos alguna más adicional):
pip install numpy scipy matplotlib seaborn pandas scikit-learn

En los siguientes apartados explicaremos con detalle cómo utilizar estas librerías.