Saltar al contenido principal

Cómo leer y escribir archivos de Excel en Python

Cómo leer y escribir archivos de Excel en Python.

Aquí tienes un tutorial detallado paso a paso sobre cómo leer y escribir archivos de Excel en Python utilizando la biblioteca pandas.

Requisitos previos

Antes de comenzar, asegúrate de tener lo siguiente:

  • Python instalado en tu máquina
  • Biblioteca pandas instalada (pip install pandas)

Leer archivos de Excel

Para leer un archivo de Excel en Python, sigue estos pasos:

  1. Importa la biblioteca pandas:
import pandas as pd
  1. Utiliza la función read_excel() para leer el archivo de Excel en un DataFrame:
df = pd.read_excel('ruta/al/archivo.xlsx')

Reemplaza 'ruta/al/archivo.xlsx' con la ruta real de tu archivo de Excel.

  1. Accede y manipula los datos en el DataFrame según sea necesario:
# Imprime las primeras filas del DataFrame
print(df.head())

# Accede a una columna específica
datos_columna = df['Nombre de la columna']

# Accede a una celda específica
dato_celda = df.at[índice_fila, 'Nombre de la columna']

Escribir archivos de Excel

Para escribir datos en un archivo de Excel en Python, sigue estos pasos:

  1. Crea un DataFrame con los datos que deseas escribir:
datos = {'Columna 1': [1, 2, 3],
'Columna 2': ['A', 'B', 'C']}
df = pd.DataFrame(datos)

Reemplaza 'Columna 1', 'Columna 2' y los datos correspondientes con los tuyos propios.

  1. Utiliza la función to_excel() para escribir el DataFrame en un archivo de Excel:
df.to_excel('ruta/al/archivo_salida.xlsx', index=False)

Reemplaza 'ruta/al/archivo_salida.xlsx' con la ruta y el nombre deseados para tu archivo de salida.

Por defecto, la función to_excel() incluye los números de fila en el archivo de salida. Establecer index=False elimina los números de fila.

  1. Verifica que el archivo se haya creado y contenga los datos esperados.

Operaciones adicionales

Aquí tienes algunas operaciones adicionales que puedes realizar al trabajar con archivos de Excel en Python:

Especificar nombres de hojas

Por defecto, read_excel() lee la primera hoja del archivo de Excel. Puedes especificar una hoja diferente proporcionando el nombre de la hoja o su índice:

df = pd.read_excel('ruta/al/archivo.xlsx', sheet_name='Hoja2')

Reemplaza 'Hoja2' con el nombre de hoja o índice deseado.

Escribir múltiples DataFrames en hojas diferentes

Para escribir múltiples DataFrames en hojas diferentes del mismo archivo de Excel, puedes utilizar la clase ExcelWriter de pandas:

with pd.ExcelWriter('ruta/al/archivo_salida.xlsx') as escritor:
df1.to_excel(escritor, sheet_name='Hoja1', index=False)
df2.to_excel(escritor, sheet_name='Hoja2', index=False)

Reemplaza df1 y df2 con tus propios DataFrames. La clase ExcelWriter te permite escribir múltiples DataFrames en el mismo archivo de Excel.

Formatear la salida de Excel

Puedes aplicar varias opciones de formato a la salida de Excel, como establecer el ancho de columna, formatear celdas, agregar bordes, etc. Para un formato avanzado, es posible que necesites utilizar bibliotecas adicionales como openpyxl o xlrd.

Conclusión

En este tutorial, hemos cubierto los conceptos básicos de cómo leer y escribir archivos de Excel en Python utilizando la biblioteca pandas. Aprendiste cómo leer un archivo de Excel en un DataFrame, acceder y manipular los datos, escribir datos en un archivo de Excel y realizar operaciones adicionales como especificar nombres de hojas y formatear la salida. ¡Ahora puedes trabajar eficientemente con archivos de Excel en tus proyectos de Python!