Cómo leer y escribir archivos de Excel en Python
Cómo leer y escribir archivos de Excel en Python.
Aquí tienes un tutorial detallado paso a paso sobre cómo leer y escribir archivos de Excel en Python utilizando la biblioteca pandas.
Requisitos previos
Antes de comenzar, asegúrate de tener lo siguiente:
- Python instalado en tu máquina
- Biblioteca
pandasinstalada (pip install pandas)
Leer archivos de Excel
Para leer un archivo de Excel en Python, sigue estos pasos:
- Importa la biblioteca
pandas:
import pandas as pd
- Utiliza la función
read_excel()para leer el archivo de Excel en un DataFrame:
df = pd.read_excel('ruta/al/archivo.xlsx')
Reemplaza 'ruta/al/archivo.xlsx' con la ruta real de tu archivo de Excel.
- Accede y manipula los datos en el DataFrame según sea necesario:
# Imprime las primeras filas del DataFrame
print(df.head())
# Accede a una columna específica
datos_columna = df['Nombre de la columna']
# Accede a una celda específica
dato_celda = df.at[índice_fila, 'Nombre de la columna']
Escribir archivos de Excel
Para escribir datos en un archivo de Excel en Python, sigue estos pasos:
- Crea un DataFrame con los datos que deseas escribir:
datos = {'Columna 1': [1, 2, 3],
'Columna 2': ['A', 'B', 'C']}
df = pd.DataFrame(datos)
Reemplaza 'Columna 1', 'Columna 2' y los datos correspondientes con los tuyos propios.
- Utiliza la función
to_excel()para escribir el DataFrame en un archivo de Excel:
df.to_excel('ruta/al/archivo_salida.xlsx', index=False)
Reemplaza 'ruta/al/archivo_salida.xlsx' con la ruta y el nombre deseados para tu archivo de salida.
Por defecto, la función to_excel() incluye los números de fila en el archivo de salida. Establecer index=False elimina los números de fila.
- Verifica que el archivo se haya creado y contenga los datos esperados.
Operaciones adicionales
Aquí tienes algunas operaciones adicionales que puedes realizar al trabajar con archivos de Excel en Python:
Especificar nombres de hojas
Por defecto, read_excel() lee la primera hoja del archivo de Excel. Puedes especificar una hoja diferente proporcionando el nombre de la hoja o su índice:
df = pd.read_excel('ruta/al/archivo.xlsx', sheet_name='Hoja2')
Reemplaza 'Hoja2' con el nombre de hoja o índice deseado.
Escribir múltiples DataFrames en hojas diferentes
Para escribir múltiples DataFrames en hojas diferentes del mismo archivo de Excel, puedes utilizar la clase ExcelWriter de pandas:
with pd.ExcelWriter('ruta/al/archivo_salida.xlsx') as escritor:
df1.to_excel(escritor, sheet_name='Hoja1', index=False)
df2.to_excel(escritor, sheet_name='Hoja2', index=False)
Reemplaza df1 y df2 con tus propios DataFrames. La clase ExcelWriter te permite escribir múltiples DataFrames en el mismo archivo de Excel.
Formatear la salida de Excel
Puedes aplicar varias opciones de formato a la salida de Excel, como establecer el ancho de columna, formatear celdas, agregar bordes, etc. Para un formato avanzado, es posible que necesites utilizar bibliotecas adicionales como openpyxl o xlrd.
Conclusión
En este tutorial, hemos cubierto los conceptos básicos de cómo leer y escribir archivos de Excel en Python utilizando la biblioteca pandas. Aprendiste cómo leer un archivo de Excel en un DataFrame, acceder y manipular los datos, escribir datos en un archivo de Excel y realizar operaciones adicionales como especificar nombres de hojas y formatear la salida. ¡Ahora puedes trabajar eficientemente con archivos de Excel en tus proyectos de Python!