Librerias básicas de Python

Librerias básicas de Python#

Un módulo o module en Python es un fichero .py que alberga un conjunto de funciones, variables o clases y que puede ser usado por otros módulos. Por ejemplo, podemos definir un módulo llamado mimodulo.py con dos funciones: suma() y resta().

# mimodulo.py
def suma(a, b):
    return a + b

def resta(a, b):
    return a - b

Una vez definido, dicho módulo puede ser usado o importado en otro fichero, como mostramos a continuación. Usando import podemos importar todo el contenido.

# otromodulo.py
import mimodulo

print(mimodulo.suma(4, 3))   # 7
print(mimodulo.resta(10, 9)) # 1

---------------------------------------------------------------------------
ModuleNotFoundError                       Traceback (most recent call last)
Cell In[2], line 2
      1 # otromodulo.py
----> 2 import mimodulo
      4 print(mimodulo.suma(4, 3))   # 7
      5 print(mimodulo.resta(10, 9)) # 1

ModuleNotFoundError: No module named 'mimodulo'

Pandas#

Pandas es una libreria de python que permite representar datos mediante tablas. Lo cual permite manipular y analizar datos de manera visual. Cuando se usa Pandas, una tabla de datos se llama DataFrame y está compusta por Seriesque representan columnas con el mismo número de filas.

import pandas as pd#importamos la libreria a nuestro entorno

ciudades = pd.Series(['Bucaramanga', 'Bogotá', 'Málaga','Medellin','Cali'])#serie que contiene nombre de cuidades
poblacion_col = pd.Series([605047,7907000,19884,2569000,2234000])#serie que contiene la poblacion de cuidades
altura= pd.Series([900,2800,2200,1400,1000])
miprimerdata = pd.DataFrame({ 'Ciudades':ciudades,'Poblacion':poblacion_col,'Altura':altura})
miprimerdata.set_index('Ciudades',inplace=True)
miprimerdata

	Poblacion	Altura
Ciudades
Bucaramanga	605047	900
Bogotá	7907000	2800
Málaga	19884	2200
Medellin	2569000	1400
Cali	2234000	1000

Una de las ventajas de usar Pandas es que permite guardar los DataFrame en archivos de texto con formato csv

miprimerdata.to_csv('miprimerdata.csv', index=True)

Y tambien permite cargarlos al entorno donde se está trabajando.

datos_cargados=pd.read_csv('miprimerdata.csv')
datos_cargados.set_index('Ciudades',inplace=True)
datos_cargados

	Poblacion	Altura
Ciudades
Bucaramanga	605047	900
Bogotá	7907000	2800
Málaga	19884	2200
Medellin	2569000	1400
Cali	2234000	1000

Como se decia en la definicion, pandas permite manipular datos de manera visual

#acceder a toda la informacion disponible para la fila Bucaramanga
datos_cargados.loc['Bucaramanga']

	Bucaramanga
Poblacion	605047
Altura	900

dtype: int64

#nos arroja que filas del dataframe cumplen la condicion de poblacion>1000000
(datos_cargados['Poblacion']>1000000)

	Poblacion
Ciudades
Bucaramanga	False
Bogotá	True
Málaga	False
Medellin	True
Cali	True

dtype: bool

#nos arroja que filas del dataframe cumplen la condicion de 0<poblacion<20000000 (poblacion entre 2 millones y 3 millones)
(datos_cargados['Poblacion']>1000000)&(datos_cargados['Poblacion']<3000000)

	Poblacion
Ciudades
Bucaramanga	False
Bogotá	False
Málaga	False
Medellin	True
Cali	True

dtype: bool

#obtener el valor maximo en la culumna poblacion
datos_cargados['Poblacion'].max()

#obtener la cuidad con ese valor maximo de poblacion
(datos_cargados['Poblacion']==datos_cargados['Poblacion'].max())

	Poblacion
Ciudades
Bucaramanga	False
Bogotá	True
Málaga	False
Medellin	False
Cali	False

dtype: bool

Lo anterior nos permite entonces filtrar nuestros datos de forma eficiente

datos_cargados[(datos_cargados['Poblacion']>1000000)]

	Poblacion	Altura
Ciudades
Bogotá	7907000	2800
Medellin	2569000	1400
Cali	2234000	1000

datos_cargados[(datos_cargados['Poblacion']>1000000)&(datos_cargados['Poblacion']>2000000)]

	Poblacion	Altura
Ciudades
Bogotá	7907000	2800
Medellin	2569000	1400
Cali	2234000	1000

datos_cargados[(datos_cargados['Poblacion']==datos_cargados['Poblacion'].max())]

	Poblacion	Altura
Ciudades
Bogotá	7907000	2800

Pandas tambien permite graficar directamente desde el DataFrame

#kind puede ser line,bar,barh,hist,pie
datos_cargados["Poblacion"].plot(grid=True,kind="bar",title='Ciudad vs Poblacion',figsize=(15,5),xlabel='Ciudad',ylabel='Poblacion')

<Axes: title={'center': 'Ciudad vs Poblacion'}, xlabel='Ciudad', ylabel='Poblacion'>

../../_images/557e3810d3d01f5023d4501c0b7fc0c91222b55a34b1665f67a3f1a4d06a8616.png

#Visualizando y analizando datos reales

Para esta parte de la clase usaremos los datos meteorológicos recolectados por una estación de monitoreo meteorológico llamada eva y que está situada en la UIS.

#inatalamos la libreria necesaria para descargar los datos de la estacion
!pip install APIMakeSens

Collecting APIMakeSens
  Downloading APIMakeSens-1.4.8.tar.gz (19 kB)
  Preparing metadata (setup.py) ... ?25l?25hdone
Requirement already satisfied: pandas in /usr/local/lib/python3.10/dist-packages (from APIMakeSens) (2.2.2)
Requirement already satisfied: requests in /usr/local/lib/python3.10/dist-packages (from APIMakeSens) (2.32.3)
Collecting datetime (from APIMakeSens)
  Downloading DateTime-5.5-py3-none-any.whl.metadata (33 kB)
Collecting zope.interface (from datetime->APIMakeSens)
  Downloading zope.interface-7.0.3-cp310-cp310-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (43 kB)
     ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 43.6/43.6 kB 2.9 MB/s eta 0:00:00
?25hRequirement already satisfied: pytz in /usr/local/lib/python3.10/dist-packages (from datetime->APIMakeSens) (2024.2)
Requirement already satisfied: numpy>=1.22.4 in /usr/local/lib/python3.10/dist-packages (from pandas->APIMakeSens) (1.26.4)
Requirement already satisfied: python-dateutil>=2.8.2 in /usr/local/lib/python3.10/dist-packages (from pandas->APIMakeSens) (2.8.2)
Requirement already satisfied: tzdata>=2022.7 in /usr/local/lib/python3.10/dist-packages (from pandas->APIMakeSens) (2024.2)
Requirement already satisfied: charset-normalizer<4,>=2 in /usr/local/lib/python3.10/dist-packages (from requests->APIMakeSens) (3.3.2)
Requirement already satisfied: idna<4,>=2.5 in /usr/local/lib/python3.10/dist-packages (from requests->APIMakeSens) (3.10)
Requirement already satisfied: urllib3<3,>=1.21.1 in /usr/local/lib/python3.10/dist-packages (from requests->APIMakeSens) (2.2.3)
Requirement already satisfied: certifi>=2017.4.17 in /usr/local/lib/python3.10/dist-packages (from requests->APIMakeSens) (2024.8.30)
Requirement already satisfied: six>=1.5 in /usr/local/lib/python3.10/dist-packages (from python-dateutil>=2.8.2->pandas->APIMakeSens) (1.16.0)
Requirement already satisfied: setuptools in /usr/local/lib/python3.10/dist-packages (from zope.interface->datetime->APIMakeSens) (71.0.4)
Downloading DateTime-5.5-py3-none-any.whl (52 kB)
   ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 52.6/52.6 kB 4.4 MB/s eta 0:00:00
?25hDownloading zope.interface-7.0.3-cp310-cp310-manylinux_2_5_x86_64.manylinux1_x86_64.manylinux_2_17_x86_64.manylinux2014_x86_64.whl (254 kB)
   ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 254.1/254.1 kB 9.0 MB/s eta 0:00:00
?25hBuilding wheels for collected packages: APIMakeSens
  Building wheel for APIMakeSens (setup.py) ... ?25l?25hdone
  Created wheel for APIMakeSens: filename=APIMakeSens-1.4.8-py3-none-any.whl size=19669 sha256=1c573d418d3dcbeb1bd364fc74582d90d6ea1af53909a0b6939fbe114e1db0ca
  Stored in directory: /root/.cache/pip/wheels/86/5a/28/0d6b05a7f54e48cbffcf89892da31a54238d562bcb85662cc5
Successfully built APIMakeSens
Installing collected packages: zope.interface, datetime, APIMakeSens
Successfully installed APIMakeSens-1.4.8 datetime-5.5 zope.interface-7.0.3

#descargamos los datos
from MakeSens import MakeSens
#download_data(id_device,start_date,end_date, sample_rate, logs = False,data_type = 'RAW',file_format=None,fields=None)
datos = MakeSens.download_data(id_device='E2_00021',start_date='2024-09-01 00:00:00',end_date='2024-09-30 23:59:59',sample_rate='1T',fields="temperatura,presion,humedad")

/usr/local/lib/python3.10/dist-packages/MakeSens/MakeSens.py:104: FutureWarning: 'T' is deprecated and will be removed in a future version, please use 'min' instead.
  dataframe_data = dataframe_data.resample(sample_rate).mean()

datos.head(20)

	humedad	presion	temperatura
ts
2024-09-19 15:09:00	62.776527	903.217529	27.376667
2024-09-19 15:10:00	62.030273	903.204834	27.479998
2024-09-19 15:11:00	61.586670	903.197327	27.550835
2024-09-19 15:12:00	61.057049	903.180176	27.617500
2024-09-19 15:13:00	60.898602	903.164734	27.687500
2024-09-19 15:14:00	60.767170	903.147644	27.759996
2024-09-19 15:15:00	60.381916	903.160645	27.831667
2024-09-19 15:16:00	60.333984	903.138000	27.905832
2024-09-19 15:17:00	60.283123	903.140808	27.974997
2024-09-19 15:18:00	60.315350	903.151428	28.050837
2024-09-19 15:19:00	60.121746	903.149658	28.105001
2024-09-19 15:20:00	60.008789	903.137268	28.163332
2024-09-19 15:21:00	59.890625	903.141907	28.235832
2024-09-19 15:22:00	59.625896	903.094910	28.286669
2024-09-19 15:23:00	59.591228	903.057800	28.359167
2024-09-19 15:24:00	59.375488	903.000244	28.425833
2024-09-19 15:25:00	58.913250	902.982666	28.485832
2024-09-19 15:26:00	NaN	NaN	NaN
2024-09-19 15:27:00	58.628989	902.959564	28.562084
2024-09-19 15:28:00	58.646809	902.913391	28.662498

#el dataframe contiene 16167 filas
datos.info()

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 16371 entries, 2024-09-19 15:09:00 to 2024-09-30 23:59:00
Freq: min
Data columns (total 3 columns):
 #   Column       Non-Null Count  Dtype  
---  ------       --------------  -----  
 0   humedad      16167 non-null  float64
 1   presion      16167 non-null  float64
 2   temperatura  16167 non-null  float64
dtypes: float64(3)
memory usage: 511.6 KB

#graficamos los datos de fecha vs temperatura
datos['temperatura'].plot(grid=True,title='Fecha vs Temperatura',figsize=(15,5),xlabel='Fecha',ylabel='Temperatura[°c]')

<Axes: title={'center': 'Fecha vs Temperatura'}, xlabel='Fecha', ylabel='Temperatura[°c]'>

../../_images/e21ee3ffe77d8b863d5c8c02fe80a324ae1c930e20a192085d88ef570b9626fe.png

#Preguntas

Librerias básicas de Python

Contents

Librerias básicas de Python#

Pandas#

1. ¿Cual es la temperatura maxima registrada?. ¿En que dia se registró?#

2. ¿Cual es la temperatura minima registrada?. ¿En que dia se registró?#

3. ¿Cual es la temperatura promedio de los datos mostrado en la grafica anterior?#