Búsqueda de sitios web

5 cursos gratuitos para dominar datos con Python


¿Quiere aprender discretas de datos con Python con un presupuesto? No se preocupe, hay (al menos) cinco cursos gratuitos que le proporcionarán un conocimiento sólido.

La gestión de datos requiere una gran cantidad de tiempo en varios roles de datos populares, como analistas de datos, científicos de datos e ingenieros de datos.

A menudo, su herramienta principal para la disputa de datos es Python debido a su naturaleza flexible y bibliotecas de procesamiento de datos, como pandas y numpy.

Si aspira a uno de los roles que mencioné, es muy aconsejable aprender a aprender datos en Python. También muy recomendable es saber qué diablos es realmente la disputa.

¿Qué es la manipulación de datos?

La manipulación de datos o manipulación de datos es el proceso de manejo de datos sin procesar donde se preparan para el análisis.

Incluye varias tareas distintas.

1. Recopilación de datos

Aquí, recopila datos sin procesar necesarios, estructurados, semiestructurados o no estructurados, de fuentes como:

  • Bases de datos

  • API
  • Hojas de cálculo
  • Archivos CSV
  • Raspado web
  • Entrada manual

2. Limpieza de datos

El objetivo aquí es garantizar que el conjunto de datos sea confiable mediante:

  • Imputar o eliminar valores faltantes

  • Corrección de errores
  • Estandarización de formatos
  • Eliminar valores atípicos

3. Estructuración de datos

Esta tarea mejora la eficiencia del análisis al organizar los datos en un formato consistente, por ejemplo, al girar o fusionar tablas.

4. Transformación de datos

Esta tarea implica hacer que los datos sean más adecuados para un análisis particular por:

  • Aplicar operaciones matemáticas

  • Convertir tipos de datos (por ejemplo, de cadenas a enteros)
  • Normalización de valores
  • Creación de nuevas funciones
  • Combinar o dividir columnas

5. Enriquecimiento de datos

Con esta tarea, agrega datos externos para agregar valor y contexto a los datos existentes. Por ejemplo, puede agregar datos demográficos a los datos de compra de los clientes para obtener mejores conocimientos sobre los patrones de compra.

6. Validación de datos

Aquí es donde verifica los datos de precisión y consistencia, por ejemplo, verificar que las transformaciones de datos se han aplicado correctamente o que no quedan anomalías en los datos.

Ahora que tenemos una idea clara de lo que buscamos en los programas de estudios, veamos esos cinco cursos gratuitos.

1. Conceptos básicos de la disputa de datos de Python

Enlace del curso: conceptos básicos de la disputa de datos de Python

Proveedor: excelente aprendizaje

Dificultad: principiante

Descripción: Este es un curso para principiantes que le enseña conceptos de manipulación de datos con Python, centrándose en pandas y NumPy:

  • Explorando una página web usando inspeccionar()

  • Introducción a Regex
  • Encontrar caracteres en un texto
  • Uso de cuantificadores para que coincidan los patrones
  • grupos de personajes coincidentes
  • Introducción al raspado web
  • leer, raspar y guardar los datos
  • Datos de texto de disputas usando Regex
  • Exploración de datos

2. Python pandas para tu abuelo

Enlace del curso: Python Pandas para tu abuelo

Proveedor: GormAnalysis

Dificultad: principiante a intermedio

Descripción: Este curso se crea para principiantes que están aprendiendo a trabajar con pandas para disputas de datos. Sin embargo, el conocimiento cubierto se extiende desde el principiante hasta el territorio intermedio.

En la sección de la serie, primero aprenderá la creación de la serie, la indexación, las operaciones básicas, los valores faltantes, la vectorización y el método Aplicar().

La siguiente sección DataFrame le enseña cosas similares, pero esta vez en Dataframes, con la adición de los métodos Merge() y GroupBy().

La sección avanzada cubre los siguientes temas:

  • Instrumentos de cuerda

  • Fechas y tiempos
  • categórico
  • multiíndex
  • DataFrame Resalting

Cada sección termina con varios desafíos y la sección final, Final Boss, tiene cinco desafíos adicionales.

3. Análisis de datos con Python

Enlace del curso: Análisis de datos con Python

Proveedor: freeCodeCamp

Dificultad: principiante a intermedio

Descripción: Con este curso, aprenderá sobre el proceso de análisis de datos. Tal vez eso te parece más de lo que necesitas, pero una buena parte del curso está dedicada a la disputa de datos y temas relacionados. El curso cubre temas como leer datos de fuentes como CSV, SQL y Excel, limpieza y transformación de datos con pandas y numpy, y también visualizarlos con matplotlib y Seaborn.

La sección final del curso tiene cinco proyectos de análisis de datos de Python, que son excelentes para la práctica. (Y necesario para reclamar su certificación).

4. Datos dispuestos con python pandas

Enlace del curso: Gestión de datos con Python Pandas

Proveedor: El profesor de análisis

Dificultad: intermedia

Descripción: esta lista de reproducción intermedia de YouTube requiere cierta familiaridad con Python. Enseña cómo manejar datos usando pandas cubriendo temas como filtrar, ordenar y manejar valores faltantes.

Aquí está la lista de temas:

  • Uso de la serie Python Pandas

  • Uso de Python Pandas Dataframes
  • Seleccionar, filtrar y clasificar los marcos de datos de Python Pandas
  • Datos que luchan con Python y Pandas
  • Trabajando con fechas y horarios en Python Pandas
  • Eliminar registros duplicados en Python Pandas
  • Agrupar y agregar datos en Python Pandas

5. Precrocesamiento de datos de aprendizaje automático y disputas de datos utilizando Python

Enlace del curso: Preprocesamiento y manipulación de datos de aprendizaje automático con Python

Proveedor: La Universidad de IA

Dificultad: intermedia

Descripción: una lista de reproducción de YouTube intermedia más. Le enseña a las disputas de datos con Python en el contexto del aprendizaje automático. Si bien emplea algunas técnicas avanzadas, la mayoría de ellas también son aplicables a algunas tareas de disputa de datos más simples. En otras palabras, no necesariamente tiene que estar con el objetivo de construir un modelo ML.

Enseña estos temas:

  • Valores faltantes e imputación del conjunto de datos

  • Codificación one-hot para procesar variables categóricas
  • Dividir datos en conjuntos de entrenamiento y prueba
  • Escalado de funciones en ML
  • Detección y tratamiento de valores atípicos
  • Transformación de registros para valores atípicos
  • Tratamiento de valores atípicos con transformación de raíz cuadrada
  • Agregar y soltar columnas
  • Crear tablas dinámicas
  • RegEx para dividir una cadena en columnas de DataFrame
  • Usando map(), apply() y applymap()
  • Fusionar marcos de datos

Conclusión

Los cinco cursos que mencioné anteriormente son una gran puerta de entrada para aprender datos de datos en Python. Junto con eso, mejorará sus habilidades generales de Python y, especialmente, su conocimiento de pandas y bibliotecas numpy.

Algunos cursos también pueden llevarlo en nuevas direcciones, como el análisis de datos o el aprendizaje automático. Esto es bueno porque la disputa de datos rara vez es el punto en sí mismo. Por lo tanto, aprender sobre las otras etapas donde se usan los datos dispuestos solo puede beneficiarlo.