Búsqueda de sitios web

7 algoritmos de aprendizaje automático que todo científico de datos debería conocer

Como científico de datos, debes dominar SQL y Python. Pero también puede resultar muy útil agregar el aprendizaje automático a su caja de herramientas.

Es posible que no siempre utilice el aprendizaje automático como científico de datos. Pero algu

Leer más →

Industrias en foco: aprendizaje automático para la detección de amenazas de ciberseguridad

Las amenazas a la ciberseguridad son cada vez más sofisticadas y numerosas. Para abordar estos desafíos, la industria ha recurrido al aprendizaje automático (ML) como herramienta para detectar y responder a la

Leer más →

Explorando LightGBM: Crecimiento de hojas con GBDT y GOSS

LightGBM es un marco de aumento de gradiente altamente eficiente. Ha ganado terreno por su velocidad y rendimiento, particularmente con conjuntos de datos grandes y complejos. Desarrollado por Microsoft, este poderoso algoritmo es conocido por su capacidad única para manejar grandes volúmenes de datos con significativa facilidad en comparación con los métodos tradicionales.

En esta publicación, experimentaremos con el marco LightGBM en el conjunto de datos de Ames Housing. En particular

Leer más →

7 proyectos de LLM para impulsar su cartera de aprendizaje automático

Los modelos de lenguaje grande (LLM) son muy útiles en una variedad de tareas. Crear aplicaciones basadas en LLM puede parecer bastante desalentador al principio. Pero todo lo que necesitas es:

Cómo configurar la validación cruzada de k-Fold

El procedimiento de validación cruzada k-fold es un método estándar para estimar el rendimiento de un algoritmo de aprendizaje automático en un conjunto de datos.

Un valor común para k es 10, aunque ¿cómo sabemos que esta configuración es apropiada para nuestro conjunto de datos y nuestros algoritmos?

Un enfoque consiste en explorar el efecto de diferentes valores k en la estimación del rendimiento del modelo y compararlo con una condición de prueba ideal. Esto p

Leer más →

Validación cruzada repetida de k-Fold para la evaluación de modelos en Python

El procedimiento de validación cruzada k-fold es un método estándar para estimar el rendimiento de un algoritmo o configuración de aprendizaje automático en un conjunto de datos.

Una sola ejecución del procedimiento de validación cruzada k veces puede dar como resultado una estimación ruidosa del rendimiento del modelo. Diferentes divisiones de los datos pueden dar lugar a resultados muy diferentes.

La validación cruzada repetida de k veces proporciona una manera de mejorar el ren

Leer más →

Cómo utilizar XGBoost para el pronóstico de series temporales

XGBoost es una implementación eficiente de aumento de gradiente para problemas de clasificación y regresión.

Es rápido y eficiente, funciona bien, si no el mejor, en una amplia gama de tareas de modelado predictivo y es uno de los favoritos entre los ganadores de competencias de ciencia de datos, como los de Kaggle.

XGBoost también se puede utilizar para el pronóstico de series de tiempo, aunque primero requiere que el conjunto de datos de la serie de tiempo se transforme en un pr

Leer más →

Clasificación desequilibrada de clases múltiples

La clasificación desequilibrada son aquellas tareas de predicción en las que la distribución de ejemplos entre etiquetas de clases no es igual.

La mayoría de los ejemplos de clasificación desequilibrada se centran en tareas de clasificación binaria; sin embargo, muchas de las herramientas y técnicas para la clasificación desequilibrada también admiten directamente problemas de clasificación de clases múltiples.

En este tutorial, descubrirá cómo utilizar las herramientas de clasifi

Leer más →

Cómo utilizar la visualización de datos de Seaborn para el aprendizaje automático

La visualización de datos proporciona información sobre la distribución y las relaciones entre las variables de un conjunto de datos.

Esta información puede resultar útil a la hora de seleccionar técnicas de preparación de datos que se aplicarán antes del modelado y los tipos de algoritmos que pueden ser más adecuados para los datos.

Seaborn es una biblioteca de visualización de datos para Python que se ejecuta sobre la popular biblioteca de visualización de datos Matplotlib, aunq

Leer más →

Una suave introducción a la teoría del aprendizaje computacional

La teoría del aprendizaje computacional, o teoría del aprendizaje estadístico, se refiere a marcos matemáticos para cuantificar algoritmos y tareas de aprendizaje.

Estos son subcampos del aprendizaje automático que un profesional del aprendizaje automático no necesita conocer en profundidad para lograr buenos resultados en una amplia gama de problemas. Sin embargo, es un subcampo en el que tener un conocimiento de alto nivel de algunos de los métodos más destacados puede proporcionar in

Leer más →