Búsqueda de sitios web
Como científico de datos, debes dominar SQL y Python. Pero también puede resultar muy útil agregar el aprendizaje automático a su caja de herramientas.
Es posible que no siempre utilice el aprendizaje automático como científico de datos. Pero algu
Leer más →Las amenazas a la ciberseguridad son cada vez más sofisticadas y numerosas. Para abordar estos desafíos, la industria ha recurrido al aprendizaje automático (ML) como herramienta para detectar y responder a la
Leer más →LightGBM es un marco de aumento de gradiente altamente eficiente. Ha ganado terreno por su velocidad y rendimiento, particularmente con conjuntos de datos grandes y complejos. Desarrollado por Microsoft, este poderoso algoritmo es conocido por su capacidad única para manejar grandes volúmenes de datos con significativa facilidad en comparación con los métodos tradicionales.
En esta publicación, experimentaremos con el marco LightGBM en el conjunto de datos de Ames Housing. En particular
Leer más →Los modelos de lenguaje grande (LLM) son muy útiles en una variedad de tareas. Crear aplicaciones basadas en LLM puede parecer bastante desalentador al principio. Pero todo lo que necesitas es:
El procedimiento de validación cruzada k-fold es un método estándar para estimar el rendimiento de un algoritmo de aprendizaje automático en un conjunto de datos.
Un valor común para k es 10, aunque ¿cómo sabemos que esta configuración es apropiada para nuestro conjunto de datos y nuestros algoritmos?
Un enfoque consiste en explorar el efecto de diferentes valores k en la estimación del rendimiento del modelo y compararlo con una condición de prueba ideal. Esto p
Leer más →El procedimiento de validación cruzada k-fold es un método estándar para estimar el rendimiento de un algoritmo o configuración de aprendizaje automático en un conjunto de datos.
Una sola ejecución del procedimiento de validación cruzada k veces puede dar como resultado una estimación ruidosa del rendimiento del modelo. Diferentes divisiones de los datos pueden dar lugar a resultados muy diferentes.
La validación cruzada repetida de k veces proporciona una manera de mejorar el ren
Leer más →XGBoost es una implementación eficiente de aumento de gradiente para problemas de clasificación y regresión.
Es rápido y eficiente, funciona bien, si no el mejor, en una amplia gama de tareas de modelado predictivo y es uno de los favoritos entre los ganadores de competencias de ciencia de datos, como los de Kaggle.
XGBoost también se puede utilizar para el pronóstico de series de tiempo, aunque primero requiere que el conjunto de datos de la serie de tiempo se transforme en un pr
Leer más →La clasificación desequilibrada son aquellas tareas de predicción en las que la distribución de ejemplos entre etiquetas de clases no es igual.
La mayoría de los ejemplos de clasificación desequilibrada se centran en tareas de clasificación binaria; sin embargo, muchas de las herramientas y técnicas para la clasificación desequilibrada también admiten directamente problemas de clasificación de clases múltiples.
En este tutorial, descubrirá cómo utilizar las herramientas de clasifi
Leer más →La visualización de datos proporciona información sobre la distribución y las relaciones entre las variables de un conjunto de datos.
Esta información puede resultar útil a la hora de seleccionar técnicas de preparación de datos que se aplicarán antes del modelado y los tipos de algoritmos que pueden ser más adecuados para los datos.
Seaborn es una biblioteca de visualización de datos para Python que se ejecuta sobre la popular biblioteca de visualización de datos Matplotlib, aunq
Leer más →La teoría del aprendizaje computacional, o teoría del aprendizaje estadístico, se refiere a marcos matemáticos para cuantificar algoritmos y tareas de aprendizaje.
Estos son subcampos del aprendizaje automático que un profesional del aprendizaje automático no necesita conocer en profundidad para lograr buenos resultados en una amplia gama de problemas. Sin embargo, es un subcampo en el que tener un conocimiento de alto nivel de algunos de los métodos más destacados puede proporcionar in
Leer más →