Implementación de Support Vector Machine para el análisis de la incidencia del dengue

  • José Daniel Díaz Pozo
  • Marcel Sebastián Lapierre Veintimilla

Resumen

Este artículo se centra en la implementación del algoritmo de Support Vector Machine (SVM) optimizado con el gradiente proyectado para clasificar la incidencia del dengue en la ciudad de Guayaquil según su humedad y precipitación. Debido a los cambios climáticos ocasionados por el calentamiento global, en conjunto con el fenómeno del Niño, esta enfermedad resulta una problemática importante para la salud pública, por lo que es necesario poder clasificar de manera precisa la incidencia del dengue en la ciudad, y así, responder eficientemente a las consecuencias del virus. El estudio se basa en la recopilación de datos, realizada en colaboración con el CIP-RRD, y análisis de estos sobre la incidencia del dengue y su relación con los factores ambientales antes mencionados. Se implementaron técnicas, como el truco del kernel, para mejorar la capacidad de clasificación del algoritmo y se realizaron pruebas con el dataset de Iris y PRNN, utilizando diferentes kernels con este último. Los resultados obtenidos verificaron la robustez del algoritmo, demostrando un gran desempeño en conjuntos linealmente separables o no. Luego, se definieron los hiperparámetros adecuados para brindar una solución equilibrada, entre una clasificación precisa y un margen adecuado para el estudio de nuevos datos. Así, se constató que el algoritmo de SVM procesa de forma óptima los datos no separables linealmente a través de la utilización del kernel RBF, concluyendo que con una humedad relativa promedio mayor a 80% y una precipitación promedio mayor a 10 mm, se prevé una alta incidencia de dengue.

Citas

Aruna and Rajagopalan (2011). A novel SVM based CSSFFS feature selection algorithm for detecting breast cancer.

Ayastuy, A. (2014). Optimización convexa, pages 1–3. Universidad de Sevilla.

Bhatia, R., Jindal, A., and Sood, M. (2016). Prediction of dengue outbreak using environmental factors.

Bottou, L. and Lin, C.-J. (2007). Support Vector Machine Solvers.

Caballero, J., Ruiz-Femenia, R., and Aracil, I. (2011). Simulación y Optimización de los Procesos Qu´ımicos, pages 38–41. Universidad de Alicante.

El Universo (2023). Ecuador supera ya los 23.000 casos de dengue, cifra más alta en los últimos siete años. https://www.eluniverso.com/noticias/ecuador/dengue-23-mil-casos-ecuador-fenomeno-de-el-nino-ministerio-de-salud-msp-nota/.

Elbers, A., Koenraadt, C., and Meiswinkel, R. (2015). Mosquitoes and culicoides biting midges: Vector range and the influence of climate change. Rev. Sci. Tech. Off. Int. Epizoot, 34:123–137. http://www.agripress.be/STUDIOEMMA UPLOADS/downloads/1 be 0 1 2 3 4 5.pdf.

Guo, P., Liu, T., Zhang, Q., Wang, L., Xiao, J., Zhang, Q., Luo, G., Li, Z., He, J., Zhang, Y., and Ma, W. (2017). Developing a dengue forecast model using machine
learning: A case study in china. PLOS. https://doi.org/10.1371/journal.pntd.0005973.

Huanga, S., Cai, N., Pacheco, P. P., Narandes, S., Wang, Y., and Xu, W. (2018). Applications of Support Vector Machine (SVM) Learning in Cancer Genomics.

Luenberger, D. and Ye, Y. (2008). Linear and Nonlinear Programming. Springer, 4 edition.

Martín, J. L. S. and Brathwaite-Dick, O. (2007). La estrategia de gestión integrada para la prevención y el control el dengue en la región de las américas. https://scielosp.org/pdf/rpsp/2007.v21n1/55-63/es.

Mello-Román, J., Mello-Román, J., Gómez-Guerrero, S., and Garcia-Torres, M. (2019). Predictive models for the medical diagnosis of dengue: A case study
in paraguay. Hindawi. https://doi.org/10.1155/2019/7307803.

Misra, R. (2019). Support Vector Machines-Soft Margin Formulation and Kernel Trick. https://towardsdatascience.com/support-vector-machines-soft-marginformulation-and-kernel-trick-4c9729dc8efe.

Rai, P. (2018). Optimization (Wrap-up), and Hyperplane based Classifiers (Perceptron and Support Vector Machines).

Ramos, A., Sánchez, P., Ferrer, J. M., Barquín, J., and Linares, P. (2010). Modelos matemáticos de optimización, pages 3–7. Universidad Pontificia Comillas.

Romano, J. D., Le, T. T., La Cava, W., Gregg, J. T., Goldberg, D. J., Chakraborty, P., Ray, N. L., Himmelstein, D., Fu, W., and Moore, J. H. (2021). PMLB v1.0: an open source dataset collection for benchmarking machine learning methods. arXiv preprint arXiv:2012.00058v2.

Salim, N. A. M., Wah, Y. B., Reeves, C., Smith, M., Yaacob, W. F. W., Mudin, R. N., Dapari, R., Sapri, N. N. F. F., and Haque, U. (2021). Prediction of dengue outbreak in selangor malaysia using machine learning techniques. Sci Rep 11. https://doi.org/10.1038/s41598-020-79193-2.

SAP (2017). El cambio clim´atico y las enfermedades transmitidas por vectores. https://www.sap.org.ar/uploads/archivos/general/files cambio-climatico-mosquitos-profesionales_1574722221.pdf.

Shi, Y., Liu, X., Kok, S., Rajarethinam, J., Liang, S., Yap, G., Chong, C.-S., Lee, K.-S., Tan, S., Chin, C., Lo, A., Kong,W., Ng, L., and Cook, A. (2015). Three-month real-time dengue forecast models: An early warning system for outbreak alerts and policy decision support in singapore. Environmental Health Perspectives. https://doi.org/10.1289/ehp.1509981.

Siriyasatien, P., Phumee, A., Ongruk, P., Jampachaisri, K., and Kesorn, K. (2016). Analysis of significant factors for dengue fever incidence prediction. BMC Bioinformatics,17:166. https://doi.org/10.1186/s12859-016-1034-5.

Sudheer, Sohani, S., Kumar, D., Malik, A., Chahar, B., Nema, A., Panigrahi, B., and Dhiman, R. (2013). A Support Vector Machine-Firefly Algorithm based forecasting model to determine malaria transmission.

UNA (2019). Introducci´on a la optimizaci´on con algoritmos. https://www.ing.una.py/pdf/umalca.pdf.

Vaerenbergh, V. and Santamar´ıa (2018). Métodos kernel para clasificación. https://gtas.unican.es/files/docencia/APS/apuntes/07 svm kernel.pdf.

Vapnik, V., Boser, B., and Guyon, I. (1992). A training algorithm for optimal margin classifiers. In: Proceedings of the Fifth Annual Workshop on Computational Learning Theory.

Vielba, A. (2019). Métodos de optimización convexa en aprendizaje automático. pages 17–19.

Wilimitis, D. (2018). The Kernel Trick in Support Vector Classification. https://towardsdatascience.com/the-kernel-trick-c98cdbcaeb3f.
Publicado
2024-02-15
Sección
Articulos