Predicción del acceso a la electricidad en hogares brasileños mediante aprendizaje automático
Palabras clave:
Aprendizaje automático, Electricidad, Accesibilidad a los servicios de salud, Algoritmos de aprendizaje automático basados en boosting, Modelos teóricos, Estudios transversalesContenido principal del artículo
Introducción: A pesar de los avances hacia el acceso universal a la electricidad en Brasil, persisten focos de exclusión energética, especialmente en zonas rurales y en la región Norte. Identificar con precisión estos territorios es esencial para apoyar políticas públicas más eficaces y basadas en evidencia.
Objetivo: Proponer y evaluar un modelo de aprendizaje automático para estimar el porcentaje de hogares con acceso a la electricidad en Brasil, utilizando indicadores socioeconómicos del Índice de Desarrollo de Ciudades Sostenibles (IDCS).
Metodología: El estudio empleó un pipeline de ciencia de datos que incluyó el preprocesamiento de los indicadores del IDCS, la selección de variables y el ajuste de hiperparámetros. Se probaron diferentes algoritmos de aprendizaje supervisado, evaluando el desempeño mediante métricas de error, especialmente RMSE y MAPE. Tras pruebas comparativas, XGBoost fue seleccionado como el modelo más adecuado.
Resultados: XGBoost presentó el mejor desempeño predictivo, con un RMSE promedio de 3,42 y un MAPE de 1,78 %, lo que indica alta precisión en la estimación del acceso a la electricidad. Las variables más relevantes fueron el ingreso de la población más pobre, la proporción de áreas forestales y naturales, y los indicadores relacionados con la educación de los jóvenes.
Conclusión: Los resultados demuestran el potencial del aprendizaje automático como herramienta para apoyar diagnósticos territoriales y la formulación de políticas públicas orientadas a la universalización del acceso a la electricidad. El modelo propuesto contribuye a identificar determinantes estructurales de la exclusión energética, aportando evidencia técnica para orientar intervenciones más focalizadas y eficientes.
1. Galindo, MF. Acceso universal a la electricidad en zonas remotas: Construyendo un camino hacia la universalización en el Amazonas brasileño [Internet]. Estocolmo (SE): KTH Ingeniería Industrial y Gestión, Real Instituto de Tecnología; 2014 [citado 16 de diciembre de 2025]. Disponible en: https://www.diva-portal.org/smash/get/diva2:719200/fulltext01.pdf
2. Leduchowicz-Municio A, López-Gonzáles A, Domenech B, Ferrer-Martí L, Udaeta ME, Gimenes AL. Electrificación rural de última milla: Lecciones aprendidas de los programas de universalización en Brasil y Venezuela. Política energética. 2022; 167:113080.
https://doi.org/10.1016/j.enpol.2022.113080
3. Pereira JD, Santos MA, Bandeira FD, Soares FI, Vieira TA. Electrificación en regiones remotas: Un análisis del programa More Light for Amazon. Energías. 2023; 16(12):4663.
https://doi.org/10.3390/en16124663
4. Lipscomb M, Mobarak AM, Barham T. Efectos del desarrollo de la electrificación: Evidencia de la colocación topográfica de centrales hidroeléctricas en Brasil. American Economic Journal: Economía aplicada. 2013; 5(2):200–231. Disponible en:
https://www.aeaweb.org/articles?id=10.1257/app.5.2.200
5. Brasil. Ministério de Minas e Energía (BR). Resenha energética brasileira: Ejercicio de 2022 [Internet]. Brasilia (DF): Ministério de Minas e Energía; 2023 [citado 16 de diciembre de 2025]. Disponible en: https://www.gov.br/mme/pt-br/assuntos/secretarias/sntep/publicacoes/resenha-energetica-brasileira/resenhas/resenha-energetica-2022.pdf/view
6. Khandker SR, Barnes DF, Samad HA. ¿Son también pobres en energía quienes tienen pocos ingresos? Pruebas de la India. Política energética. 2012; 47:1–12.
https://doi.org/10.1016/j.enpol.2012.02.028
7. Santillán OS, Cedano KG, Martínez M. Análisis de la pobreza energética en 7 países latinoamericanos utilizando un índice multidimensional de pobreza energética. Energías. 2020; 13(7):1608.
https://doi.org/10.3390/en13071608
8. Wang F, Geng H, Zha D, Zhang C. Pobreza energética multidimensional en China: Características de medición y disparidades espaciotemporales. Investigación de indicadores sociales. 2023; 168:45–78.
https://doi.org/10.1007/s11205-023-03129-2
9. Freitas GF, Oliveira ML. Un análisis del programa Luz para Todos del Gobierno Federal. Revista de Extensión y Estudios Rurales. 2017; 6(2):143–155.
https://doi.org/10.18540/rever622017143-155
10. Instituto de Ciudades Sostenibles. IDSC-BR: Introducción al Índice de Desarrollo Sostenible de Ciudades – Brasil [Internet]. São Paulo: Instituto de Ciudades Sostenibles; [fecha desconocida] [citado 15 de septiembre de 2025]. Disponible en:
https://idsc.cidadessustentaveis.org.br/introduction
11. Naciones Unidas, Brasil. Agenda 2030 para el Desarrollo Sostenible [Internet]. Brasilia (DF): Naciones Unidas Brasil; 15 de septiembre de 2015 [citado 16 de diciembre de 2025]. Disponible en:
https://brasil.un.org/pt-br/91863-agenda-2030-para-o-desenvolvimento-sustent%C3%A1vel
12. Instituto de Ciudades Sostenibles. IDSC-BR: Índice de Desarrollo Sostenible de Ciudades – Brasil [Internet]. São Paulo: Instituto de Ciudades Sostenibles; [fecha desconocida] [citado 15 de septiembre de 2025]. Disponible en:
https://www.cidadessustentaveis.org.br/paginas/idsc-br
13. Hoerl AE, Kennard RW. Regresión de crestas: Estimación sesgada para problemas no ortogonales. Tecnometría. 1970; 12(1):55–67.
https://doi.org/10.2307/1267351
14. Tibshirani R. Contracción y selección por regresión mediante el lazo. Journal of the Royal Statistical Society: Serie B. 1996; 58(1):267–288. Disponible en:
https://www.jstor.org/stable/2346178
15. Breiman L. Bosques aleatorios. Aprendizaje automático. 2001; 45(1):5–32.
https://doi.org/10.1023/A:1010933404324
16. Chen T, Guestrin C. XGBoost: Un sistema escalable de mejora de árboles. En las Actas de la 22ª Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos [Internet]; 13–17 de agosto de 2016; San Francisco, CA. Nueva York (NY): Asociación de Maquinaria de Computación; 2016 [citado 16 de diciembre de 2025]. p. 785–794).
https://doi.org/10.1145/2939672.2939785
17. Scikit-learn. sklearn.svm.SVR — documentación scikit-learn 1.3.0 [Internet]. [citado 15 de septiembre de 2025]. Disponible en:
https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVR.html
18. Rosenblatt F. El perceptrón: Un modelo probabilístico para el almacenamiento y organización de la información en el cerebro. Revisión psicológica. 1958; 65(6):386–408. Disponible en:
https://www.ling.upenn.edu/courses/cogs501/Rosenblatt1958.pdf
19. Scikit-learn. sklearn.neural_network. MLPRegressor — documentación scikit-learn 1.3.0 [Internet]. [citado 15 de septiembre de 2025]. Disponible en:
https://scikitlearn.org/stable/modules/generated/sklearn.neural_network.MLPRegressor.html
20. Scikit-learn. sklearn.impute. IterativeImputer — documentación scikit-learn 1.3.0 [Internet]. [citado 15 de septiembre de 2025]. Disponible en:
https://scikit-learn.org/stable/modules/generated/sklearn.impute.IterativeImputer.html
21. Van Buuren S. Imputación flexible de datos faltantes. 2ª ed. Chapman y Hall/CRC; 2018.
22. Van Buuren S, Groothuis-Oudshoorn K. MICE: Imputación multivariante por ecuaciones encadenadas en R. Journal of Statistical Software. 2011; 45(3):1–67.
https://doi.org/10.18637/jss.v045.i03
23. Kolmogorov AN. Sobre la determinación empírica de una ley de distribución. Revista del Instituto Italiano de Actuarios. 1933; 4:83–91. Disponible en:
http://digitale.bnc.roma.sbn.it/tecadigitale/giornale/CFI0353791/1933/unico/00000093
24. Massey FJ. La prueba Kolmogorov-Smirnov para comprobar la bonura del ajuste. Revista de la Asociación Estadística Americana. 1951; 46(253):68–78.
https://doi.org/10.1080/01621459.1951.10500769
25. Smirnov N. Tabla para estimar la bondad del ajuste de distribuciones empíricas. Anales de Estadística Matemática. 1948; 19(2):279–281. Disponible en:
https://www.jstor.org/stable/2236278
26. Akoglu H. Guía del usuario sobre coeficientes de correlación. Revista Turca de Medicina de Urgencias. 2018; 18(3):91–93.
https://doi.org/10.1016/j.tjem.2018.08.001
27. Marquardt DW. Inversos generalizados, regresión de crestas, estimación lineal sesgada y estimación no lineal. Tecnometría. 1970; 12(3):591–612.
https://doi.org/10.1080/00401706.1970.10488699
28. Burman P. Un estudio comparativo de la validación cruzada ordinaria, la validación cruzada en v-fold y los métodos repetidos de pruebas de aprendizaje. Biometrika. 1989; 76(3):503-514.
https://doi.org/10.2307/2336116
29. Shapiro SS, Wilk MB. Un análisis de la prueba de varianza para verificar la normalidad (muestras completas). Biometrika, v. 52, n. 3–4, p. 591–611, 1965.
https://doi.org/10.2307/2333709
30. Kruskal WH, Wallis W. A. Uso de rangos en el análisis de varianza de un solo criterio. Revista de la Asociación Estadística Americana. 1952; 47(260):583–621.
https://doi.org/10.2307/2280779
31. Lundberg SM., Lee S-I. Un enfoque unificado para interpretar las predicciones de modelos. En actas de la 31ª Conferencia Internacional sobre Sistemas de Procesamiento de Información Neuronal (NIPS 2017) [Internet]; 4-9 de diciembre de 2017; Long Beach, CA, EE. UU. Red Hook (NY): Curran Associates; 2017 [citado 16 de diciembre de 2025]. p. 4765–4774. Disponible en:
https://papers.nips.cc/paper_files/paper/2017/file/8a20a8621978632d76c43dfd28b67767-Paper.pdf
32. Instituto de Ciudades Sostenibles. Agenda 2030 [Internet]. São Paulo: Instituto de Ciudades Sostenibles; [fecha desconocida] [citado 15 de septiembre de 2025]. Disponible en:
https://www.cidadessustentaveis.org.br/institucional/pagina/agenda2030
Downloads

Esta obra está bajo una licencia internacional Creative Commons Atribución-NoComercial-CompartirIgual 4.0.
Los autores que publican en esta revista están de acuerdo con los siguientes términos:
Los autores ceden los derechos patrimoniales a la revista y a la Universidad del Valle sobre los manuscritos aceptados, pero podrán hacer los reusos que consideren pertinentes por motivos profesionales, educativos, académicos o científicos, de acuerdo con los términos de la licencia que otorga la revista a todos sus artículos.
Los artículos serán publicados bajo la licencia Creative Commons 4.0 BY-NC-SA (de atribución, no comercial, sin obras derivadas).