Predicción del acceso a la electricidad en hogares brasileños mediante aprendizaje automático

Publicado: 20-04-2026

Contenido principal del artículo

Autores/as

Introducción: A pesar de los avances hacia el acceso universal a la electricidad en Brasil, persisten focos de exclusión energética, especialmente en zonas rurales y en la región Norte. Identificar con precisión estos territorios es esencial para apoyar políticas públicas más eficaces y basadas en evidencia.


Objetivo: Proponer y evaluar un modelo de aprendizaje automático para estimar el porcentaje de hogares con acceso a la electricidad en Brasil, utilizando indicadores socioeconómicos del Índice de Desarrollo de Ciudades Sostenibles (IDCS).


Metodología: El estudio empleó un pipeline de ciencia de datos que incluyó el preprocesamiento de los indicadores del IDCS, la selección de variables y el ajuste de hiperparámetros. Se probaron diferentes algoritmos de aprendizaje supervisado, evaluando el desempeño mediante métricas de error, especialmente RMSE y MAPE. Tras pruebas comparativas, XGBoost fue seleccionado como el modelo más adecuado.


Resultados: XGBoost presentó el mejor desempeño predictivo, con un RMSE promedio de 3,42 y un MAPE de 1,78 %, lo que indica alta precisión en la estimación del acceso a la electricidad. Las variables más relevantes fueron el ingreso de la población más pobre, la proporción de áreas forestales y naturales, y los indicadores relacionados con la educación de los jóvenes.


Conclusión: Los resultados demuestran el potencial del aprendizaje automático como herramienta para apoyar diagnósticos territoriales y la formulación de políticas públicas orientadas a la universalización del acceso a la electricidad. El modelo propuesto contribuye a identificar determinantes estructurales de la exclusión energética, aportando evidencia técnica para orientar intervenciones más focalizadas y eficientes.

Leandro Scala da Rocha, Universidade Federal Rural do Rio de Janeiro

.

João Bosco Gonçalves, Universidade Federal do Espírito Santo

.

1.
Predicción del acceso a la electricidad en hogares brasileños mediante aprendizaje automático. inycomp. 2026;28(1):e-21315506. doi:10.25100/iyc.v28i1.15506

1. Galindo, MF. Acceso universal a la electricidad en zonas remotas: Construyendo un camino hacia la universalización en el Amazonas brasileño [Internet]. Estocolmo (SE): KTH Ingeniería Industrial y Gestión, Real Instituto de Tecnología; 2014 [citado 16 de diciembre de 2025]. Disponible en: https://www.diva-portal.org/smash/get/diva2:719200/fulltext01.pdf

2. Leduchowicz-Municio A, López-Gonzáles A, Domenech B, Ferrer-Martí L, Udaeta ME, Gimenes AL. Electrificación rural de última milla: Lecciones aprendidas de los programas de universalización en Brasil y Venezuela. Política energética. 2022; 167:113080.

https://doi.org/10.1016/j.enpol.2022.113080

3. Pereira JD, Santos MA, Bandeira FD, Soares FI, Vieira TA. Electrificación en regiones remotas: Un análisis del programa More Light for Amazon. Energías. 2023; 16(12):4663.

https://doi.org/10.3390/en16124663

4. Lipscomb M, Mobarak AM, Barham T. Efectos del desarrollo de la electrificación: Evidencia de la colocación topográfica de centrales hidroeléctricas en Brasil. American Economic Journal: Economía aplicada. 2013; 5(2):200–231. Disponible en:

https://www.aeaweb.org/articles?id=10.1257/app.5.2.200

5. Brasil. Ministério de Minas e Energía (BR). Resenha energética brasileira: Ejercicio de 2022 [Internet]. Brasilia (DF): Ministério de Minas e Energía; 2023 [citado 16 de diciembre de 2025]. Disponible en: https://www.gov.br/mme/pt-br/assuntos/secretarias/sntep/publicacoes/resenha-energetica-brasileira/resenhas/resenha-energetica-2022.pdf/view

6. Khandker SR, Barnes DF, Samad HA. ¿Son también pobres en energía quienes tienen pocos ingresos? Pruebas de la India. Política energética. 2012; 47:1–12.

https://doi.org/10.1016/j.enpol.2012.02.028

7. Santillán OS, Cedano KG, Martínez M. Análisis de la pobreza energética en 7 países latinoamericanos utilizando un índice multidimensional de pobreza energética. Energías. 2020; 13(7):1608.

https://doi.org/10.3390/en13071608

8. Wang F, Geng H, Zha D, Zhang C. Pobreza energética multidimensional en China: Características de medición y disparidades espaciotemporales. Investigación de indicadores sociales. 2023; 168:45–78.

https://doi.org/10.1007/s11205-023-03129-2

9. Freitas GF, Oliveira ML. Un análisis del programa Luz para Todos del Gobierno Federal. Revista de Extensión y Estudios Rurales. 2017; 6(2):143–155.

https://doi.org/10.18540/rever622017143-155

10. Instituto de Ciudades Sostenibles. IDSC-BR: Introducción al Índice de Desarrollo Sostenible de Ciudades – Brasil [Internet]. São Paulo: Instituto de Ciudades Sostenibles; [fecha desconocida] [citado 15 de septiembre de 2025]. Disponible en:

https://idsc.cidadessustentaveis.org.br/introduction

11. Naciones Unidas, Brasil. Agenda 2030 para el Desarrollo Sostenible [Internet]. Brasilia (DF): Naciones Unidas Brasil; 15 de septiembre de 2015 [citado 16 de diciembre de 2025]. Disponible en:

https://brasil.un.org/pt-br/91863-agenda-2030-para-o-desenvolvimento-sustent%C3%A1vel

12. Instituto de Ciudades Sostenibles. IDSC-BR: Índice de Desarrollo Sostenible de Ciudades – Brasil [Internet]. São Paulo: Instituto de Ciudades Sostenibles; [fecha desconocida] [citado 15 de septiembre de 2025]. Disponible en:

https://www.cidadessustentaveis.org.br/paginas/idsc-br

13. Hoerl AE, Kennard RW. Regresión de crestas: Estimación sesgada para problemas no ortogonales. Tecnometría. 1970; 12(1):55–67.

https://doi.org/10.2307/1267351

14. Tibshirani R. Contracción y selección por regresión mediante el lazo. Journal of the Royal Statistical Society: Serie B. 1996; 58(1):267–288. Disponible en:

https://www.jstor.org/stable/2346178

15. Breiman L. Bosques aleatorios. Aprendizaje automático. 2001; 45(1):5–32.

https://doi.org/10.1023/A:1010933404324

16. Chen T, Guestrin C. XGBoost: Un sistema escalable de mejora de árboles. En las Actas de la 22ª Conferencia Internacional ACM SIGKDD sobre Descubrimiento de Conocimiento y Minería de Datos [Internet]; 13–17 de agosto de 2016; San Francisco, CA. Nueva York (NY): Asociación de Maquinaria de Computación; 2016 [citado 16 de diciembre de 2025]. p. 785–794).

https://doi.org/10.1145/2939672.2939785

17. Scikit-learn. sklearn.svm.SVR — documentación scikit-learn 1.3.0 [Internet]. [citado 15 de septiembre de 2025]. Disponible en:

https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVR.html

18. Rosenblatt F. El perceptrón: Un modelo probabilístico para el almacenamiento y organización de la información en el cerebro. Revisión psicológica. 1958; 65(6):386–408. Disponible en:

https://www.ling.upenn.edu/courses/cogs501/Rosenblatt1958.pdf

19. Scikit-learn. sklearn.neural_network. MLPRegressor — documentación scikit-learn 1.3.0 [Internet]. [citado 15 de septiembre de 2025]. Disponible en:

https://scikitlearn.org/stable/modules/generated/sklearn.neural_network.MLPRegressor.html

20. Scikit-learn. sklearn.impute. IterativeImputer — documentación scikit-learn 1.3.0 [Internet]. [citado 15 de septiembre de 2025]. Disponible en:

https://scikit-learn.org/stable/modules/generated/sklearn.impute.IterativeImputer.html

21. Van Buuren S. Imputación flexible de datos faltantes. 2ª ed. Chapman y Hall/CRC; 2018.

22. Van Buuren S, Groothuis-Oudshoorn K. MICE: Imputación multivariante por ecuaciones encadenadas en R. Journal of Statistical Software. 2011; 45(3):1–67.

https://doi.org/10.18637/jss.v045.i03

23. Kolmogorov AN. Sobre la determinación empírica de una ley de distribución. Revista del Instituto Italiano de Actuarios. 1933; 4:83–91. Disponible en:

http://digitale.bnc.roma.sbn.it/tecadigitale/giornale/CFI0353791/1933/unico/00000093

24. Massey FJ. La prueba Kolmogorov-Smirnov para comprobar la bonura del ajuste. Revista de la Asociación Estadística Americana. 1951; 46(253):68–78.

https://doi.org/10.1080/01621459.1951.10500769

25. Smirnov N. Tabla para estimar la bondad del ajuste de distribuciones empíricas. Anales de Estadística Matemática. 1948; 19(2):279–281. Disponible en:

https://www.jstor.org/stable/2236278

26. Akoglu H. Guía del usuario sobre coeficientes de correlación. Revista Turca de Medicina de Urgencias. 2018; 18(3):91–93.

https://doi.org/10.1016/j.tjem.2018.08.001

27. Marquardt DW. Inversos generalizados, regresión de crestas, estimación lineal sesgada y estimación no lineal. Tecnometría. 1970; 12(3):591–612.

https://doi.org/10.1080/00401706.1970.10488699

28. Burman P. Un estudio comparativo de la validación cruzada ordinaria, la validación cruzada en v-fold y los métodos repetidos de pruebas de aprendizaje. Biometrika. 1989; 76(3):503-514.

https://doi.org/10.2307/2336116

29. Shapiro SS, Wilk MB. Un análisis de la prueba de varianza para verificar la normalidad (muestras completas). Biometrika, v. 52, n. 3–4, p. 591–611, 1965.

https://doi.org/10.2307/2333709

30. Kruskal WH, Wallis W. A. Uso de rangos en el análisis de varianza de un solo criterio. Revista de la Asociación Estadística Americana. 1952; 47(260):583–621.

https://doi.org/10.2307/2280779

31. Lundberg SM., Lee S-I. Un enfoque unificado para interpretar las predicciones de modelos. En actas de la 31ª Conferencia Internacional sobre Sistemas de Procesamiento de Información Neuronal (NIPS 2017) [Internet]; 4-9 de diciembre de 2017; Long Beach, CA, EE. UU. Red Hook (NY): Curran Associates; 2017 [citado 16 de diciembre de 2025]. p. 4765–4774. Disponible en:

https://papers.nips.cc/paper_files/paper/2017/file/8a20a8621978632d76c43dfd28b67767-Paper.pdf

32. Instituto de Ciudades Sostenibles. Agenda 2030 [Internet]. São Paulo: Instituto de Ciudades Sostenibles; [fecha desconocida] [citado 15 de septiembre de 2025]. Disponible en:

https://www.cidadessustentaveis.org.br/institucional/pagina/agenda2030

Downloads

Download data is not yet available.