Escape / Desescape HTML
Conversión HTML
Comprender el escape y desescape de HTML
El escape HTML es el proceso de convertir caracteres especiales (como paréntesis angulares, ampersands y comillas) en sus entidades HTML correspondientes (por ejemplo, <, >, &, ", ' o '). Esta es una medida de seguridad crucial, especialmente al mostrar contenido generado por el usuario en una página web.
La razón principal para escapar HTML es prevenir ataques de Cross-Site Scripting (XSS). Si la entrada del usuario no escapada que contiene scripts maliciosos (por ejemplo, etiquetas de script con código ejecutable) se renderiza directamente en un navegador, el script podría ejecutarse, lo que llevaría al secuestro de sesión, robo de datos o desfiguración del sitio web.
Por el contrario, el desescape HTML es el proceso de convertir estas entidades HTML nuevamente a sus caracteres originales. Esto es útil cuando necesita recuperar el texto original de una cadena escapada, por ejemplo, al procesar datos que se escaparon previamente para un almacenamiento o transmisión seguros.
Entidades HTML comunes
- El símbolo menor que se convierte en <
- El símbolo mayor que se convierte en >
- El ampersand se convierte en &
- La comilla doble se convierte en "
- La comilla simple / apóstrofe se convierte en ' o '