Escape / Desescape HTML
Conversão HTML
Entendendo Escape e Desescape HTML
O escape HTML é o processo de converter caracteres especiais (como colchetes angulares, 'E' comerciais e aspas) em suas entidades HTML correspondentes (por exemplo, <, >, &, ", ' ou '). Esta é uma medida de segurança crucial, especialmente ao exibir conteúdo gerado pelo usuário em uma página da web.
A principal razão para escapar HTML é prevenir ataques de Cross-Site Scripting (XSS). Se a entrada do usuário não escapada contendo scripts maliciosos (por exemplo, tags de script com código executável) for renderizada diretamente em um navegador, o script pode ser executado, levando ao sequestro de sessão, roubo de dados ou desfiguração do site.
Por outro lado, o unescaping HTML é o processo de converter essas entidades HTML de volta aos seus caracteres originais. Isso é útil quando você precisa recuperar o texto original de uma string escapada, por exemplo, ao processar dados que foram previamente escapados para armazenamento ou transmissão seguros.
Entidades HTML comuns
- O símbolo menor que torna-se <
- O símbolo maior que torna-se >
- O 'E' comercial torna-se &
- Aspas duplas tornam-se "
- Aspas simples / apóstrofo tornam-se ' ou '