تجاوز / إلغاء تجاوز HTML
تحويل HTML
فهم تجاوز وإلغاء تجاوز HTML
تجاوز HTML هو عملية تحويل الأحرف الخاصة (مثل الأقواس الزاوية وعلامات العطف وعلامات الاقتباس) إلى كيانات HTML المقابلة لها (مثل <، >، &، "، ' أو '). هذا إجراء أمني حاسم، خاصة عند عرض المحتوى الذي ينشئه المستخدم على صفحة ويب.
السبب الأساسي لتجاوز HTML هو منع هجمات البرمجة النصية عبر المواقع (XSS). إذا تم تقديم إدخال المستخدم الذي لم يتم تجاوزه والذي يحتوي على نصوص ضارة (مثل علامات البرنامج النصي ذات التعليمات البرمجية القابلة للتنفيذ) مباشرة في المتصفح، فقد يتم تنفيذ النص، مما يؤدي إلى اختطاف الجلسة أو سرقة البيانات أو تشويه موقع الويب.
على العكس من ذلك، فإن فك رموز HTML هو عملية تحويل كيانات HTML هذه مرة أخرى إلى أحرفها الأصلية. هذا مفيد عندما تحتاج إلى استرداد النص الأصلي من سلسلة تم تخطيها، على سبيل المثال، عند معالجة البيانات التي تم تخطيها مسبقًا للتخزين أو النقل الآمن.
كيانات HTML الشائعة
- رمز أقل من يصبح <
- رمز أكبر من يصبح >
- تصبح العلامة &
- علامة الاقتباس المزدوجة تصبح "
- علامة الاقتباس الفردية / الفاصلة العليا تصبح ' أو '