HTML5 मध्ये मेटा वर्णसेट टॅग

HTML5 मध्ये वर्ण एन्कोडिंग सेट करणे

एचटीएमएल 5 च्या परिचयापूर्वी, घटकांवरील एन्कोडिंगला घटक म्हणून सेट करणे ज्यात तत्वरुग्ण केलेल्या काही गोष्टी आहेत जे खाली दिसत असलेल्या काही शब्दशः ओळी लिहू शकतात. आपण आपल्या वेब पृष्ठामध्ये HTML4 वापरत असल्यास हा मेटा वर्णसेट घटक आहे:

या कोमेरा मधील नोटिशन्स करणे महत्वाचे काय आहे ज्यामध्ये कोटेशन चिन्हास आपण सामग्री विशेषता सुमारे पाहू शकता: सामग्री = " मजकूर / html; charset = iso-885 9-1 " सर्व HTML गुणधर्मांप्रमाणेच, हे अवतरण चिन्ह गुणधर्मांचे मूल्य परिभाषित करतात, जे संपूर्ण स्ट्रिंग मजकूर / html; charset = iso-8959-1 या घटकाची सामग्री आहे. हे योग्य HTML आहे आणि ते कसे आहे हे अक्षर लिखित कसे होते. हे फारच अवघड आहे आणि कुरुप! हे आपल्या डोक्याच्या वरच्या भागापासून वाचू शकणारे काहीतरी देखील नाही! बर्याच प्रकरणांमध्ये, वेब डेव्हलपरला ही साइट एका साइटवरून कॉपी करुन पेस्ट करावी लागेल कारण ती विकसित होत होती कारण ती सुरवातीपासून लिहून भरपूर विचारत होती.

HTML5 अतिरिक्त & # 34; सामग्री & # 34;

HTML5 ने भाषेसाठी नवनवीन घटक जोडलेलेच नाही तर मेटा वर्णसेट तत्वासह, एचटीएमएलच्या सिंटॅक्सची फारच अधिक सरलीकृत केली आहे. HTML5 सह, आपण आपल्या वर्ण एन्कोडिंगला मेटा घटकांकरिता सिंटॅक्स लक्षात ठेवण्याइतकी सोपे असलेली जोडू शकता आपण खाली दिसेल:

या लेखाच्या सुरूवातीस आपण जे लिहिले त्याचे सरलीकृत वाक्यरचना तुलना करा, HTML4 साठी वापरलेली जुनी वाक्यरचना, आणि आपण पाहू शकता की HTML5 आवृत्ती खरोखर लिहायला किती सोपे आहे आणि ती खरोखरच आहे कॉपी करण्याच्या आणि विद्यमान साइटवरून आपण ज्यावर काम करीत आहात अशा कोणत्याही नवीनमध्ये पेस्ट करण्याची आवश्यकता न होण्याइतका, हे पूर्णपणे काहीतरी आहे जे, फ्रंट-एंड वेब डेव्हलपर म्हणून आपण लक्षात ठेवू शकता या बचत वेळ बर्याच नाहीत, परंतु जेव्हा आपण इतर सिंटॅक्स भागावर विचार करता जे HTML5 सरलीकृत होते, तेव्हा बचत वाढते!

नेहमी वर्ण एन्कोडिंग समाविष्ट करा

आपण नेहमी आपल्या वेब पृष्ठांसाठी वर्ण एन्कोडिंग समाविष्ट केले पाहिजे, जरी आपण कधीही विशिष्ट वर्णांचा वापर करू इच्छित नसाल तरीही आपण वर्ण एन्कोडिंग समाविष्ट न केल्यास, आपली साइट UTF-7 वापरून क्रॉस साइट स्क्रिप्टिंग आक्रमण करण्यासाठी भेद्य ठरते.

या परिस्थितीत, Anattacker आपल्या साइटकडे वर्ण एन्कोडिंग परिभाषित केलेली नाही हे पाहत आहे, म्हणून हे ब्राउझरला पृष्ठामधील वर्ण एन्कोडिंग प्रत्यक्षात UTF-7 असे विचारात घेऊन चालवते. पुढे, आक्रमणकर्त्याने UTF-7 एन्कोडेड स्क्रिप्ट्स वेब पृष्ठावर इंजेक्शन करुन आपली साइट हॅक केली आहे. हे आपल्यासहित आपल्या अभ्यागतांशी संबंधित असलेल्या प्रत्येकासाठी उघड आहे. चांगली बातमी अशी आहे की टाळण्यासाठी ही एक सोपी समस्या आहे - फक्त आपल्या सर्व वेबपृष्ठांवर वर्ण एन्कोडिंग जोडणे निश्चित करा.

वर्ण एन्कोडिंग कुठे जोडा

वेबपृष्ठासाठी वर्ण एन्कोडिंग आपल्या एचटीएमएलच्या घटकची पहिली ओळ असावी. हे सुनिश्चित करते की ब्राउझर एन्कोडिंग काय आहे हे त्या व्यक्तीला माहीत आहे की कायदेशीर बाबी निर्धारित करण्याव्यतिरिक्त पृष्ठावर इतर कशासही आधी आहे आणि तो HTML पृष्ठ आपले HTML वाचावे:

<मेटा वर्णसंच = "UTF-8"> ...

अतिरिक्त सुरक्षेसाठी HTTP शीर्षलेख वापरणे

आपण HTTP शीर्षलेखांमध्ये वर्ण एन्कोडिंग देखील निर्दिष्ट करू शकता. हे HTML पृष्ठामध्ये जोडण्यापेक्षा अधिक सुरक्षित आहे, परंतु आपण सर्व्हर कॉन्फिगरेशन्स किंवा .htaccess फाइल्सवर प्रवेश मिळवू इच्छित होता, याचा अर्थ आपल्याला या प्रकारच्या प्रवेश मिळविण्यासाठी किंवा आपल्या वेबसाइटवर होस्टिंग प्रदात्यासह कार्य करण्याची आवश्यकता आहे तुमच्यासाठी बदल. प्रवेश खरोखर येथे आव्हान आहे बदल स्वतः सोपा आहे, त्यामुळे कोणत्याही होस्टिंग प्रदाता आपल्या सोयीनुसार सहजपणे बदल घडवून आणू शकेल.

आपण अॅपनॅब वापरत असल्यास, आपण आपल्या संपूर्ण साइटसाठी डीफॉल्ट वर्ण सेट जोडून जोडू शकता : आपल्या मूळ .htaccess फाइलमध्ये AddDefaultCharset UTF-8 . अपाचेचा डिफॉल्ट वर्ण संच ISO-885 9 -1 आहे