बायसियन स्पॅम फिल्टरिंग बद्दल आपल्याला काय माहित असणे आवश्यक आहे

आकडेवारी आपला इनबॉक्स स्वच्छ ठेवण्यात कशी मदत करते हे शोधा

Bayesian spam filters त्याच्या सामग्रीवर आधारित स्पॅम असल्याने संभाव्यतेची गणना करते. साध्या सामग्री-आधारित फिल्टर्सप्रमाणे, बेयसियन स्पॅम फिल्टर करणे स्पॅम आणि चांगल्या मेलमधून शिकते, परिणामी एक अतिशय मजबूत, अनुकूल आणि प्रभावी विरोधी-स्पॅम दृष्टिकोन मिळतो की, सर्वात चांगले, कोणत्याही चुकीच्या धनादेशांचे महत्त्व कमी होते.

आपण जंक ईमेलला कसे ओळखता?

आपण स्पॅम कसे शोधतात याबद्दल विचार करा एक द्रुत दृष्टीक्षेप बहुधा पुरेशी आहे आपल्याला माहित आहे की स्पॅम कशा प्रकारे दिसते, आणि आपल्याला माहित आहे की चांगले मेल कशा प्रकारे दिसते.

चांगले मेल शोधत असलेल्या स्पॅमची संभाव्यता सुमारे आहे ... शून्य.

सामग्री-आधारित फिल्ड्स स्कोअरिंग अनुकूल नका

स्वयंचलित स्पॅम फिल्टर त्यासारखे काम करत असेल तर ते उत्तम होणार नाही का?

सामग्री-आधारित स्पॅम फिल्टर मिळवण्यावरच फक्त प्रयत्न करा. ते शब्द आणि स्पॅम विशिष्ट वैशिष्ट्य इतर वैशिष्ट्ये पहायला. प्रत्येक वैशिष्ट्यपूर्ण घटकांना एक गुण दिला जातो आणि संपूर्ण संदेशासाठी स्पॅम स्कोअर वैयक्तिक स्कोअरमधून गणना केला जातो. काही स्कोअरिंग फिल्टर कायदेशीर मेलची वैशिष्ट्ये देखील शोधतात, संदेशाचा अंतिम गुण कमी करतात.

स्कोअरिंग फिल्टर अभिसरण कार्य करते परंतु त्यात अनेक त्रुटी आहेत:

बायिसियन स्पॅम फिल्टर्स स्वतःला चिमटा, चांगले आणि उत्तम मिळवणे

Bayesian स्पॅम फिल्टर हे एक प्रकारचे स्कॉलिंग सामग्री-आधारित फिल्टर देखील आहेत. त्यांचा दृष्टिकोन सोप्या स्कोअरिंग स्पॅम फिल्टर्सच्या समस्यांपासून दूर आहे, आणि ते तसे मूलभूतपणे करते. स्कोअरिंग फिल्ड्सची कमतरता मॅन्युअली बिल्ट यादी व गुणविशेष आणि त्यांच्या स्कोअरमध्ये असल्याने, ही यादी वगळण्यात आली आहे.

त्याऐवजी, बेयसियन स्पॅम फिल्टर स्वत: सूची बनवतात. आदर्शपणे, आपण स्पॅम म्हणून वर्गीकृत केलेल्या ईमेलच्या मोठ्या संख्येसह प्रारंभ करा आणि चांगले मेलचे दुसरे समूह. फिल्टर दोन्हीकडे पहातात आणि वैध मेल तसेच स्पॅमच्या स्पॅममध्ये दिसणार्या विविध वैशिष्ट्यांच्या संभाव्यतेची गणना करण्यासाठी आणि चांगल्या मेलमध्ये विश्लेषण करतात.

एक Bayesian स्पॅम फिल्टर एक ईमेल विश्लेषण कसे

Bayesian स्पॅम फिल्टर खालील गोष्टी पाहू शकतात:

उदाहरणार्थ, "कार्टेशियन", उदाहरणार्थ, स्पॅम मध्ये कधीही दिसू शकत नाही परंतु नेहमी आपल्याला प्राप्त झालेल्या वैध ईमेलमध्ये, "कार्टेशियन" स्पॅम दर्शविणारी संभाव्यता शून्य जवळ आहे. दुसरीकडे, "टोनर" स्पॅममध्ये आणि बर्याच वेळा स्पॅममध्ये दिसतो. "टोनर" ची स्पॅममध्ये आढळली जाण्याची फार उच्च संभाव्यता आहे, 1 पेक्षा कमी (100%) नाही.

नवीन संदेश आला की, यास बेयसियन स्पॅम फिल्टरद्वारे विश्लेषित केले जाते आणि संपूर्ण स्पॅम असलेल्या संदेशाची संभाव्यता वैयक्तिक वैशिष्ट्ये वापरून गणना केली जाते.

एक असे गृहीत धरून घ्या की "कार्टेशियन" आणि "टोनर" दोन्ही समाविष्ट आहेत. हे शब्द एकट्या आमच्या स्पॅम किंवा legit मेल आहेत हे अद्याप स्पष्ट नाही. इतर वैशिष्ट्ये (अपेक्षापूर्वक आणि कदाचित सर्वात) संभाव्यता सूचित करतील जी फिल्टरला स्पॅम किंवा शुभ मेल एकतर वर्गीकृत करण्याची परवानगी देते.

बायिसियन स्पॅम फिल्टर स्वयंचलितपणे जाणून घेऊ शकता

आता आपल्याकडे वर्गीकरण आहे, संदेश फिल्टरला स्वतःच प्रशिक्षित करण्यासाठी वापरला जाऊ शकतो. या प्रकरणात, "कार्टेशियन" आणि "टोनर" दोन्ही स्पॅम असल्याचे आढळल्यास, किंवा स्पॅम दर्शविणारी "टोनर" दर्शविण्याची संभाव्यता पुनर्बांधणी करणे आवश्यक आहे "मेल" दर्शविणारी "कार्टेशियन" ची संभाव्यता कमी केली आहे.

या स्वयं-अनुकुल तंत्राचा वापर करून, बेयसियन फिल्टर दोन्ही स्वत: च्या आणि युझरच्या निर्णयातून शिकू शकतात (जर ते स्वतः फिल्टरद्वारे चुकीचे दुरुस्त केले तर). बायेशियन फिल्टरिंगची अनुकूलनक्षमता देखील सुनिश्चित करते की ते वैयक्तिक ईमेल वापरकर्त्यासाठी सर्वात प्रभावी आहेत. बहुतेक लोकांच्या स्पॅममध्ये सारखे वैशिष्ठ्य असू शकतात, परंतु वैध मेल प्रत्येकासाठी वैचारिकरित्या वेगळे आहे.

स्पॅमर्स बाय बाय बायियन फिल्टर कसे मिळवू शकतात?

वैध मेलची वैशिष्ट्ये फक्त बायॅसियन स्पॅम फिल्टरिंग प्रक्रियेसाठी जशी स्पॅम आहेत तशीच महत्वाची आहेत. फिल्टर विशेषत: प्रत्येक वापरकर्त्यासाठी प्रशिक्षित असल्यास, स्पॅमर्सना प्रत्येकजण (किंवा बहुतांश लोकांच्या) स्पॅम फिल्टर्सवर काम करताना आणखी कठिण वेळ मिळेल आणि फिल्टर जवळपास सर्व गोष्टींशी जुळवून घेऊ शकतात ज्यामुळे स्पॅमर्सने प्रयत्न केले आहेत.

Spammers केवळ त्यांच्या स्पॅम संदेशांना सर्वसामान्य ईमेलच्या रूपात उत्कृष्ट प्रकारे दिसतात तर त्यांना प्रशिक्षित बायसियन फिल्टर पुरवेल.

स्पॅमर सामान्यत: सामान्य ईमेल पाठवत नाहीत. आम्हाला असे गृहीत धरू: हे ईमेल जंक ईमेलच्या स्वरूपात काम करत नाहीत. तर मग, सामान्य आणि भयानक ईमेल हे मागील स्पॅम फिल्टर्स बनविण्याचा एकमेव मार्ग असताना ते ते करणार नाहीत.

जर स्पॅमर मुख्यतः सामान्य दिसणार्या ईमेलवर स्विच करतात, तर आपण पुन्हा आमच्या इनबॉक्समध्ये भरपूर स्पॅम पाहू आणि ईमेल पूर्व-बेयसियन दिवसात (किंवा त्यापेक्षाही वाईट) म्हणून निराशाजनक होऊ शकते. हे बहुतांश प्रकारच्या स्पॅमसाठी देखील बाजारही उद्ध्वस्त करेल, आणि अशा प्रकारे दीर्घकाळ राहणार नाही.

मजबूत संकेतक एक बेयसियन स्पॅम फिल्टरचे अचिलीस असू शकतात. टाच

स्पॅमर्सना त्यांच्या नेहमीच्या सामग्रीसह बायेशियन फिल्टरद्वारे त्यांचे मार्ग कार्य करण्यासाठी एक अपवाद आढळतो. हे बेयसियनच्या स्वभावाच्या स्वरूपात आहे की एक शब्द किंवा वैशिष्ट्यपूर्ण संदेश जे चांगल्या मेलमध्ये आढळते ते इतके महत्त्वपूर्ण असू शकतात की स्पॅमसारख्या कुठल्याही संदेशाला फिल्टरद्वारे हेम म्हणून रेट केले जाणे

जर आपण आपल्या खोबण्यामुळे कोणते संदेश उघडले हे पाहण्यासाठी स्पॅमर्सना आपली खात्री-आग चांगली-मेल शब्द निर्धारित करण्याचा मार्ग शोधला जातो, उदाहरणार्थ-, त्यापैकी एक जंक मेलमध्ये समाविष्ट करू शकता आणि आपण एखाद्या चांगल्या मेलद्वारे देखील पोहोचू शकता. प्रशिक्षित बायेशियन फिल्टर

जॉन ग्रॅहम-कम्मिंगने दोन बेयसीयन फिल्टर एकमेकांच्या विरोधात काम करू देऊन "चांगले" फिल्टरमधून संदेश मिळविण्याकरिता "वाईट" हा एक आक्षेप घेतला आहे. ते म्हणतात की हे कार्य करते, प्रक्रिया ही वेळ घेणारे आणि जटिल आहे. आम्हाला असे वाटत नाही की आम्ही या गोष्टींपैकी बरेच काही बघणार नाही, कमीतकमी मोठ्या प्रमाणावर नाही, आणि व्यक्तीच्या ईमेल वैशिष्ट्यांनुसार तयार केलेले नाहीत. स्पॅमर्स (कदाचित आयबीएममधील काही लोकांसाठी "अल्माडेन" असे काहीतरी) त्याऐवजी काही संस्था शोधू शकतात (करण्याचा प्रयत्न करा).

सामान्यत: स्पॅम नेहमीच (लक्षणीय) नियमित मेलहून वेगळे असेल किंवा ते स्पॅम असणार नाही, तरीही.

द बेटोम लाइन: बेयसियन फिल्टरींगची ताकद त्याच्या कमकुवत असू शकते

Bayesian स्पॅम फिल्टर हे सामग्री-आधारित फिल्टर आहेत जे: