भाषण ओळखणे म्हणजे काय?

इनपुट आवाज म्हणून आपली व्हॉइस वापरणे

उच्चार ओळख एक तंत्रज्ञान आहे जो सिस्टममध्ये बोलेल इनपुटची अनुमती देते. आपण आपल्या संगणकाशी, फोनवर किंवा डिव्हाइसशी बोलता आणि ते काही कारवाई करण्यासाठी आपण काय म्हटले आहे ते वापरते. टायपिंग, इतर मार्गांनी क्लिक करणे किंवा निवडणे यासारख्या इनपुटच्या इतर पद्धतींना बदलण्यासाठी तंत्रज्ञान वापरले जात आहे. हे साधन आणि सॉफ्टवेअर अधिक वापरकर्ता-अनुकूल बनविण्यासाठी आणि उत्पादकता वाढविण्यासाठी एक साधन आहे.

दुर्बल व्यक्तिंना (अपंग किंवा हात किंवा बोटासह असलेली एखादी व्यक्ती कल्पना) वैद्यकीय क्षेत्रात रोबोटिक्स इ. मध्ये जवळजवळ नजीकच्या भविष्यात अशा अनेक अनुप्रयोग आणि भागातील भाषण ओळख वापरली जाते. संगणक आणि मोबाइल फोन सारख्या सामान्य साधनांमधील त्याच्या प्रचारामुळे जवळजवळ प्रत्येकजण उच्चार ओळखीस सामोरे जाईल.

काही स्मार्टफोन उच्चार ओळख रोचक वापर करीत आहेत. आयफोन आणि अँड्रॉइड डिव्हाइसेसची उदाहरणे आहेत. 'कॉल ऑफिस' सारख्या स्पोकन सूचना मिळविण्याद्वारे आपण त्यांच्या संपर्कात कॉल करू शकता. इतर आज्ञा देखील मनोरंजन जाऊ शकतात, जसे 'ब्लूटूथ स्विच'

भाषण मान्यता समस्या

भाषण ओळख, त्याच्या भाषणात भाषण ते मजकूर (एसटीटी) म्हणून ओळखले जाते, हे देखील बोललेल्या शब्दांना मजकूरात अनुवादित करण्यास बराच वेळ वापरले गेले आहे "आपण बोलता, ते प्रकार", ज्याप्रमाणे व्हायव्हॉइस आपल्या बॉक्सवर म्हणे पण एसटीटीशी एक समस्या आहे कारण आम्हाला माहित आहे. 10 पेक्षा जास्त वर्षांपूर्वी, मी व्हीवाइसचा प्रयत्न केला आणि तो माझ्या संगणकावर एक आठवडा राहिला नाही. का? हे अत्यंत चुकीचे होते आणि सर्व गोष्टी टाईप करण्यापेक्षा मी अधिक वेळ आणि उर्जेची बोलणी आणि दुरुस्त करणे संपविले. व्हायव्हस हा उद्योगातील सर्वोत्तमांपैकी एक आहे, म्हणून बाकीच्या गोष्टींची कल्पना करा. तंत्रज्ञान प्रौढ आणि सुधारीत झाले आहे, परंतु मजकूर वाचण्यासाठी लोक अजूनही लोकांना प्रश्न विचारतात. त्यांच्या मुख्य अडचणांपैकी एक म्हणजे शब्द उच्चारणा-या शब्दात लोकांमध्ये अवास्तव फरक आहे.

सर्व भाषा उच्चारिकेत ओळखल्या जात नाहीत आणि जे लोक करतात ते सहसा इंग्रजीप्रमाणेच समर्थित नाहीत. परिणामी, बहुतेक डिव्हाइसेस जे उच्चार मान्यता सॉफ्टवेअर चालवतात केवळ इंग्रजीसहच वाजवी करतात.

हार्डवेअर आवश्यकतांचा एक संच विशिष्ट प्रकरणांमध्ये तैनात करणे उच्चार ओळखणे कठीण बनवते. आपल्याला एक मायक्रोफोन आवश्यक आहे जो पार्श्वभूमी आवाजाला फिल्टर करण्यासाठी पुरेसे बुद्धिमान आहे परंतु त्याच वेळी तो आवाज सहजपणे कॅप्चर करण्यासाठी पुरेसे शक्तिशाली आहे.

पार्श्वभूमीच्या आवाजाविषयी बोलणे, संपूर्ण प्रणालीस अयशस्वी होण्यास कारणीभूत होऊ शकते. परिणामी, वापरकर्त्याच्या नियंत्रणाबाहेर नसलेल्या आवाजात अनेक बाबतीत भाषण ओळखणे अपयशी ठरते.

व्हीओआयपी सारख्या नवीन फोन्स आणि कम्युनिकेशन टेक्नॉलॉजीजसाठी इनपुट पद्धत म्हणून भाषण ओळखणे उत्तम आहे हे दर्शवते, जन मजकूर इनपुटसाठी उत्पादकता साधन म्हणून

भाषण मान्यता अनुप्रयोग

तंत्रज्ञान अनेक क्षेत्रांत लोकप्रियता मिळविण्यामध्ये आहे आणि खालील मध्ये यशस्वी झाले आहे:

- डिव्हाइस नियंत्रण. केवळ "ओके Google" असे म्हणत असलेल्या एका Android फोनमध्ये आपल्या व्हॉईस कमांडना सर्व कन्सल असलेल्या प्रणालीला बंद करतो

- कार ब्ल्यूटूथ सिस्टीम बर्याच कारमध्ये एक प्रणाली आहे जी आपल्या ब्ल्यूटूथच्या माध्यमातून आपल्या स्मार्टफोनला रेडिओ यंत्रणा जोडते. आपण नंतर आपल्या स्मार्टफोनला स्पर्श केल्याशिवाय कॉल करू शकता आणि प्राप्त करू शकता, आणि फक्त त्यांना सांगून क्रमांक डायल करू शकता.

- व्हॉइस ट्रान्सक्रिप्शन ज्या भागात लोकांना भरपूर टाईप करावे लागते तेथे काही बुद्धिमान सॉफ्टवेअर त्यांच्या बोललेल्या शब्दांवर कब्जा करतात आणि त्यांना मजकूरमध्ये लिप्यंतरित करतात. हे काही शब्द प्रक्रिया सॉफ्टवेअरमध्ये चालू आहे. व्हॉइस ट्रान्सक्रिप्शन व्हिज्युअल व्हाइसमेलसह कार्य करते.