परिचय
यह आलेख आपके छोटे बच्चों के लिए स्कॉलास्टिक इंटरैक्टिव LLC के क्लीफोर्ड्स रीडिंग एडवेंचर्स, अ सीरीज ऑफ इंटरैक्टिव एडुकेशनल गेम के विकास के बारे में वर्णन करता है। नये गेम का इमर्सिव जेस्चर और वॉयस एक्सपीरिएंस को इंटेल(R) परसेप्चुअल कम्प्यूटिंग SDK 2013 के साथ बनाना संभव हुआ है। हमलोग नये मेथड जो बच्चों के जेस्चर्स और वॉयस क्वालिटी को कैप्चर करने के लिए, SKD के लिए ट्रबल शूटिंग टैक्टिस के लिए और सपोर्टिंग पोर्टेबल ऑल इन वन PCs में बनाये गए कंसिडरेशन का, जो परसेप्चुअल कम्प्यूटिंग के साथ किये गए, प्रयोग के बारे में चर्चा करते हैं।
स्कॉलास्टिक इंटरैक्टिव LLC, स्कॉलास्टिक, अ ग्लोबल चिल्ड्रेन्स पब्लिशिंग, एडुकेशन और मीडिया कंपनी का एक प्रभाग है। स्कॉलास्टिक इंटरैक्टिव का लक्ष्य है- यंग चिल्ड्रेन्स के लिए गेम बनाना जो कि सिर्फ एक्साइटिंग और फन टू प्ले ही न हो बल्कि एडुकेशनल भी हो। स्कॉलास्टिक, छोटे बच्चों के एडुकेशनल गेम्स के विकास के नये क्षेत्र के समान परसेप्चुअल कम्प्यूटिंग और जेस्चर टेक्नोलॉजी में रूचि लेता है क्योंकि एक्टिविटीज इन्ट्यूटिव होती हैं- बच्चों को, गेम्स कैसे खेला जाय, यह सिखाया नहीं जाता। परसेप्चुअल कम्प्यूटिंग प्लेटफॉर्म के साथ इसके वॉयस और जेस्चर टेक्नोलॉजी को इंटीग्रेट करना एक बड़ा प्रयोग है जो 3+ के बच्चों के लिए क्लीफोर्ड और उसके फ्रेंड्स के एडवेंचर्स के स्टोरी मैटेरियल से जोड़कर आसान और प्राकृतिक तरीके से इंटरैक्टिव बनाता है।
इस चार इंटरैक्टिव एपिसोड्स के क्लीफोर्ड सीरीज में, प्लेयर्स हर साहसिक कारनामों को देखते हैं जो उन्हें उनके कम्प्यूटर के वॉयस और टच स्क्रीन फंक्शन का प्रयोग कर स्टोरी के साथ इंगेज रखता है। स्टोरी बच्चों को जेस्चर और वॉयस-एक्टिवेटेड एक्टिविटीज के द्वारा अन्य तरीके से एक्शन में लाने के लिए ‘‘हेल्प’’ क्लीफोर्ड कहकर उन्हें आमंत्रित करती है।
पारस्परिक अनुभवात्मक शिक्षण
क्लीफोर्ड में स्कॉलास्टिक ने अपने यंगेस्ट रीडर्स को इंटरैक्टिव टेक्नोलॉजी देने के लिए सही अवसर माना क्योंकि बच्चे वास्तविक रूप में उनकी आवाज और मूवमेंट्स पर क्लीफोर्ड को रियेक्ट करते हुए देखते हैं। इस फीचर्ड स्टोरी लाइन में बच्चे हर एडवेंचर का एनीमेटेड सेगमेंट्स देखते हैं और स्क्रीन टच करके या मौखिक उत्तर देकर उन कैरेक्टर्स या उनकी एक्टिविटीज के साथ व्यस्त रहते हैं। प्लेयर्स भी स्टोरी लाइन को एडवांस करते हैं जब वे फीचरिंग टच और जेस्चर गेम खेलते हैं। प्रत्येक गेम अर्ली कोर लिटरेसी स्किल पर आधारित होता है और जब इच्छा हो तब उसे दोहराया जा सकता है।
इंटेल परसेप्चुअल कम्प्यूटिंग SDK 2013 APIs, सैम्पल्स और ट्यूटोरियल्स ऑफर करता है जिसे बच्चों को अनुभवात्मक गेम के एप्लीकेशन में साउंड और जेस्चर का प्रयोग करने के लिए जरूरी सेंसर को इंटरप्रेट करने के लिए डिजाइन किया गया है। SDK का स्पीच रिकॉग्नीशन, क्लोज-रेंज हैंड और फिंगर ट्रैकिंग, फेस एनालिसिस, ऑगमेंटेड रियालिटी और बैकग्राउंड सब्ट्रैक्शन की कोर कैपेबिलिटीज, सॉफ्टवेयर डेवलपर्स को ऑल-इन-वन PCs, इन्टेल अल्ट्राबुक (TM) कम्प्यूटर्स और लेटेस्ट टेबलेट्स में तेजी से इन कैपेबिलिटीज को इनके एप्लीकेशन में इंटीग्रेट करने की सुविधा देती है। माइक्रोफोन्स, कैमराज को ओरियेंटेशन और लोकेशन फंक्शनलिटी (अब टैबलेट्स, कन्वर्टिबल लैपटॉप्स और ऑल इन वन PC पर भी) के साथ प्रयोग करके डेवलपर्स इन्क्रीजिंगली इमर्सिव एप्लीकेशन्स बना सकते हैं।
डेवलपमेंट टीम
बच्चों के लिए गेम कॉन्सेप्ट, इन्टरेक्टिव एक्टिविटीज और की यूजेबिलिटी कन्सर्न के बारे में स्कॉलिस्टिक ने कर्इ डेवलपमेंट टीम का इंटरव्यू लिया। अल्टीमेटली स्कॉलिस्टिक ने सिम्बायो को पार्टनर बनाया क्योंकि उनकी टीम को डेवलपिंग और जेस्चर तथा वॉयस रिकॉग्नीशन में अनुभव था और उनके पास बच्चों के एडुकेशन, गेमिंग और यूजेबिलिटी में एक्सटेंसिव बैक ग्राउंड था।
इन्टेल (R) परसेप्चुअल कम्प्यूटिंग प्लेटफॉर्म के साथ विकास करना
यंग चिल्ड्रेन के वॉयस, जेस्चर्स और मूवमेंट्स में परसेप्चुअल कम्प्यूटिंग टेक्नोलॉजी को एडॉप्ट करने से कर्इ चैलेंजेज आते हैं। स्कॉलिस्टिक प्रोसेस के रूटीन के तहत प्रत्येक प्रोटोटाइप को एक्सटेंसिवली इसलिए टेस्ट किया गया कि गेम डिजाइन एप्रोप्रिएट तथा गेमिंग लेवल एचीवेबल हो। इस टेस्टिंग से टीम को टेस्ट प्लेयर्स (टार्गेट एज चिल्ड्रेन) के द्वारा सामना किये गए चैलेंजेज को आइडेंटिफार्इ करने में मदद मिली जिसका समाधान किया गया जो टार्गेट एज के लिए योग्य था।
डेवलपमेंट फेज के कर्इ आस्पेक्ट्स उन डेवलपर्स के लिए विशेष उल्लेखनीय हैं जो परसेप्चुअल कम्प्यूटिंग में रूचि लेते हैं। निम्नांकित क्लीफोर्ड एप्लीकेशन डेवलपमेंट के कुछ हालाइट्स हैं।
कैलिब्रेटिंग वॉयस रिकॉग्नीशन
वॉयस रिकॉग्नीशन को स्वीकृत परफॉर्मेन्स लेवल्स को प्रदान करने के लिए कर्इ चेक और फिल्टर स्टेप्स की जरूरत पड़ती है क्योंकि बच्चों के वॉयस में लगातार विकास होता है जब वे बढ़ते हैं, खासकर के क्लीफोर्ड सीरीज के यंग एज के टारगेट ऑडियेंस के लिए यह आश्वस्त होना जरूरी था कि स्पीच पैटर्न और चाइल्ड्स वॉयस की बारीकी को पहचानने के लिए वॉयस रिकॉग्नीशन वेल-कैलीब्रेटेड हो।
वेरीफाइंग और लॉकिंग जेस्चर्स
क्लीफोर्ड्स रीडिंग एडवेंचर्स का एक गेम बच्चों से कहता है कि ‘टॉय ट्री’ से गिरते हुए टॉय को कैच कर क्लीफोर्ड की मदद करो। किड्स अपने हाथ का इस्तेमाल स्क्रीन बास्केट पर पकड़ने के लिए करते हैं और तब जेस्चर बायें और दायें घूम कर बास्केट को बैक करता है और आगे बढ़कर टॉयज कैच कर लेता है।
डेवलपर्स ने जेस्चर को वेरीफार्इ करने के लिए एलगोरिद्म चेक्स को एड किया और बास्केट पर प्लेयर्स हैंड के साथ उसे लॉक कर दिया। टेस्टिंग फेज के दौरान यंग प्लेयर्स एंगेज्ड थे, अपने में इन्जॉय कर रहे थे और सही ढंग के कैचेज के लिए टाइमिंग कर रहे थे। टेस्टिंग के पहले, डेवलपमेंट लैब में कैच के चाइल्ड्स कंट्रोल को एडल्ट्स के समान, डेवलपर्स ने गलत ढंग से एज्यूम किया। बच्चों के जेस्चर के साथ काम करने से डेवलपर्स को कर्इ लर्निंग अपॉरच्यूनिटी प्राप्त हुर्इ और अल्टीमेटली उनको गेम के डिजाइन के बारे में री-थिंक करनी पड़ी जिसने यंगर चिल्ड्रेन के इम्प्रेसाइज जेस्चर्स को इनेबल किया। बच्चों के मोशन-टॉयज, लार्ज और अक्सर इरेटिक मूवमेंट्स को ठीक से कैप्चर करना चैलेंजिंग था क्योंकि सेंसर को कम्प्लेक्स, मल्टीपार्ट्स जेस्चर्स की व्याख्या और समझने में कठिनार्इ होती थी। तब एक क्वालिटी एक्सपीरिएंस प्राप्त करने के लिए जेस्चर की प्रोटोटाइपिंग और रीट्रीटिंग को केयरफुल मॉडरेशन की जरूरत पड़ी। चाइल्ड जेस्चर को एकोमोडेट करने के लिए मूवमेंट कैप्चर एरिया को विस्तृत करने की जरूरत पड़ी ताकि यदि जेस्चर प्रीसाइज न हो तो एक्शन को रिकॉग्नाइज करके च्छित रिस्पॉन्स को एक्टिवेट कर दिया जाय।
उदाहरणस्वरूप – एक दूसरे मिनी गेम में, प्लेयर्स क्लीफोर्ड को उसके गार्डेन से वीड्स पूल करने में मदद करते हैं। बच्चों के हाथ वीड को पकड़ने के लिए नीचे जाए और इसे पूल करने के लिए ऊपर आये, इसके बदले में डेवलपर्स ने हैंड क्लोज्ड/हैंड ओपेन मोशन को बीड्स ग्रैब करने और थ्रो करने का सिंबल मान लिया। बच्चों के डेवलपमेंट कैपेबिलिटीज और मूवमेंट्स को एकोमोडेट करने के लिए चेंजेज करके गेम्स को और सफल बना दिया।
निम्नांकित कोड है जिसका प्रयोग गेम के अंदर ट्यूटोरियल में प्लेयर्स के जेस्चर को कैलीब्रेट करने में किया जाता है जो यूजर्स से उनके हाथ को घुमाने और बॉल को स्पिन करने के लिए कहता है। गेम में कुछ “//exponential smoothing” को अप्लार्इ करके जैसा कि चित्र 7 में दिखाया गया है, बेहतर कंट्रोल और आसान मूवमेंट किया जाता है। स्मूदिंग स्टेप्स सबट्रैक्ट करने में मदद करता है या कम से कम अनप्रेडिक्टेबल प्लेयर्स के मूवमेंट के औसत को जिसकी गेम को जरूरत है, इग्नोर कर देता है।
इमर्सिव एक्सपीरिएंसेज जो आप SDK के साथ क्रियेट कर सकते हैं, प्लेयर्स को गेम में तुरत उनके मूवमेंट के रिएक्शन को देता है। यह प्लेयर्स को बेनिफिट ऑफ फिलिंग देता है जैसे कि वे गेम में फिजिकली पार्टिसिपेट कर रहे हैं। जो भी हो, जटिल जेस्चर्स को ट्रैक करने के लिए और बच्चों द्वारा बोले गए स्पेसिफिक रिस्पॉन्सेज की पहचान करके वॉयस डिटेक्शन के लिए, कैमरे की क्षमता के कुछ लिमिटेशन थे।
जेस्चर्स
परसेप्चुअल कम्प्यूटिंग कैमरा अपने लोकेशन से लगभग 2-3 फीट के एरिया पर फोकस रहता है। कैमरा और सब्जेक्ट के बीच कम दूरी के चलते, रिसर्चर्स और डेवलपमेंट टीम ने पाया कि सिम्पल मूवमेंट्स और स्मॉल डिफाइंड जेस्चर्स, लार्ज मोशन्स या कॉम्प्लेक्स मूवमेंट्स से ज्यादा प्रभावकारी थे जो कैमरे के रेंज को पास्ट में ड्रीफ्ट कर सकते थे।
एकदम इच्छानुसार कार्य हेतु जेस्चर पाने के लिए ट्रायल और एरर मेथड की जरूरत थी। डेवलपमेंट टीम को अलग इनवॉयरन्मेंट कंडीशन्स, लाइटिंग और कैमरे से दूरी पर ध्यान देना था।
SDK, API, और टेक्नोलॉजी के संदर्भ में, जेस्चर वर्किंग के बेसिक फर्स्ट वर्जन्स को पाना आसान है क्योंकि SDK में ट्यूटोरियल्स, सैम्पल कोड और स्ट्रक्चर शामिल हैं। एक बार यदि अपने डेवलपमेंट इनवॉयरन्मेंट को सेट अप कर लिया है तो आप ट्यूटोरियल को फॉलो कर सकते हैं जैसे सेंसर्स-टू-कोड रिलेशनशिप जो SDK को कम्प्लीमेंट करता है, उसको एक्सप्लोर करने के लिए फिंगर ट्रैकिंग सैम्पल करना।
डेवलपर्स ने पाया कि जेस्चर्स के लिए प्रयुक्त विभिन्न कोऑर्डिनेट सिस्टम्स के बारे में SDK को जानकारी का अभाव था। इसलिए उनको अपने लिए अभ्यास करना था कि ये कैसे ट्रायल और एरर मेथड के जरिये काम करते थे।
टीम ने शुरूआत में “node[8].position Image.x/y” एप्रोच का इस्तेमाल डेफ्थ इनफॉर्मेशन को डिस्कार्ड करके किया क्योंकि जेस्चर को इम्प्लीमेंट करने के लिए इसकी जरूरत नहीं थी। बाद में टीम को बेटर एप्रोच मिल गया। उन लोगों ने डेफ्थ इमेज का प्रयोग किया और नजदीकी पिक्सल को खोजा जो प्रभावकारी रूप में जेस्चर को पिक अप करने में मदद करे। तब उन लोगों ने जेस्चर डिटेक्शन को इम्प्रूव करने में मदद करने के लिए एक्सपोनेंशियल स्मूदिंग को एड किया।
वॉयस रिकॉग्नीशन
गेम का वॉयस रिकॉग्नीशन फंक्शनलिटी डिवाइसेज और सिनेरियोज द्वारा बहुत ज्यादा प्रभावित था। वॉयस रिकॉग्नीशन ने कुछ डिवाइसेज और परिस्थितियों में ढंग से काम किया और मगर दूसरे डिवाइसेज तथा परिस्थितियों में नहीं।
गेम में यंग चिल्ड्रेन को एप्रोप्रियेट कमांड्स को रिपीट करने के लिए उत्साहित किया जाना चाहिए जिसे माइक्रोफोन द्वारा पिक-अप किया जाता है। एक्यूरेट रिकॉग्नीशन को बैक ग्राउंड नॉयज और गेम म्यूजिक का साथ भी पाने की जरूरत है। वॉयस रिकॉग्नीशन या तो स्पीच डिटेक्शन मोड में काम करता है, जहां यह पहचान करने की कोशिश करता है कि आपने क्या बोला है या डिक्शनरी मोड में जहां यह आपने डिक्शनरी के विरूद्ध क्या बोला है, उसे मैच करने की कोशिश करता है जो कि गेम में यूजर डिफाइंड होता है।
सबसे पहले, टीम ने डिटेक्शन मोड में ट्रार्इ किया और इसे किसी भी नॉयज को स्वीकृत करने लायक कन्फीगर्ड किया, यह मानकर कि यंग चिल्ड्रेन का स्पीच हमेशा वेल इनन्शियेटेड नहीं होता। जो भी हो, इसने आशा के अनुरूप कार्य नहीं किया। बदले में टीम ने डिक्शनरी मोड का इस्तेमाल किया जो क्लीन सिनेरियोज में अच्छे से कार्य करता है यदि शब्दों को स्पष्टतया बोला जाता है। टीम ने वैरियेंट्स ऑफ वर्ड्स को जोड़ने का प्रयास किया ताकि यह और भी शब्दों को एक्सेप्ट कर सके यदि क्लीयरली इनन्शियेट न हो तब भी ( sell, cell, sail, ail), जो भी हो, डिक्शनरी मोड ने कम प्रभावकारी रूप से कार्य किया क्योंकि यदि की-वर्ड्स के नंबर ज्यादा होंगे तो ज्यादा गलतियां या मिसमैच होगा। डेवलपर्स को एक्सेप्टेबल की-वर्ड्स और पोटेंशियल एरर रेट के बीच में बैलेंस पाना था। अंतिम एप्लीकेशन में, एक्सेप्टेबल वर्ड्स को कम से कम रखा गया ताकि बच्चों के लिए सिम्पल इंटरैक्शन हो सके।
स्क्रीन साइज मैटर्स – ऑल इन वन अवेयरनेस
जब टच स्क्रीन मैन्यूफैक्चरिंग कैपेबिलिटी एडवांस होती है, लार्जर स्क्रीन बनाये और बेचे जाने लगते हैं। यह स्क्रीन साइज एक्सपेंशन एक दूसरा एरिया है जिसे क्लीफोर्ड रीडिंग एडवेंचर्स डिमॉन्सट्रेट करता है। इस प्रकार के कर्इ बड़े स्क्रीन्स कम्प्यूटर मार्केट के सेगमेंट में लगाये जा रहे हैं जिसे ऑल-इन-वन (AIO) PCs कहा जाता है।
AIO PCs में स्क्रीन के पीछे मदरबोर्ड बना होता है जिसके साथ मॉनीटर (18 डिग्री से 55 डिग्री के बीच) होता है। उनमें हार्इ परफॉर्मिंग प्रोसेसर्स, फुल हार्इ-डेफिनिशन (HD) रिजोल्यूशन (1080p/720p), और एक ब्लूटूथ वायरलेस की बोर्ड और माउस होता है और बिल्ट-इन हार्इ कैपेसिटी बैटरी को सपोर्ट करता है जो डिवाइस को आसानी से पोर्टेबल बनाता है। AIOs, PCs के फास्टेस्ट ग्रोविंग की एक कैटेगरी है। उनकी प्रसिद्धि का सबसे बड़ा कारण यह है कि AIOs अपना सारा काम करते हैं जो आप PC से एक्सपेक्ट करते हैं – हाउसहोल्ड एक्सपेंसेज के ट्रैक को रखना, होमवर्क करना, इंटरैक्टिव गेम्स खेलना, वेब ब्राउज करना, दोस्तों से चैट करना और टीवी और मूवीज देखना।
इनमें से बहुत से नये AIOs पोर्टेबल (pAIO) भी हैं और उनमें वर्सैटिलिटी को एड कर रहे हैं। pAIO उपकरण, लार्जर स्क्रीन रियल इस्टेट, हार्इ परफॉर्मेन्स नेटवर्किंग कैपेबिलिटी और एक मल्टी टच यूजर इंटरफेस (UI) का फुल एडवांटेज लेने के लिए गेम और एप्लीकेशन डेवलपर्स को इस छोटे पोर्टेबल डिवाइस में इनेबल करते हैं जिसका प्रयोग दोनों टिल्टेड और फ्लैट सरफेस मोड में किया जा सकता है। इंटरनल बैटरी, एक्सपीरिएंस के कन्ट्यूनिटी को आश्वस्त करती है और बिल्ट-इन वायरलेस नेटवर्किंग एक होम लोकेशन से दूसरे में रोमिंग की सेवा देता है। बड़ा HD डिस्प्ले एक हार्इ-एंड ग्राफिक प्रोसेसर्स के साथ फुल मल्टी टच-इनेबल्ड यूजर एक्सपीरिएंस (UX) से सपोर्टेड होता है। ये सारे फीचर्स डेवलपर्स को एक आकर्षक पैकेज ऑफर करते हैं जो सिंगल-यूजर मोबाइल डिवाइस के अवरोधों से मुक्ति पाना चाह रहे हैं। क्लीफोर्ड डेवलपर्स अपने गेम को बड़े स्क्रीन पर खेलते हुए देखने के प्रति काफी उत्साहित थे इसलिए उन लोगों ने अपने गेम को 1920×1080 स्क्रीन रिजोल्यूशन पर चलाने के लिए बनाया।
सारांश
डेवलपमेंट टेस्टिंग के दौरान टीम ने ग्रेट फन किया। टीम ने अपने टारगेट ऑडियेंस (किड्स) के साथ यूजर स्टडीज को भी अच्छे से सीखा। जिस समय यह स्ट्रक्चर्ड टेस्टिंग बहुत हेल्पफुल था, अपने परिवार वालों को खेलते हुए देखना बहुत ही आनंदकारी था। हमारे एक सीनियर डेवलपर ने इसे अपनी तीन साल की बेटी को दिखाया और डेवलपमेंट टीम यह सुनकर बहुत ही खुश हुर्इ कि वह उसके बाद व्यस्त रहती थी और उसने भरपूर आनंद उठाया।
पहली बार CES 2014 में घोषित, इंटेल® रियल-सेंस™ टेक्नोलॉजी एक नया नाम है और ब्रांड है जो कि इंटेल® परसेप्चुअल कम्प्यूटिंग टेक्नोलॉजी थी, इंट्यूटिव यूजर इंटरफेस SDK के साथ स्पीच रिकॉग्नीशन, जेस्चर हैंड और फिंगर ट्रैकिंग और फेसियल रिकॉग्नीशन जैसे फंक्शन जिसको इंटेल ने 2013 में इंट्रोड्यूस किया। इंटेल रियलसेंस टेक्नोलॉजी डेवलपर्स को अतिरिक्त फीचर्स देते हैं जिसमें स्कैनिंग, मोडिफाइंग, प्रिंटिंग और ऑगमेंटेड रियालिटी इंटरफेस में मेजर एडवांसेज और 3D प्लस में शेयर करना शामिल है। इन फीचर्स का प्रयोग करके यूजर्स एडवांस्ड हैंड-एंड फिंगर-सेंसिंग टेक्नोलॉजी का प्रयोग करके स्कैन्ड 3D ऑब्जेक्ट्स को नेचुरली मैनुपुलेट कर सकते हैं।
लेखक के बारे में
टिम डंकन एक इंटेल इंजीनियर हैं जिन्हें मित्रों द्वारा ‘‘ Mr. Gidget-Gadget’’ जैसा कहा जाता है। फिलहाल सॉल्यूशन्स में टेक्नोलॉजी को इंटीग्रेट करके डेवलपर्स को मदद करते हुए टीम के पास चीप मैन्यूफैक्चरिंग से लेकर सिस्टम इंटीग्रेशन का दशकों का अनुभव रहा है। उनको आप इंटेल® डेवलपर ज़ोन पर टिम डंकन (इंटेल) के नाम से खोजें।
सूचना
स्कॉलास्टिक इंटरैक्टिव LLC द्वारा प्रदत्त सोर्स कोड को विंडोस 8 प्लेटफॉर्म के लिए इंटेल के परसेप्चुअल कम्प्यूटिंग टेक्नोलॉजी का इस्तेमाल करके एप्प्स के एक्सपोनेंशियल स्मूदिंग फंक्शनलिटी के लिए मॉडल स्ट्रेटेजी प्रदान करना।
क्लीफोर्ड आर्टवर्क © स्कॉलास्टिक इंटरटेनमेंट इन्क. CLIFFORD THE BIG RED DOG और एसोसियेट लोगोज नॉर्मन ब्रीडवेल का ट्रेडमार्क है। सर्वाधिकार सुरक्षित है। ऐसे अन्य विंडोस रिसोर्सेस और इंटेल के टूल्स के लिए कृपया विजिट करें: Intel® Developer Zone