विज्ञापन बन्द गर्नुहोस्

2017 त्यो वर्ष हो जब यो पूर्ण रूपमा सुरु भयो स्मार्ट आवाज सहायकहरूको युद्ध, जसमा हाम्रो आवश्यक सहयोगी बन्ने क्षमता छ। एप्पल, अमेजन, माइक्रोसफ्ट र गुगलले आगोमा आफ्नो फलाम छ, प्रत्येक एक फरक संग। सबैभन्दा महत्त्वपूर्ण तत्वहरू मध्ये एकमा, तथापि, एप्पलको सिरी नेतृत्व लिन्छ - यसले धेरै भाषाहरू बोल्न सक्छ।

चेक प्रयोगकर्ता सायद यसमा धेरै चासो राख्दैनन्, किनभने दुर्भाग्यवश सिरीले अझै पनि उनको लागि सबैभन्दा महत्त्वपूर्ण भाषा बोल्दैन, तर अन्यथा एप्पल सहायकले 21 देशहरूको लागि स्थानीय भाषाहरू बोल्छन् र बुझ्छन्, जुन कुनै पनि प्रतिस्पर्धी होइन। मिलाउन सक्छ।

माइक्रोसफ्टको कोर्टानालाई तेह्र देशमा आठ भाषा बोल्न सिकाइएको छ, गुगल सहायकले चार भाषा बोल्न सक्छ र अमेजनको एलेक्साले अंग्रेजी र जर्मन मात्र बोल्न सक्छ । एक समयमा जब अधिकांश स्मार्टफोनहरू संयुक्त राज्य अमेरिका बाहिर बेचिन्छन्, तिनीहरूको आवाज सहायकलाई स्थानीयकरण गर्नु सबै प्राविधिक कम्पनीहरूको लागि अत्यन्त महत्त्वपूर्ण छ। र एप्पलको यहाँ एक हेड स्टार्ट छ, यस तथ्यलाई पनि धन्यवाद कि यो सिरीको साथ आएको पहिलो थियो।

सबै बहसहरू अब एकै ठाउँमा जान्छन् एप्पलले यो नेतृत्वलाई एक बिट खेर फालेन र प्रतिस्पर्धाले पकडिरहेको छ वा सहायक कौशलको सन्दर्भमा उसलाई ओभरटेक गर्न थाल्छ। एजेन्सी रायटर वास्तवमा, उनी सिरीले वास्तवमा नयाँ भाषाहरू कसरी सिक्छन् भन्ने रोचक जानकारी लिएर आएकी थिइन्, जुन अन्तमा धेरै बजारहरूको लागि केही कार्यहरू भन्दा अलि महत्त्वपूर्ण हुन सक्छ।

सहायकहरू

यदि भ्वाइस सहायकहरू वास्तवमै सकेसम्म धेरै फैलाउन र विश्वभरका स्मार्टफोनहरूमा मात्र स्मार्ट सहयोगी बन्न चाहन्छन् भने, सकेसम्म धेरै भाषाहरू जान्नु एकदम महत्त्वपूर्ण छ। यही कारणले गर्दा सिरीले चिनियाँ वू भाषा परिवारको विशेष बोली सिकिरहेको छ, जुन शंघाईको वरपर मात्र बोलिन्छ, तथाकथित "साङ्घाई भाषा"।

जब सिरीले नयाँ भाषा सिक्न थाल्छ, मानिसहरू विभिन्न उच्चारण र बोलीहरूमा परिच्छेदहरू पढ्न Apple को प्रयोगशालाहरूमा प्रवेश गर्छन्। यी त्यसपछि म्यानुअल रूपमा ट्रान्सक्राइब हुन्छन् ताकि कम्प्युटरलाई पाठ भनेको के हो भनेर थाहा हुन्छ। एप्पलको भाषण टोलीका प्रमुख, एलेक्स एसेरो, बताउँछन् कि विभिन्न आवाजहरूमा ध्वनिहरूको दायरा पनि कैद गरिन्छ, जसबाट ध्वनिक मोडेल सिर्जना गरिन्छ, जसले शब्द अनुक्रमहरू भविष्यवाणी गर्ने प्रयास गर्दछ।

यस प्रक्रिया पछि, श्रुतिलेख मोड आउनेछ, जुन सामान्यतया iOS र macOS प्रयोगकर्ताहरू द्वारा प्रयोग गर्न सकिन्छ र सिरी भन्दा धेरै भाषाहरूमा काम गर्दछ। त्यसपछि Apple ले सधैं यी अडियो रेकर्डिङहरूको सानो प्रतिशत कब्जा गर्छ, तिनीहरूलाई अज्ञात बनाउँछ र त्यसपछि तिनीहरूलाई पाठमा ट्रान्सक्राइब गर्छ ताकि कम्प्युटरले सिक्न सक्छ। यो रूपान्तरण मानव द्वारा पनि गरिन्छ, जसले ट्रान्सक्रिप्शन त्रुटिको सम्भावनालाई आधाले घटाउँछ।

एकपटक पर्याप्त डाटा सङ्कलन गरिसकेपछि र सिरी नयाँ भाषामा बोलिसकेपछि, एप्पलले सम्भावित प्रश्नहरूको जवाफसहित एक सहायक जारी गर्नेछ। सिरीले प्रयोगकर्ताहरूले उनलाई सोधेको कुराको आधारमा वास्तविक संसारमा सिक्छ, र प्रत्येक दुई हप्तामा निरन्तर सुधार हुन्छ। यो निश्चित रूपमा एप्पल वा अरू कसैको शक्तिमा छैन कि प्रयोगकर्ताहरूले प्रयोग गर्ने सबै सम्भावित परिदृश्यहरू अग्रिम लेख्न।

"तपाईले प्रत्येक भाषाको लागि आवश्यक प्रणाली निर्माण गर्न पर्याप्त लेखकहरू भाडामा लिन सक्नुहुन्न। तपाईंले जवाफहरू संश्लेषण गर्नुपर्दछ, "प्रो व्याख्या गरे रायटर चार्ल्स जोली, जसले बौद्धिक सहायक ओज्लो सिर्जना गरे। Dag Kittlaus, मालिक र अर्को स्मार्ट सहायक, Viv को सह-संस्थापक, जुन गत वर्ष पनि सहमत छ। Samsung द्वारा किनेको.

"Viv स्मार्ट सहायकहरूको स्केलिंग समस्या समाधान गर्न ठीकसँग निर्माण गरिएको थियो। तपाईं आजको सीमित कार्यक्षमताको वरिपरि प्राप्त गर्न सक्ने एक मात्र तरिका भनेको प्रणाली खोल्नु र संसारलाई सिकाउन दिनु हो," किटलस भन्छन्।

चेक सिरीको बारेमा लामो समयको लागि कुरा गरिएको छ, तर एप्पल सहायकले निकट भविष्यमा हाम्रो मातृभाषा सिक्ने आशा गर्न सम्भव छैन। नेटिभ स्पिकरहरूको संख्यालाई ध्यानमा राख्दै, चेक अझै पनि अपेक्षाकृत सानो र चाखलाग्दो छ, माथि उल्लिखित "Shanghai" लगभग 14 मिलियन मानिसहरूले बोल्छन्।

तर नयाँ भाषाहरू सिक्ने प्रक्रियाको बारेमा चाखलाग्दो कुरा यो हो कि एप्पलले यसलाई गर्न डिक्टेशन डाटा प्रयोग गर्दछ। यसको मतलब अधिक हामी आईफोन, आईप्याड वा म्याकहरूमा चेक लेख्नेछौं, एकातिर, प्रकार्यले थप सुधार गर्नेछ र अर्कोतर्फ, एप्पलसँग डाटाको बढ्दो ठूलो नमूना हुनेछ, जसबाट सिरीले एक दिन चेक सिक्न सक्षम हुनेछ। यो कति दिन टिक्ने भन्ने प्रश्न हो ।

मुहान: रायटर
.