بستن آگهی

2017 سالی است که به طور کامل آغاز شد نبرد دستیارهای صوتی هوشمند، که این پتانسیل را دارند که به یاران ضروری ما تبدیل شوند. اپل، آمازون، مایکروسافت و گوگل آهن آلات خود را در آتش دارند که هر کدام متفاوت است. با این حال، در یکی از مهمترین عناصر، سیری اپل پیشتاز است – می تواند به بیشترین زبان ها صحبت کند.

کاربر چک احتمالاً علاقه زیادی به این کار نخواهد داشت، زیرا متأسفانه سیری هنوز به مهم ترین زبان برای او صحبت نمی کند، اما در غیر این صورت دستیار اپل به 21 زبان محلی برای 36 کشور صحبت می کند و می فهمد که هیچ یک از رقبا نیستند. می تواند مطابقت داشته باشد.

کورتانای مایکروسافت در سیزده کشور به هشت زبان صحبت می کند، دستیار گوگل می تواند به چهار زبان صحبت کند و الکسای آمازون تا کنون فقط انگلیسی و آلمانی صحبت می کند. در زمانی که اکثر گوشی‌های هوشمند در خارج از ایالات متحده فروخته می‌شوند، بومی‌سازی دستیارهای صوتی آن‌ها برای همه شرکت‌های فناوری بسیار مهم است. و اپل در اینجا شروع خوبی دارد، همچنین به لطف این واقعیت که اولین کسی بود که سیری را ارائه کرد.

همه بحث ها در مورد اینکه آیا اکنون کنار می روند یا خیر اپل این سرنخ را یک ذره هدر نداد و رقابت از نظر مهارت های دستیاری از او پیشی می گیرد یا حتی از او پیشی می گیرد. آژانس رویترز در واقع، او به اطلاعات جالبی در مورد چگونگی یادگیری زبان های جدید سیری رسید که در نهایت ممکن است کمی مهمتر از برخی عملکردها برای بسیاری از بازارها باشد.

دستیاران

اگر دستیارهای صوتی واقعاً تا حد امکان گسترش یافته و به کمک هوشمندی نه تنها در تلفن های هوشمند در سراسر جهان تبدیل شوند، دانستن هر چه بیشتر زبان ها کاملاً کلیدی است. همچنین به همین دلیل است که سیری در حال یادگیری لهجه خاص خانواده زبان چینی وو است که فقط در اطراف شانگهای صحبت می شود، به اصطلاح "زبان شانگهای".

هنگامی که سیری در آستانه شروع یادگیری یک زبان جدید است، افراد وارد آزمایشگاه های اپل می شوند تا قطعاتی را با لهجه ها و گویش های مختلف بخوانند. سپس این ها به صورت دستی رونویسی می شوند تا کامپیوتر دقیقاً بداند متن چیست. رئیس تیم گفتار اپل، Alex Acero، توضیح می دهد که طیف صداها در صداهای مختلف نیز ضبط می شود، که از آن یک مدل آکوستیک ایجاد می شود، که سپس سعی می کند توالی کلمات را پیش بینی کند.

بعد از این پروسه حالت دیکته بالا میاد که معمولاً توسط کاربران iOS و macOS قابل استفاده است و به زبان های بسیار بیشتری نسبت به سیری کار می کند. سپس اپل همیشه درصد کمی از این صداهای ضبط شده را ضبط می کند، آنها را ناشناس می کند و سپس آنها را به متن رونویسی می کند تا رایانه بتواند یاد بگیرد. این تبدیل نیز توسط انسان انجام می شود که احتمال خطای رونویسی را به نصف کاهش می دهد.

هنگامی که داده های کافی جمع آوری شد و سیری با زبان جدید صحبت شد، اپل دستیار را با پاسخ به محتمل ترین سؤالات منتشر خواهد کرد. سیری سپس در دنیای واقعی بر اساس آنچه کاربران از او می‌پرسند یاد می‌گیرد و هر دو هفته یکبار بهبود می‌یابد. مطمئناً در اختیار اپل یا هیچ کس دیگری نیست که تمام سناریوهای احتمالی را که کاربران استفاده خواهند کرد از قبل بنویسد.

شما نمی توانید نویسندگان کافی را برای ساختن سیستم مورد نیاز برای هر زبان استخدام کنید. شما باید پاسخ ها را ترکیب کنید رویترز چارلز جولی، که دستیار هوشمند اوزلو را خلق کرد. داگ کیتلاس، رئیس و یکی از بنیانگذاران دستیار هوشمند دیگر، Viv، که سال گذشته نیز با آن موافقت کرد. توسط سامسونگ خریداری شده است.

Viv دقیقاً برای حل مشکل مقیاس دستیارهای هوشمند ساخته شده است. کیتلاوس می‌گوید تنها راهی که می‌توانید از عملکرد محدود امروزی دور شوید این است که سیستم را باز کنید و اجازه دهید دنیا آن را آموزش دهد.

مدت‌هاست که درباره سیری چک صحبت می‌شود، اما احتمالاً نمی‌توان انتظار داشت که دستیار اپل زبان مادری ما را در آینده نزدیک یاد بگیرد. با در نظر گرفتن تعداد گویشوران بومی، چک هنوز هم نسبتاً کوچک و جالب نیست، حتی "شانگهای" فوق الذکر توسط تقریباً 14 میلیون نفر صحبت می شود.

اما آنچه در مورد فرآیند یادگیری زبان های جدید جالب است این است که اپل از داده های دیکته برای انجام آن استفاده می کند. یعنی هر چه بیشتر ما چک را به آیفون، آی پد یا مک دیکته می کنیماز یک طرف، عملکرد بیشتر بهبود می یابد و از طرف دیگر، اپل نمونه بزرگی از داده ها را در اختیار خواهد داشت که سیری روزی می تواند زبان چک را یاد بگیرد. سوال این است که چقدر بیشتر ادامه خواهد داشت.

منبع: رویترز
.