مايو 8, 2024

Taqrir Washington

آخر أخبار المملكة العربية السعودية وعناوين الأخبار العربية. قراءة الصحف السعودية بما في ذلك اقتصاد المملكة العربية السعودية أهم الأخبار والأخبار السعودية العاجلة …

كيف علمت أمازون أليكسا التحدث باللغة الأيرلندية

كيف علمت أمازون أليكسا التحدث باللغة الأيرلندية

مثل هنري هيغينز ، أظهر عالما الصوتيات ماريوس جوديكو وجورجي تينشيف مؤخرًا كيف يحاول طلابهم التغلب على صعوبات النطق في مسرحية جورج برنارد شو “بجماليون”.

كان اثنان من علماء البيانات يعملان في أمازون في أوروبا يدرسان أليكسا ، المساعد الرقمي للشركة. مهمتهم: مساعدة Alexa على إتقان اللغة الإنجليزية بلكنة أيرلندية بمساعدة الذكاء الاصطناعي والتسجيلات من الناطقين بها.

خلال المظاهرة ، تحدثت أليكسا عن ليلة لا تنسى. قال أليكسا: “كانت حفلة الليلة الماضية ممتعة للغاية” مستخدمة الكلمة الأيرلندية للمتعة. “حصلنا على الآيس كريم في طريقنا إلى المنزل وكنا سعداء”.

السيد. هز تينشيف رأسه. قام Alexa بإسقاط حرف “r” في كلمة “party” ، مما يجعل الكلمة تبدو مسطحة مثل pah-tee. وخلص إلى أنه بريطاني للغاية.

يعد التقنيون جزءًا من فريق Amazon الذي يعمل في منطقة صعبة من علم البيانات تسمى التحليلات الصوتية. إنها مشكلة صعبة يتم أخذها على صلة جديدة وسط موجة من تطورات الذكاء الاصطناعي ، حيث يأمل الباحثون أن يساعد لغز الكلام والتكنولوجيا في جعل الأجهزة التي تعمل بالذكاء الاصطناعي والروبوتات ومُصنِّع الكلام أكثر قدرة على المحادثة – أي قادرة على جذب مناطق متعددة. النطق.

التغلب على تلعثم الصوت هو أكثر من مجرد فهم المفردات والنحو. غالبًا ما تعطي نغمة المتحدث والجرس ولهجة الكلمات معنى مختلفًا ووزنًا عاطفيًا. يسمي اللغويون هذه الميزة اللغوية “العروض” ، وهو شيء تجد الآلات صعوبة في إتقانه.

فقط في السنوات الأخيرة ، بفضل التقدم في الذكاء الاصطناعي ، ورقائق الكمبيوتر ، وغيرها من الأجهزة ، أحرز الباحثون تقدمًا في التغلب على مشكلة تقليم الصوت ، مما يجعل الكلام الناتج عن الكمبيوتر أكثر إمتاعًا للأذن.

قال الباحثون إن مثل هذا العمل يمكن أن يتقارب في النهاية مع انفجار “الذكاء الاصطناعي التوليدي” ، وهي تقنية تساعد روبوتات المحادثة على توليد استجاباتها الخاصة. قد تصبح روبوتات الدردشة مثل ChatGPT و Bard ذات يوم تعمل بكامل طاقتها وتستجيب شفهيًا لأوامر المستخدمين الصوتية. قال محللون إن المساعدين الصوتيين مثل Alexa و Apple’s Siri سيصبحون في الوقت نفسه أكثر تخاطبًا ، مما قد يجدد اهتمام المستهلكين بقطاع التكنولوجيا الراكد.

READ  يوفر تحديث GeForce Now Android دقة 1440 بكسل بمعدل 120 إطارًا في الثانية

جعل المساعدين الصوتيين مثل Alexa و Siri و Google Assistant يتحدثون لغات متعددة عملية مكلفة وتستغرق وقتًا طويلاً. استأجرت شركات التكنولوجيا ممثلين صوتيين لتسجيل مئات الساعات من الكلام ، مما يساعد على إنشاء أصوات اصطناعية للمساعدين الرقميين. تسمى أنظمة الذكاء الاصطناعي المتقدمة “نماذج تحويل النص إلى كلام” – لأنها تحول النص إلى كلام اصطناعي يبدو طبيعيًا – بدأت في التبسيط هذه العملية.

قالت ماريون لابوري ، كبيرة المحللين الاستراتيجيين في دويتشه بنك للأبحاث ، إن التكنولوجيا “يمكنها الآن توليد صوت بشري وصوت اصطناعي بناءً على إدخال النص بلغات ولهجات ولهجات مختلفة”.

تتعرض أمازون لضغوط للحاق بمنافسين مثل مايكروسوفت وجوجل في سباق الذكاء الاصطناعي. في أبريل ، قال آندي جاسي ، الرئيس التنفيذي لشركة أمازون ، لمحللي وول ستريت تخطط الشركة لجعل Alexa “أكثر نشاطًا وتحدثًا” بمساعدة الذكاء الاصطناعي التوليدي المتقدم وكبير العلماء في Amazon Rohit Prasad. قال لشبكة سي إن بي سي في مايو ، رأى المساعد الصوتي على أنه تنشيط صوتي “ذكاء اصطناعي شخصي متاح على الفور”.

ظهرت أليكسا الأيرلندية لأول مرة تجاريًا في نوفمبر بعد تسعة أشهر من التدريب لفهم والتحدث باللهجة الأيرلندية.

قال السيد “النطق يختلف عن اللغة”. قال براساد في مقابلة. يجب أن تتعلم تقنيات الذكاء الاصطناعي استخلاص النطق من أجزاء أخرى من الكلام ، مثل النغمة والتردد ، قبل أن تتمكن من محاكاة خصائص اللهجات المحلية – على سبيل المثال ، “a” مسطح ويمكن نطق “t” بقوة.

وقال إن هذه الأنظمة تحتاج إلى العثور على هذه الأنماط “حتى تتمكن من تكوين نطق جديد”. “هذا صعب.”

حاول هاردر اشتقاق التكنولوجيا لتعلم نطق جديد من عينة كلام لا تزال مختلفة الصوت. في إنشاء برنامج Alexa الأيرلندي ، قام Mr. حاول فريق Godescu. لقد اعتمدوا بشكل كبير على نموذج الكلام الحالي للكنات الإنجليزية البريطانية في المقام الأول – مع اللهجات الأمريكية والكندية والأسترالية المحدودة للغاية – لتعليم اللغة الأيرلندية التحدث باللغة الإنجليزية.

READ  أطلقت Microsoft موقعًا إلكترونيًا لشرح استحواذ Activision على Blizzard

كافحت المجموعة مع التحديات اللغوية المختلفة للغة الإنجليزية الأيرلندية. يميل الأيرلنديون إلى إسقاط حرف “h” في “th” ، على سبيل المثال ، نطق المقطع على أنه حرف “t” أو “d” صعبًا ، مما يجعل كلمة “bath” تبدو مثل “bad” أو “bad”. اللغة الإنجليزية الأيرلندية هي أيضًا rhotic ، مما يعني أن الحرف “r” يتم نطقه أكثر. هذا يعني أن “r” in “party” تبدو مختلفة تمامًا عما تسمعه من فم سكان لندن. كان على أليكسا تعلم ميزات الكلام هذه وإتقانها.

الأيرلندية الإنجليزية والرومانية والباحث الرئيسي في فريق أليكسا الأيرلندي ، أ. قال جوديسكو: “أمر صعب”.

لقد تحسنت نماذج الكلام التي تعزز القدرات اللفظية لـ Alexa كثيرًا في السنوات الأخيرة. في عام 2020 ، قام باحثو أمازون بتعليم أليكسا تحدث الإسبانية بطلاقة من عينة ناطق باللغة الإنجليزية.

السيد. يرى جوديسكو وفريقه أن اللهجات هي الحدود التالية في قدرات الكلام في Alexa. لقد صمموا أليكسا الأيرلندي للاعتماد على الذكاء الاصطناعي أكثر من الممثلين لصياغة خطابها. نتيجة لذلك ، تم تدريب أليكسا الأيرلندي على مجموعة صغيرة نسبيًا – حوالي 24 ساعة من التسجيلات بواسطة ممثلين صوتيين درسوا 2000 نطق للغة الإنجليزية الأيرلندية.

في وقت مبكر ، عندما قام باحثو أمازون بتقديم التسجيلات الأيرلندية إلى أليكسا الأيرلندي الذي لا يزال يتعلم ، حدثت بعض الأشياء الغريبة.

تسقط الحروف والمقاطع أحيانًا من الإجابة. أحيانًا يتم لصق “S” معًا. كلمة أو كلمتين ، مهمة في بعض الأحيان ، تمتم بشكل غير مفهوم وغير مفهوم. في حالة واحدة على الأقل ، انخفض صوت أليكسا الأنثوي بضع أوكتافات وبدا أكثر ذكورية. الأسوأ من ذلك ، أن الصوت المذكر بدا بريطانيًا ، وهو هراء من شأنه أن يثير الدهشة في بعض المنازل الأيرلندية.

READ  تعطلت خوادم Fortnight في Epic Games: تعمل Epic على إعادة اللعبة إلى القمة

قال السيد “إنها صناديق سوداء كبيرة”. وقال تينشيف ، وهو مواطن بلغاري وهو كبير علماء أمازون في المشروع ، إن عينات الكلام. “عليك القيام بالكثير من التجارب لضبطها.”

هذا ما فعله الفنيون لإصلاح خطأ “الحفلة” في أليكسا. قاموا بتقسيم الكلام ، كلمة بكلمة ، الصوت (أصغر جزء مسموع من كلمة) بواسطة الصوت للعثور على المكان الذي ينزلق فيه Alexa وضبطه. ثم قاموا بتغذية عينة الكلام الأيرلندية أليكسا بمزيد من البيانات الصوتية المسجلة لتصحيح الخطأ اللفظي.

الخلاصة: “r” في “الحفلة” عاد. ولكن بعد ذلك اختفت “ف”.

لذا قام علماء البيانات بنفس العملية مرة أخرى. قاموا في النهاية بالتركيز على الصوت مع “p” المفقود. ثم قاموا بضبط النموذج بحيث يعود الصوت “p” ولا يختفي الحرف “r”. تعلم أليكسا أخيرًا التحدث مثل دبلن.

اثنان من اللغويين الأيرلنديين – إيلين فوغان ، التي تدرس في جامعة ليمريك ، وكيت تالون ، طالبة دكتوراه تعمل في معمل الصوتيات والتخاطب في كلية ترينيتي في دبلن – أعطت أليكسا نطق علامات إيرلندية عالية. الطريقة التي شدد بها أليكسا الأيرلندي على حرف “r” وتخفيف حرف “t” ، كما قالوا ، حصلت أمازون على اللهجة الكاملة بشكل صحيح.

قالت السيدة تالون: “يبدو الأمر حقيقياً بالنسبة لي”.

قال باحثو أمازون إنهم سعداء بالتعليقات الإيجابية في الغالب. اختارت عينات كلامهم اللهجة الأيرلندية بسرعة كبيرة لدرجة أنها أعطتهم الثقة في إمكانية تكرار اللهجات في مكان آخر.

وكتبوا “نخطط أيضًا لتوسيع أساليبنا لتشمل نطق لغات أخرى غير الإنجليزية” ورقة بحث يناير حول مشروع أليكسا الأيرلندي.