الرئيسية / تطبيقات برمجية

تطبيقات برمجية

Gen؛ لغة برمجة جديدة تتجاوز التعليم العميق في تطبيقات الذكاء الصنعي

يسهّل فريق من الباحثين في معهد MIT المَهمة على المبتدئين للدخول في مجال الذكاء الصنعي، وهم يساعدون المختصين في هذا المجال أيضًا؛ ففي ورقة بحثية قُدِّمت في مؤتمر لتصميم لغات البرمجة وتنفيذها في شهر حزيران لعام 2019م تحدث الباحثون عن نظام برمجي للغة برمجة احتمالية تسمى (Gen).قُدِّمت الورقة البحثية في مؤتمر لتصميم لغات البرمجة وتنفيذها، وتحدث الباحثون عن نظام برمجي للغة برمجة احتمالية تسمى "Gen".يكتب المستخدمون أغراضًا وخوارزميات في مجالات متعددة تُطبَّق فيها تقنيات الذكاء الصنعي -مثل الرؤية الحاسوبية (computer vision) والروبوتات والإحصاءات- دون الحاجة إلى التعامل مع المعادلات أو كتابة التعليمات البرمجية المعقدة (components).تتيح لغة البرمجة Gen للباحثين وأصحاب الخبرة كتابةَ أغراض متطورة وخوارزميات أيضًا؛ مثل خوارزميات التنبؤ التي طالما كانت غير ممكنة. ...

أكمل القراءة »

الذكاء الصنعي يغدو ثنائي اللغة، لكن دون قواميس!

يقول (ميكل آرتيجيه)، عالم الحاسوب في جامعة إقليم الباسك في (سان سباستيان) في إسبانيا وكاتب إحدى الورقتين البحثيتين: "تخيل أنك أعطيت شخصًا كتبًا كثيرة باللغة الصينية وأخرى باللغة العربية ولا تداخُل بين هذه الكتب، وطلبت منه تعلم الترجمة من الصينية إلى العربية، يبدو ذلك مستحيلًا أليس كذلك؟ لكننا نبين أن الحاسوب يمكنه فعل ذلك."يخضع تعلم الآلة لنهجين متمايزين:التعلم تحت الإشراف Supervised Learning وفيه تُلقَّن الخوارزمية أنماط دخل مع تحديد الخرج المناسب لها؛ مثلاً تُدخل صور لمجموعة من الفواكه مع تحديد مسمياتها (الخرج)، والغرض هو بناء أنموذجِ تعلُّم تستطيع الآلة وفقه تمييز أنماط الدخل المستقبلية المختلفة دون تلقينها بالخرج المناسب ونقول عندها إن الآلة قد تعلمت.التعلم دون إشراف Unsupervised Learning وهنا تُدخل أنماط دخل مختلفة إلى الخوارزمية دون تلقينها الخرج المناسب لكل نمط دخل، وعليه ينبغي للخوارزمية أن تكتشف بنفسها الخرج الصحيح. يعتمد هذا النوع على التغذية الراجعة feedback لتصحيح الخرج الناتج إلى أن تصل الخوارزمية إلى الأنموذج الذي يُنتِج خرجًا صحيحًا، فنقول إن الآلة قد تعلمت؛ مثلاً تُدخل صور لمجموعة من الفواكه دون تحديد مسمياتها، وعلى الآلة أن تكتشف هذه الفواكه وتصنفها وفق مقاييس التشابه والاختلاف إلى مجموعات متمايزة.عادة ما يحتاج تعليم الآلة -ومن ضمنها الشبكات العصبونية وخوارزميات الحاسوب الأخرى التي تتعلم من التجربة- إلى إشراف؛ إذ يخمن الحاسوب الإجابة ويتلقى الإجابة الصحيحة ثم يضبط العملية وفقًا لذلك، وتعمل هذه الطريقة بكفاءة عند تعليم الحاسوب الترجمة بين الإنكليزية والفرنسية مثلًا، لأنه يتوفر وثائق كثيرة باللغتين، في حين لا تعمل هذه الطريقة بالكفاءة نفسها مع اللغات النادرة أو اللغات الشائعة لكن دون نصوص مترجمة كثيرة.تركز الورقتان البحثيتان، اللتان قُدمتا لتُعرضا في المؤتمر الدولي عن أشكال التعلم ولكنهما لم تخضعا لتقييم النظراء (peer review)، على منهج "تعليم الآلة دون إشراف"، وللبدء بذلك تَبني كل ورقة بحثية قواميس ثنائية اللغة دون مساعدة بشرية لتحديد ما إذا كان التخمين صحيحًا أم لا، وتكمن إمكانية بناء قواميس كهذه في كون اللغات تتشابه إلى حد كبير في طريقة تلازم الكلمات؛ فمثلًا كلمتا "طاولة" و"كرسي" تُستخدمان معًا على نحو متكرر في كل اللغات، فإذا تمكن الحاسوب من تحديد الروابط في هذه الحالات المشتركة وصياغتها على شكل أطلس عملاق للطرقات يحوي كلمات تمثل المدن، فإن خرائط مختلف اللغات ستكون متشابهة ولكن فقط بأسماء مختلفة، ويتمكن الحاسوب بعدها من اكتشاف أفضل طريقة لتركيب أطالس اللغات على بعضها بعضًا ومن ثم صناعة قواميس ثنائية اللغة.وتَستعمل الورقتان البحثيتان الجديدتان -اللتان تستخدمان أسلوبين متشابهين- إستراتيجيتين تدريبيتين تسمَّيان "الترجمة العكسية" back translation و"تقليل الضجيج" denoising، وذلك للترجمة على مستوى الجمل.تعني الترجمة العكسية أن الجملة تُترجَم ترجمةً تقريبيًّة إلى اللغة الأخرى ثم تُعاد ترجمتها إلى اللغة الأصلية، وفي حال كانت الترجمة العكسية غير مطابقة للأصل تُضبط الشبكات العصبونية لتترجِم ترجمةً أقرب في المرات القادمة، وأما إستراتيجية تقليل الضجيج فهي تشبه الترجمة العكسية ولكن بدلًا من الترجمة إلى لغة أخرى ثم الترجمة إلى اللغة الأم فإنها تعمد إلى إجراء تعديلات على الجملة (وذلك بإعادة ترتيب بعض الكلمات أو حذفها) ومن ثم محاولة إعادة ترجمة الجملة إلى اللغة الأم، ويُعلِّم هذان الأسلوبان الشبكاتِ على بنيةِ اللغة العميقةِ (أي البنية اللغوية الأساسية التي تتشاركها اللغات).ولكن يوجد اختلاف طفيف بين التقنيتين، فنظام "الترجمة الآلية بالشبكات العصبونية دون إشراف" يترجِم عكسيًّا أكثر في خلال التدريب، في حين يضيف النظام الآخر "الترجمة الآلية دون إشراف باستخدام مجموعات نصوص أحادية اللغة" -الذي اخترعه (غيوم لابله) ويُستخدم في (فيسبوك)- خطوةً إضافية في خلال الترجمة، ويحوِّل النظامان كلاهما الجملةَ من لغة ما إلى شكل أكثر تجريدية قبل تحويلها إلى لغة أخرى، لكن النظام الخاص بـ(فيسبوك) يتحقق من كون اللغة الوسيطة مجردةً تمامًا، ويقول كل من (لامبله) و(آرتيجيه) إنه يمكنهما تحسين نتائجهما بتطبيق تقنيات الورقة البحثية الأخرى.عند النظر إلى النتائج الوحيدة القابلة للمقارنة مباشرة بين الورقتين (الترجمة بين نصوص إنكليزية وفرنسية مأخوذة من مجموعة واحدة تتألف من نحو 30 مليون جملة) حققت الترجمتان تقييمًا ثنائي اللغة يقدر بنحو 15 نقطة في اتجاهي الترجمة كليهما وذلك على مقياس دقة الترجمة، هذه النتائج ليست عالية بالمقارنة مع نتائج ترجمة (غوغل) الخاضعة للإشراف التي حققت 40 أو الترجمة البشرية التي يمكن أن تحقق أكثر من 50 نقطة، لكنها أفضل من الترجمة الحرفية كلمة بكلمة.

أكمل القراءة »

اتحاد الفيزياء مع التعلم العميق لإنتاج روبوت قاذف جديد

أعلن باحثون في شركة Google بالتعاون مع جامعتَي Princeton و Columbia ومعهد MIT  مؤخرًا عن روبوت أطلقوا عليه اسم TossingBot؛ أي البوت القاذف، وهو قادر على التقاط (حمل) الأجسام وقذفها ومن ثم التقاطها (مسكها) مرة أخرى.وما يميز هذا الروبوت هو قدرته على التعلم والتكيف؛ أي التعامل مع أجسام بأحجام وأوزان مختلفة قد تكون جديدة عليه ولم يسبق له أن تعاملَ معها.لكن؛ ما الذي يجعل رمي الأجسام أمرًا صعبًا؟يعتمد هذا الأمر على عدة عوامل؛ أولها "كيف سيُلتَقط الجسم"، وذلك وفقًا لخصائص الجسم الفيزيائية مثل الكتلة والاحتكاك ومقاومة الهواء، وهذا ما يدعى بالشروط السابقة (pre-throw conditions)، فعلى سبيل المثال؛ إذا التقطنا مفك براغي من وسطه (بالقرب من مركز عطالته) ورميناه، فسوف يسقط عند مسافة أقرب فيما لو التقطناه من نهايته المعدنية ورميناه؛ إذ يمكنه هذا من التأرجح في الهواء ومن ثم الوصول إلى مسافة أبعد.وإذا غضضنا النظر عن الطريقة التي سيُلتَقط المفك بها، فسنجد أنّ رمي المفك يختلف تمامًا عن رمي كرة صغيرة مثلًا، علمًا أنها ستسقط عند مسافة أقرب نظرًا لمقاومة الهواء، لذا؛ يُعدّ التفكير في آلية أو طريقة واحدة لهذه الأمور جميعها أمرًا معقدًا إن لم يكن مستحيلًا إن صح التعبير.Image: https://1.bp.blogspot.com/-IVER0S3RbqU/XJUqbQweH9I/AAAAAAAAD7Y/VEpb8AYyvCoXwV0mKoZKPNALflP23OpuwCEwYBhgL/s640/image2.gif صورة توضح اختلاف الرميّ باختلاف شكل الجسم وطريقة الالتقاطوعوضًا عن الطريقة التقليدية (اليدوية) التي تعتمد على معالجة كل حالة على حدة -مثل رمي الكرة بطريقة معينة، في حين يكون رمي المفك بطريقة أُخرى، وهكذا...- عمل الباحثون على إيجاد طريقة تعمل على تكامل (دمج) الفيزياء مع التعلم العميق (Unifying Physics and Deep Learning)؛ إذ كان القسم الأساسي في بناء هذا الروبوت بتعلُّمه -باستخدام التعلم العميق Deep Learning- التعامل مع حالات فيزيائية سهلة كالتعامل مع الأجسام المتناظرة التي تشبه الكرة والمكعب والأقلام والتي يمكن بسهولة التنبؤ بالارتفاع الذي يجب أن تكون عليه وقوة القذف وغيرها من العوامل اعتمادًا على الشبكات العصبونية. ...

أكمل القراءة »

روبوت يتعلم تمييز ما يلمس، ويشعر بمَلمَس ما يرى؛ فإلى أين نحن مُتّجهون؟!

يستطيع الإنسان التمييز بين الأغراض عن طريق لمسها ويتمكن من معرفة ملمس الغرض بالنظر إليه، ولكن؛ هل تمتلك الروبوتات القدرة على فعل ذلك؟ وهل هي قادرة على الربط بين حاستي الرؤية واللمس واستخدام ذلك في التمييز بين الأغراض المرئية أو الملموسة؟"إن حاسة اللمس تأتي قبل النظر وقبل الكلام. إنها اللغة الأولى والأخيرة، ثم إنها تخبرنا بالحقيقة دائمًا".المؤلفة الكندية مارغريت أتوود (Margaret Atwood) في كتابها القتلة العميان (Blind Assassins)يوجهنا الإحساس باللمس لنشعر بالعالم المادي، في حين تساعدنا أعيننا على فهم الصورة الكاملة لهذه الإشارات اللمسية.ومن أجل سد هذه الفجوة الحسية على نحو أفضل، توصل باحثون من مختبر علوم الحاسوب والذكاء الصنعي في معهد ماساتشوستس للتقنية (MIT) إلى أنه يمكن للذكاء الصنعي التنبُّئِي (predictive artificial intelligence) أن يتعلم الرؤية -أي تكوين تصوّر عن ماهية الغرض الملموس وشكله- عن طريق اللمس، ويتعلم الشعور عن طريق الرؤية.ولكن؛ لا يمكن للروبوتات التي بُرمِجت للرؤية فقط أو للشعور فقط استخدام هذه الإشارات بطريقة تبادلية.تمكن الفريق من إنشاء إشارات واقعية عن طريق المدخلات البصرية، والتنبؤ بأي جسم وما هو الجزء الذي يُلمَس مباشرة من تلك المدخلات اللمسية. ...

أكمل القراءة »

️ إنتاج منحوتات متحركة بالطباعة الثلاثية الأبعاد من مقاطع فيديو ثنائية البعد

هل سبق وأن علمت الطريقة الصحيحة لتحسين تأديتك أفعالًا كنشاط رياضي؟ توصل باحثو معهد ماساشوستس للتقنية MIT إلى طريقة سهلة لذلك؛ عن طريق نظام جديد يستخدم خوارزمية من شأنها تحويل مقطع فيديو ثنائي البعد إلى منحوتات متحركة ثلاثية الأبعاد (3D Motion Sculptures) تظهر كيفية تحرك جسم الإنسان في حيز المكان؛ مما يسهل متابعة تسلسل الحركات التي أديتها.ينسب توم برادي (وهو الظهير الربعي في كرة القدم الأمريكية في فريق باتريوت Patriots) نجاحه إلى قضاء ساعات طوال في دراسة حركات خصمه في فيديو مسجل للمباريات. إن هذا الاستيعاب للحركات هو أمر ضروري لجميع الكائنات الحية، سواء كان الأمر لاكتشاف أي زاوية هي الأنسب لرمي الكرة إليها، أو توقع حركة الحيوانات المفترسة أو الفرائس...

أكمل القراءة »

شبكة عصبونية صنعية تُولِّد الموسيقا

MuseNetMuseNet هي شبكة عصبونية عميقة قادرة على توليد مؤلفات موسيقية مدتها أربع دقائق تضم عشر آلات موسيقية مختلفة، وتستطيع الدمج بين أنماط مختلفة من الموسيقا من الشعبي لموتسارت أو حتى لفرقة البيتلز The Beatles.لم تبرمج شبكة MuseNet اعتمادًا على فهمنا البشري للموسيقا، وإنما اكتشفت أنماط التناغم والإيقاع والأسلوب عن طريق تعلمها التنبؤ بالرمز التالي في مئات الآلاف من ملفات *MIDI.تستخدم MuseNet تقنية تعليم بدون إشراف Unsupervised Learning عامة الغرض مثل GPT-2، وهو أنموذج محول واسع النطاق دُرب على التنبؤ بالرمز التالي في تسلسل، سواء أكان صوتًا أم نصًا.ستسمع في النمط الافتراضي عينات عشوائية غير دقيقة مولدة سابقًا. اختر مؤلِفًا أو نمطًا موسيقيًّا تفضله (يمكنك اختيار مقطوعة موسيقية شهيرة) لتنتقل بعدها إلى عملية التوليد. ستكتشف أنماطًا موسيقية عديدة ابتكرها الأنموذج لك. ...

أكمل القراءة »

توليد الكلام من إشارات الدماغ

لمساعدة الأشخاص فاقدي القدرة على الكلام؛ طوّر باحثون من جامعة كاليفورنيا في سان فرانسيسكو طريقة تعلم عميق يمكنها فك شيفرة إشارات الدماغ وتحويلها إلى كلام منطوق.ويقول الباحثون: "إن الظروف العصبية التي تؤدي إلى فقدان التواصل مُدمِّرة، ستكون التقنية التي تترجم النشاط العصبي إلى كلام نقطة تحوُّل لمن لا يستطيعون التواصل نتيجة ضعف الأعصاب".الأساليب الحالية لإعادة توليد الكلام مرهقة للغاية وغير فعَّالة. يسمح النهج الشائع لبعض المرضى بكتابة أفكارهم عن طريق رسالة، ومع ذلك؛ فإنه يمكن فقط إعادة إنتاج نحو 10 كلمات في الدقيقة. للمقارنة، يمكن للمتكلِّم العادي قراءة نحو 150 كلمة في الدقيقة.التقط الفريق إشارات كهربائية قشرية عالية الكثافة من خمسة مشاركين خضعوا لمراقبة داخل الجمجمة لمرض الصرع.درب الفريق بعد ذلك شبكة عصبونية متكررة (Recurrent Neural Network RNN) باستخدام أطر عمل Keras وTensor Flow المعجلة باستخدام *cuDNN، ووحدات معالجة الرسوميات الخاصة بشركة نفيديا NVIDIA Tesla GPUs على صوت المشاركين الذين يتحدثون عدَّة مئات من الجمل بصوت عالٍ، إلى جانب الإشارات القشرية.ترتبط الخوارزمية بالأنماط التي التُقطت بالحركة الدقيقة لشفاه المريض واللسان والحنجرة والفك، وتُدرّب باستخدام محسن ADAM. ...

أكمل القراءة »

نظام ذكاء صنعي في غوغل ينجح في إثبات ما يفوق 1200 نظرية رياضية

Image: The Chudnovsky formula for Pi (Credit: Craig Wood)بداية الذكاء الصنعي الصاخبةبدأ المجال الحديث للذكاء الصنعي -Artificial intelligence عام 1950 بالورقة المميزة لـ آلان تورنغ - Alan Turing "حوسبة الآلات والذكاء- Computing machinery and intelligence"، التي حددت مبادئ الذكاء الصنعي واقترحت اختبارًا يعرف الآن باسم اختبار Turing*؛ لتحديد إن تحقق الذكاء الصنعي أم لا.على الرغم من أن الباحثين الأوائل كانوا واثقين من أن أنظمة الذكاء الصنعي ستغدو واقعًا قريبًا؛ فإن المبالغة في الوعود والتوقعات سببت ما أطلق عليه "شتاء الذكاء الصنعي" في سبعينيات القرن الماضي، وهي ظاهرة تكررت بصورة مؤسفة مرة أخرى في أواخر الثمانينيات وأوائل التسعينيات، عندما أضحت موجة ثانية من نظم الذكاء الصنعي مخيبة للأمل أيضًا.حدثت نقلة نوعية في أواخر التسعينيات وأوائل العقد الأول من القرن العشرين بتطوير تعلم الآلة Machine Learning، والأساليب المعتمدة على نظرية بايز Bayes، التي سرعان ما حلت مكان الأساليب القديمة القائمة على التفكير المنطقي في أغلب الأحيان. عند اقترانها مع التقنيات الحاسوبية المتقدمة على نحو مطرد (الناتجة عن قانون مور Moore's Low) بدأت أنظمة الذكاء الصنعي العملية والفعالة في الظهور أخيرًا.تقدمٌ ذاع صيته تَمثل بهزيمة متسابقين من قبل نظام محوسب أطلق عليه اسم "واتسون" الذي طورته شركة IBM، في بطولة المسابقة الأمريكية "Jeopardy". ...

أكمل القراءة »

الترجمة الفورية من غوغل لكلامك وبصوتك إلى أيَّة لغة!

إن أنظمة ترجمة الكلام إلى كلام (speech-to-speech) آخذة في التطوّر منذ عقود بغية مُساعدة الناطقين بلُغات مُختلفة التواصل فيما بينهم، لكنّ عملية الترجمة هذه تمرُّ عادة في ثلاث مراحل أساسية منفصلة: - التعرف التلقائي إلى الكلام (automatic speech recognition)؛ لتحويل الكلام إلى نص وسيط مكتوب.- الترجمة الآلية (machine translation)؛ لترجمة النص الوسيط المكتوب إلى اللغة المقصودة.- تركيب الكلام (text-to-speech synthesis)؛ لتوليد الكلام في اللغة المقصودة استنادًا إلى النص المُترجَم.في الواقع، يُعَدُّ التقسيم ناجحًا بالفعل واعتمدت عليه أنظمة ترجمة الكلام إلى كلام ومن بينها مُترجِم غوغل؛ لكن الحاجة المُلحة إلى تقليل الكلفة ورفع الأداء تدفع بمراكز الأبحاث إلى التطوير المُستمر وابتكار تحسينات فريدة من نوعها لتحقيق الغاية المنشودة.يقترحون -في الورقة البحثية هنا المنشورة حديثًا- نظامًا تجريبيًّا جديدًا أطلقوا عليه: Translatotron، يستندُ إلى أنموذج تسلسلي (sequence-to-sequence) وحيد من شأنه الترجمة المُباشِرة إلى الكلام دون التعويل على تحويله إلى نص وسيط والمرور بالمراحل المذكورة آنفًا.ومن الميزات المُهمة للأنموذج المُقترَح: سرعة الاستدلال الأكبر نسبيًّا، وتجنُّب الأخطاء المُترتبة على مرحلتَي التعرف والترجمة؛ مما يُسهِّل الحفاظ على سمات صوت المُتكلّم الأصلي في الترجمة، ويجعل التعامل أفضل مع الكلمات التي لا تحتاج إلى ترجمة، مثل الأسماء.كيف بدأت رحلة Translatotron؟كانت بداية ظهور النماذج المُباشرة (end-to-end) في سياق ترجمة الكلام في عام 2016 ميلادية، حين أثبت الباحثون نجاعة استخدام أنموذج (sequence-to-sequence) وحيد لترجمة الكلام إلى نص (speech-to-text) ترجمة فورية بالاستعانة بمدوّنة (corpus) صغيرة للترجمة بين اللغتين الإنجليزية والفرنسية. ...

أكمل القراءة »