الرئيسية / تطبيقات برمجية

تطبيقات برمجية

Infer.NET مكتبة مايكروسوفت لتعلم الآلة مفتوحة المصدر!

ما المقصود بـ Infer.NET؟إطار عمل لإدارة الاستدلال البايزي Bayesian inference (نسبة إلى عالم الرياضيات Bayes صاحب النظرية الشهيرة في الاحتمالات المرتبطة؛ أي احتمال حدوث حدث علمًا بأن حدثًا آخر قد وقع) في النماذج البيانية، ويمكن استخدامه أيضًا في البرمجة الاحتمالية. يستخدام Infer.NET لحل أنواع مختلفة من مشكلات تعلم الآلة؛ بدءًا من المشكلات القياسية العامة مثل التصنيف Classification أو التوصية Recommendation أو التجميع (العنقدة) Clustering، إلى حلول مخصصة للمشكلات المتعلقة بمجال معين، وقد استخدم Infer.NET في مجموعة واسعة من المجالات؛ بما في ذلك استرجاع المعلومات، والمعلوماتية الحيوية، وعلم الأوبئة، والرؤية، وغيرها الكثير.يُنشر Infer.NET الآن مصدرًا مفتوحًا على GitHub بموجب ترخيص من معهد ماساتشوستس للتكنولوجيا ويتوفر أيضًا على هيئة حزم NuGet.إن جعل Infer.NET مفتوح المصدر يمثل تتويجًا لرحلة طويلة وطموحة؛ إذ شرع فريق Microsoft Research في كامبريدج في المملكة المتحدة تطوير منصة العمل هذه في عام 2004، وقد تعلّموا الكثير في سبيل إنشاء حلول تعلم الآلة قابلة للتوسع والفهم. ...

أكمل القراءة »

نمط مِشيتك.. بصمتك المستقبلية

قد تظن أنَّ تعرُّفَ الأشخاص عن طريق تحليل طريقة مِشيتهم بواسطةِ نظام حاسوبيٍ ذكي ما هو إلّا مجرد واحدٍ من العديد من الخيالات العلمية التي تُستخدَم في أفلام هوليوود فحسب.ولكن في الحقيقة؛ أصبحَ الخيال واقعًا بعد أن حصلت شركة صينية تدعى ويتريكس Watrix مؤخّرًا على تمويل بقيمة 14.5 دولار لتسريع نمو تقنية التعرف إلى الأشخاص بتحليلِ طريقة مِشيتهم، التي تُطوّرت لتستخدَمها الحكومة الصينية.أنشأت شركة Watrix برنامجًا يعتمد الذكاء الصنعي؛ قادرًا على تحديد الأشخاص فقط عن طريق تحليل طريقة مشيهم.وردًّا على تساؤلاتك الآن: لا، لا يمكنك خداع هذا البرنامج بتقليد مِشيةِ شخص ما. يقول هوانغ يونغ تشن Haung Yongzhen؛ رئيس شركة Watrix التنفيذي: "لا نحتاج إلى تعاون الناس معنا من أجل أن نكون قادرين على تحديد هويتهم؛ فلا يمكن خداع نظامنا ببساطة عن طريق العرج أو المشي مع تباعد الأقدام أو حتى الانحناء؛ لأنَّنا نحلل جميع مميزات الجسم، ويصل معدل دقة التقنية حسب هوانغ Haung إلى 94%...

أكمل القراءة »

الرؤية في الظلام

يوجد الضجيج في أي نظام تصوير، وهو اختلاف عشوائي  في معلومات السطوع أو اللون في الصور؛ الأمر الذي يجعل من التصوير أمرًا صعبًا، وخاصة في الإضاءة المنخفضة؛ إذ يُعدُّ التصوير في مثل هذه الحالة تحديًّا كبيرًا؛ ذلك بسبب انخفاض عدد الجزيئات الضوئية (الفوتونات) التي تمثل الصورة أو المشهد، وبسبب محدودية معالجة الضجيج العالي الناتج عن الإضاءة المنخفضة أيضًا.وتُستخدم تقنيات متعددة لحل مشكلة الضجيج، وترفع تقنية (ISO) -على سبيل المثال- السطوع في الصورة، وبذلك تؤدي إلى حدوث ضبابية، وتستخدم أيضًا تقنية التكبير أو المدرج التكراري (histogram stretching)، ولكن؛ لا تحل هذه الحلول المشكلة الأساس وهي انخفاض عدد الجزيئات الضوئية المكوِّنة للصورة بسبب الإضاءة المنخفضة؛ ما أدى إلى بدء العمل على إيجاد حلول لهذه المشكلة، وقد كان أفضلها استخدام تقنية (open aperture)، وهي عبارة عن مرشح  (filter) يتحكم بكمية الضوء الداخل إلى العدسة أو باستخدام الطريقة الأكثر شيوعًا وهي استخدام الفلاش، ولكل من هذه الحلول عيوبه، فمثلاً: يمكن أن ينتج عن زيادة فترة التعرض إلى الضوء باستخدام الفلاش حدوثَ تغبيش في الصورة، وخصوصًا في حالة اهتزاز الكاميرا أو العنصر الموجود في الصورة.وانطلاقًا من هذه المشكلات التي مررنا بها؛ وجد الباحثون طريقة لحل مشكلة الضوء المنخفض؛ وطوروا نظامًا لمعالجة هذه الصورة غير الواضحة بعد أن وجدوا مجموعة من الصور ذات الإضاءة المنخفضة ومقابلاتها من الصور عالية الدقة والتي التُقطت في ظروف إضاءة جيدة، ودُرِّبت شبكة عصبونية مرتبطة بحساسٍ يقرأ البيانات مباشرة، وتوجد الصورة المقابلة لها بعد عدة مراحل؛ منها تحسين الصورة الملتقطة من الحساس ومراعاة تحويلات الألوان والحد من الضجيج في الصورة، وتحدث هذه المراحل على التوازي باستخدام مبدأ pipeline، والذي يعني تنفيذ أكثر من إجرائية أو تعليمة متداخلة في آن معًا.الموضوع شيّق جداً عزيزي القارئ؛ لذلك أعرني انتباهك  قليلًا، وهيا نستكشف المراحل التي تمر بها أيّة آلية معالجة الصورة المعتمة وغير الواضحة.مرحلة التخلص من الضجيج:طُرحت العديد من التقنيات والأساليب في هذا المجال؛ منها التباين الكلي (total variation) ومعالجة مجال المويجات (wavelet-domain processing) والترميز المتقطع والمرشح ثلاثي الأبعاد (BM3D)، وتستند هذه التقنيات في عملها غالبًا إلى  صور فيها خصائص معينة؛ منها النعومة والتراخي والتشابه الذاتي (self-similarity)،وقد وجد الباحثون طرائق أخرى لمعالجة هذه المشكلة؛ منها استخدام الشبكات العصبونية المدربة مع مكدس التشفير العشوائي للتشويش (SSDA) وتقنية رد الفعل اللاخطي (INRQ)، ولكن للأسف؛ قُيّمت هذه التقنيات كلّها بعد تجريبها على بيانات غير حقيقية؛ أي ليست خام؛ بل عُدِّلت وأضيفت الضبابية والضجيج، ولكن بالنهاية، وبعد البحث والتجريب؛ اقتُرحت  طريقة المرشح الثلاثي الأبعاد بوصفها أفضل طريقة في معالجة الضجيج في الصور المأخوذة على نحوٍ خام وطبيعي.مرحلة تحسين الصورةتُطبق مجموعة متنوعة من التقنيات لتحسين تباين الصورة؛ ومنها (Histogram eqiztion) والتي توازن الخطوط البيانية المكونة للشكل الموجود في الصورة أو تصحيح غاما (Gma Correction) الذي يزيد من سطوع المناطق المظلمة عن طريق ضغط البكسلات الساطعة، وهناك العديد والعديد من هذه الطرائق، وكانت الأكثر تقدمًا هي القناة العكسية (inverse dark chanel) أو تحويل ويفلت (wavelet transform) أو أنموذج ريتنكس (Retinex) وكل خوارزمية تنفرد باستخدام واحدة من هذه التقنيات.مرحلة جمع البيانات أو أزواج الصورتؤدي هذه المجموعات دورًا أساسًا في معالجة الصور؛ إذ تُربط مع الشبكة العصبونية التي يتكون منها النظام، والتي بدورها تتخذ القرار وتختار الصورة المشابهة للصورة المعتمة ليعالج، وتطبق المراحل السابقة على أساس الصورة الأكثر دقة، وذلك بعد تدريبها من قبل المطورين، ومن هذه المجموعات نذكر على سبيل المثال (Renoir)؛ ولكن مشكلتها أن أزواج الصورة فيها تعاني اختلاطًا مكانيًّا (MisAlignment)، وتوجد مجموعة تدعى (DND) أيضًا، ولكن مشكلتها أن معظم الصور تُلتقط  في وضح النهار، وليست مناسبة للمقارنة .وأما الأفضل؛ فهي مجموعة (SID) التي تحوي على ما يقارب 5094 صورة مأخوذة في الداخل وفي الخارج وفي الليل وتحت ضوء القمر أو إضاءة الشوارع .Image: arxiv.org"عينة من صورمجموعة (SID) المستخدمة في المطابقة"التُقطت هذه العينات بنوعين من الكاميرات (sony) و (fuji) من الأعلى والأسفل ومن اليمين والشمال، وخصائص كل كاميرا موضحة بالجدول أدناه :خوارزمية المعالجةبدايةً؛ مرّت الطرائق التقليدية السابقة بالتسلسل على المراحل التي ذكرناها آنفًا؛ كالتخلص من الضجيج وتحسين الصورة والتخلص من الضبابية والأسلوب المتبع نفسه مع اختلاف التقنيات المستخدمة بين كل خوارزمية وأخرى، ونجد أدناه بعض المراحل التي كانت تكون عملية المعالجة:Image: arxiv.orgفي حين تمر الطريقة التي تتكون من الشبكة العصبونية المدربة بالمراحل الآتية:يلتقط الحساس الموجود في العدسة الأشعة الضوئية المكونة من الفوتونات ويصنفها عن طريق ثلاثة أنواع من الفلاتر (أحمر - أخضر - أزرق)، والتي تمثل الألوان الأساس المكونة لأي لون في الطبيعة وتخزن في مصفوفة ثنائية البعد؛ كل عنصر فيها يحوي لونًا واحدًا فقط .يصنف بعدها كل لون على حدة باستخدام  خوارزمية (Byeer Filter)؛ إذ توزع الألوان على أربعة أقنية؛ واحدة للون الأحمر وواحدة للون الأزرق وقناتين للون الأخضر؛ ذلك لأن العين تتحسس بشدة للون الأخضر عن باقي الألوان، وتخزن هذه القيم اللونية على هيئة مصفوفات ثنائية البعد، وتضرب كل مصفوفة بمعامل التضخيم الذي يمثل اللمعان المطلوب في الصورة.وتدخَل هذه النتائج إلى المرحلة المركزية، وهي الشبكة العصبونية ليُتّخذ القرار، وتُختار الصور الأقرب للصورة الملتقطة الخام والمعتمة، بعد أن تطبق المراحل التي تحدثنا عنها من تحسين للصورة والتخلص من الضجيج وتطبيق بالتحويلات اللونية استنادًا إلى الصورة المنتقاة والواضحة، وهكذا نكون قد حصلنا على صورة واضحة جلية على الرغم من التقاطها في ظروف إضاءة ضعيفة.Image: arxiv.orgأظهرت الدراسة السابقة أن معالجة الصور المعتمة والمأخوذة في ظروف إضاءة غير جيدة هي أحد أكثر موضوعات البحث تحديًّا ونشاطًا في علوم الحاسوب؛ إذ لم يقتصر لأمر على التقاط صورة  واضحة في وضح النهار وبظروف إضاءة مناسبة؛ بل تطور للتعرف إلى الصورة ومحتواها وإن التُقطت في الظلام، وترتَّب على ذلك مواجهة العديد من المشكلات والتحديات ومن تلك التحديات الضجيج والضبابية وتصنيف المعطيات والتحليل المرئي.وبعد الدراسة والتجارب؛ وجدت مجموعات من أزواج الصورة الواضحة والمعتمة واتُّبعت خوارزمية لتتبع الضجيج ومعالجته وتصحيحه، وبذلك أصبحنا قادرين على التقاط الصور مهما كانت الظروف المحيطة بنا؛ سواء أكانت إنارة جيدة أم ظلام حالك.الشيفرة البرمجية: هنا المصادر:هناهناهناهناهناهنا * إعداد: : Emad Aldeen Moslet* تدقيق علمي: : Mujeeba Haj Najeeb* تدقيق لغوي وتعديل الصورة ونشر: : Dima Yazji

أكمل القراءة »

نظام تعلم آلة لتعرّف الصوت والشكل معًا.

طور علماء الحواسيب في معهد MIT نظامًا بإمكانه فرز الأغراض الموجودة داخل صورة، وذلك بالاعتماد على توصيف منطوق لهذه الصورة؛ بإعطاء هذا الأنموذج صورة وتسجيلًا صوتيًّا سيحدد هو بدوره  المناطق الموجودة في الصورة، والتي وُصِّفت في المقطع الصوتي.على العكس من تقنيات التعرف الصوتي الحالية، فإن هذا الأنموذج لا يحتاج إلى إدخال يدوي للنصوص والتعليقات التوضيحية الخاصة بالأمثلة التي قد تدرب عليها، وعوضًا عن ذلك؛ سيتعلم الكلمات مباشرة عن طريق المقطع الصوتي المسجَّل والأغراض من الصور الأولية، وسيربط فيما بعد لغرض مع الوصف الصوتي الخاص به.يمكن للأنموذج في الوقت الحالي أن يتعرّف  عددًا محدودًا من الكلمات والأغراض من مختلف الأنواع، وقد يصل عددهم إلى بضعة مئات، ولكن؛ يأمل الباحثون أن تتمكن تقنية تعرف الكلام -في يوم من الأيام- من توفير عدد كبير من ساعات العمل اليدوي، وأن تفتح أبوابًا جديدةً في مجال تعرّف الصوت والصورة.وعلى سبيل المثال؛ تتطلب نظم تعرّف الصوت مثل سيري Siri وجوجل فويس Google voice تفريغَ آلاف الساعات من التسجيلات الصوتية، ثم باستخدام البيانات الناتجة عن عملية التفريغ؛ ستتعلم الأنظمة وضع خرائط تربط إشارات الكلام بكلمات محددة، ولكن تكمن المشكلة عند إدخال مصطلحات جديدة إلى القاموس؛ هذا سيجعل من إعادة تدريب الأنظمة أمرًا واجبًا.ويقول ديفيد هارواث؛ الباحث في مختبر علوم الحاسوب والذكاء الصنعي CSAIL ومجموعة الأنظمة المحكية: "أردنا أن نحقق تعرّف الكلام بطريقة تكون أقرب إلى الطبيعية، وذلك للاستفادة من الإشارات والمعلومات الإضافية التي ستكون ذات منفعة للبشر، والتي لا يمكن لخوارزميات التعلم الآلي عادةً الوصول إليها، وقد كان لدينا فكرة تدريب أنموذج بأسلوب مشابه لسير الطفل عبر العالم ورواية ما يراه"، وقد شارك هارواث في تأليف ورقة بحثية تصف الأنموذج الذي قُدِّم حديثًا في المؤتمر الأوروبي الذي تناول موضوع الرؤية الحاسوبية.وأثبت الباحثون في هذه الورقة أنموذجهم عن طريق تجربته على صورة فتاة صغيرة ذات شعر أشقر وعينين زرقاوتين، وترتدي هذه الفتاة فستانًا أزرق، وكانت تحوي خلفية الصورة منارةً بيضاء لها سقف أحمر؛ تعلَّم الأنموذج ربط أيّ البيكسلات في الصورة تتطابق مع الكلمات "فتاة" و"شعر أشقر" و"عينان زرقاوتان" و"فستان أزرق" و"منارة بيضاء"، وأخيرًا "سقف أحمر"، واستطاع الأنموذج وضع إشارة على كل من هذه التفصيلات في الصورة في أثناء وصفها.إنّ أحد التطبيقات الواعدة هو تعلم الترجمة بين اللغات المختلفة دون الحاجة إلى حواشي ثنائية اللغة، ومن بين ما يقدر بـ 7000 لغة منطوقة عالميًّا؛ هناك فقط ما يقارب 100 لغة لديهم ما يكفي من نسخ البيانات لتعرف الكلام، ولنفكر في موقف توصف فيه صورة واحدة من قبل شخصين يتحدثان بلغتين مختلفتين؛ فإنْ كان الأنموذج يتعلم إشارات الكلام من اللغة المنطوقة من قبل الشخص الأول والتي تطابق الأغراض في الصورة، ويتعلم إشارات الكلام من اللغة المنطوقة من قبل الشخص الثاني والتي تطابق هذه الأغراض نفسها، فبإمكان الأنموذج حينها عدُّ هاتين الإشارتين تُترجِمان بعضهما.ويقول هارواث: "هناك إمكانية لوجود آلات ميكانيكية من نوع سمكة بابل"؛ مشيرًا إلى سماعة الأذن الحية الخيالية في روايات "دليل المرشد إلى المجرة"، والتي تترجِم مختلف اللغات لمرتديها.الارتباطات السمعية البصرية:يتوسع هذا العمل عن الأنموذج السابق المصمَّم من قبل هارواث وغلاسس وتورالبا، والذي يربط الكلام مع مجموعات من الصور التي ترتبط ببعضها بموضوعات متشابهة، ووضعوا في أثناء البحث السابق صورًا تحوي مشاهد مأخوذة من قاعدة بيانات تصنيفية مخزنة في منصة التعهد التركي الآلية، وبعد ذلك؛ جلبوا أشخاصًا ليصفوا الصّور كما لو أنهم يصفونها إلى طفل مدّة عشر ثوان، وجمع المصممون أكثر من 200 ألف زوج من الصور والمقاطع الصوتية لمئات الموضوعات المختلفة؛ مثل الشواطئ ومراكز التسوق الكبيرة وشوارع المدينة وغرف النوم.ومن ثم صمموا أنموذجًا يتكون من شبكتين عصبونيتين منفصلتين convolutional neural networks (CNNs)؛ واحدة من هذه الشبكات لمعالجة الصور، والأخرى للعمليات على الطيف الضوئي والتمثيل البصري للإشارات الصوتية؛ ذلك لكونها تتغير بمرور الوقت، وتحسب الطبقة العليا من الأنموذج المخرجات الخاصةَ بالشبكتين، وتربط أنماط الكلام مع بيانات الصورة.فعلى سبيل المثال؛ سيعطي الباحثون الأنموذجَ مقطعًا توضيحيًّت أوليًّا مع الصورة الأولى، وبعد ذلك؛ سيعطونه مقطعًا عشوائيًّا ثان مع الصورة الأولى، والذي يُعدُّ تصرفًا خاطئًا؛ إذ  لا يتعلق المقطع الصوتي بالصورة، وبعد مقارنة آلاف المقاطع التوضيحية الخاطئة مع الصورة الأولى؛ استطاع الأنموذج تعلم إشارات الكلام المتعلقة بالصورة الأولى، وربط هذه الإشارات بالكلمات المذكورة في المقطع التوضيحي.

أكمل القراءة »

وجوهٌ بشرية والذكاءُ الصنعيُّ هو المُبتكِر!

نعم نعم؛  فأنتم ترون في الصورة وجوهًا لشخصياتٍ مُوَلَّدةً صنعيًّا ولا وجودَ لها البتة على أرض الواقع!كيفَ ذلك؟تعرّفوا الآن …قد تكون قدرةُ الذكاءِ الصنعيِّ على توليد صورٍ مزيفةٍ ومُشابهة لوجوهٍ أخرى دُرِّب عليها مُسبقًا أمرًا مألوفًا نوعًا ما؛ لكن ماذا عن توليدِ وجوهٍ مُزيفةٍ وواقعيةِ المظهر وخادعةِ الإحساس على نحوٍ منقطعِ النظير؟نعم؛ فقد صمّم باحثون من إنفيديا NVIDIA بنيةً جديدةً لخوارزمية GAN؛ الخوارزمية التوليدية التنافسية، والتي من شأنها توليد وجوه واقعية متعدّدة السمات بدون أيّ تدخل بشري.التوليد المُعتمِد على السمات:تتعلّم الخوارزمية سمات الوجوه المُختلفة على نحوٍ منفصل، وذلك بدون تدخل بشري، ومن ثَمّ -بعد التدريب-  يمكن دمج هذه السمات المختلفة بعضها مع بعض، وتوليد وجوه بالطريقة التي ترغب بها.يَعُدُّ المولّدُ الصورَ على أنها مجموعةٌ من السمات؛  تُحدِث كُلّ سمة تأثيراتٍ ضمن نطاقٍ مُعيّن؛ فعلى سبيل المثال: هنالك سمات واسعة النطاق مثل الوضعية والشعر و شكل الوجه، وسمات مُعتدلة مثل العيون وتفاصيل الوجه، وسمات بسيطة ضيقة النطاق مثل لون البشرة.أضف إلى ذلك، إمكانية التلاعُب في شكل السمات واسعة النطاق؛ فمثلاً يُمكنك التلاعُب بخصلات الشعر؛ إضفاء نعومة المظهر عليها أو تحريكها أو تحديد نسبة المؤثر الذي تطبقه حتى؛ كيف تكون الصورة واقعيةً أكثر ما يُمكن.مَهلاً...!ليست الوجوهُ بطلةَ المسرحِ بمُفردها؛ بل طالَت بِدَعُ هذا المولِّد مجموعات تدريبٍ أُخرى، مثل: السيارات والأسِرّة والهررة.Image: https://arxiv.org/pdf/1812.04948.pdfلا تفوّت مُتعةَ مُشاهدةِ الوجوه الموَلَّدة بواسطة هذه البنية، هنا:https://www.youtube.com/embed/kSLJriaOumA?feature=player_embedded&theme=lightلتفصيلات أكثر؛ زوروا الرابط الآتي: هنا   المصادر:   هنا هنا * ترجمة: : Nour Abdou* تدقيق علمي: : Bassel Zeno* تدقيق لغوي وتصميم الصورة ونشر: : Dima Yazji

أكمل القراءة »

الذكاء الصنعي.. فنان تعبيري

يعود الأمر بمجمله إلى خوارزميةٍ دُربت على 15000 لوحة بورتريه؛ ففهمت قواعد رسم البرورتريه ونفَّذتها ورسمت لوحةَ بورتريه بالحبر. أما التوقيع فكان معادلةً رياضية!توقيع الخوارزمية على لوحة البورتريه التي رسمتهاImage: https://cdn-images-1.medium.com/max/1600/1*A7Z-6X0cJ4BH8BgS2U7pzg.pngما هو الذكاء الصنعي التعبيري Expressive AI؟ يعرَّفُ الذكاء الصنعي التعبيري بأنه: مجالٌ فرعيٌ من الذكاء الصنعي. يستعين هذا المجال بالممارسات البحثية لكلٍّ من الفن والذكاء الصنعي، ويوصف بأنه ممارسةٌ هجينةٌ بين الفن والعلم.ما هي الخوارزمية التي مكَّنتنا من هذا الإنجاز؟تُسمى هذه الخوارزمية: الشبكة التنافسية الإبداعية (Creative Adversarial Network) أو اختصارًا CAN، وتعمل على توليد الفن عن طريق التعلم من مجموعةٍ من الأنماط، وتصبح مبدعةً بابتعادها عن الأساليب المتعلَّمة.وقد بُنيت اعتمادًا على الشبكة التنافسية التوليديَّة (Generative Adversarial Network) أو اختصارًا GAN، والتي أثبتت قدرتها على تعُّلم توليد صورٍ جديدة تحاكي توزيعًا معينًا.الشبكة GAN في أصلها هي شبكةٌ عصبونيةٌ صنعية لها أثر كبير في مجال الذكاء الصنعي، وتتكون هذه الشبكة من شبكتين عصبونيتين؛ إحداهما توليدية Generative، والثانية تمييزية Discriminative، وتعملان معًا لتحقيق محاكاةٍ عالية المستوى للمهام المتصوَّرة.تبني الشبكة التوليدية Generative مخرجاتها من المدخلات (الصور في مثالنا)، وترسلهم إلى الشبكة التمييزية Discriminative التي تميز بدورها -كما توحي تسميتها- بين النتائج الأصلية والصناعية المقدَّمة من الشبكة التوليدية...

أكمل القراءة »

الآلة تجد طريقها إلى العيادة النفسية..

في السنوات الأخيرة، كان لتعلّم الآلة دورٌ مفيد في تشخيصِ الأمراض، وعلى سبيل المثال؛ طُوِّرت نماذج لتعلُّم الآلة قادرةٌ على تحديدِ كلمات أو مقاطع (أي أنماط Patterns) من الكلام تدلُّ على الاكتئاب، وتحدِّد ما إذا كان الشخص مُكتئبًا أو لا؛ استنادًا إلى إجاباتِه عن أسئلة معينة. ...

أكمل القراءة »

أخلاقيات الآلة.. السيارة القاتلة!

صمَّمَ باحثون في مختبرِ MIT Media Lab تجربةً تسمى "آلة الأخلاق MORAL MACHINE" في عام 2014، وكانت غايةُ التجربة إنشاءَ منصّة شبيهة باللعبة من شأنِها أن تجمع القراراتِ التي يمكن أن يتَّخذها الناس عن كيفيةِ إعطاء السيارات ذاتية القيادة الأولويةَ في الحياة لِمن يعترض طريقّهم في أثناءِ العمل، وقد درست التجربة احتمالاتٍ مختلفة ووجهاتِ نظر متعددة لمعضلة (ترولي) الفلسفية أو ما يمكن  تسميتها (مسألةَ العربة)، وكان من المتوقَّع أن توفِّر بيانات تلك العملية رؤيةً ثاقبةً عن الأولويات الأخلاقية الجماعية من منظورِ ثقافات مختلفة.لم يتنبَّأ الباحثون آنذاك بالاستقبال الجماهيري الكبير لتجربتِهم، فبعد مرور أربع سنوات على إطلاقِ المنصّة؛ سجّل ملايين الأشخاص من (233 بلد وإقليم) 40 مليون قرار؛ ممَّا جعلها واحدةً من أكبرِ الدراسات التي أُجريت على الأولويات الأخلاقية العالمية.وتُقدِّم ورقة جديدة نُشرت في مجلةِ Nature تحليلًا لبياناتِ تلك التجربة، وتكشف مدى اختلاف الأخلاقيات بين الثقافات على أساسِ الثقافة والاقتصاد والموقع الجغرافي.تفترض مسألة العربة الكلاسيكية أنَّك تشاهد عربةً متحرّكةً تتابع طريقَها في إحدى السكك، ولكنَّها على وشكِ أن تضرب خمسةَ أشخاص وتقتلهم، ولا يوجد بين يديك الآن سوى رافعة لتغييرِ المسارات؛ إذا رفعتها سيتغيَّر سير العربة نحو سكَّة أخرى وتنقذ الأشخاصَ الخمسة، ولكنك ستقتل شخصًا آخر يمشي على تلك السكّة.. فماذا تختار؟! اعتمدت تجربة آلة الأخلاق في طيّاتِها على مسألةِ العربة تلك لاختبارِ تسع مقارنات مختلفة يمكن عن طريقِها تبيان استقطاب الناس، ونصَّت تلك المقارنات على ما يأتي: هل يجب على السيارة ذاتية القيادة أن تعطي أولويةَ الحياة للبشر أكثر من الحيوانات الأليفة.. ...

أكمل القراءة »

تلفازك سيفهمك أكثر.. والفضل للذكاء الصنعي!

صُمِّمت منصّة الترفيه Xfinity X1 لمشاهدةِ الأفلام والمسلسلات من قِبل شركة Comcast.ما يميِّزها هو أنَّ التحكُّم فيها يكون عن طريقِ الصوت بدلًا من جهازِ التحكُّم التقليدي Remote contro.وقد نُشرت ورقةٌ بحثية تتمحور حول استخدام تقنيّات الذكاء الصنعي الجديدة لتحسينِ إمكانيات فهم نظام Xfinity X1 لعمليات البحث (الاستعلام) عن طريقِ الصوت.كيف يعمل نظام Xfinity X1 ؟يقول جيمي لين؛ وهو بروفيسور في جامعةِ وتورلو: " تأتي المنصّة مع تحكُّم صوتي؛ والذي يقبل طلباتِ البحث الصوتية كافةً من المستخدم، قُل لتلفازِك أن يغيِّر القناة.. اطلب أفلامًا للأطفال.. أو حتّى اسألْه عن نشرة الطقس..".إذن؛ سيناريو العمل هو الآتي: سيقول المستخدِم ما يريده، ومن ثمَّ يجب على النظام فهمُ مقصده ومعالجته، وفي النهاية يجب على النظام الاستجابةُ استجابةً مناسبة لتلبيةِ الطلب.وتُظهِر سجلّات استخدام الاستعلامات الصوتية أنَّ خدمة الاستعلام والبحث الصوتي تتلقَّى استهلاكًا كبيرًا، وهي أيضًا بديلٌ محبَّب للمستخدِم مقارنةً بالكتابة على لوحةِ المفاتيح.وتتعدَّد أنواع الاستعلامات الصوتية التي يلجأ إليها المستخدِم؛ من الانتقال بين الأفلام والمسلسلات إلى طلبات لا علاقة لها بمشاهدةِ البرامج، وتُعدُّ مثل هذه الطلبات غامضةً بالنسبة إلى النظام أو غير واضحة (تخفيض شدَّة الصوت مثلًا).وأنشأ الباحثون معماريةً جديدةً لشبكة عصبونية لتحسينِ الاستعلام الصوتي على المنصّة؛ وقد ارتكز حلُّهم على فكرتين أساسيّتين:- الأولى: عمدوا إلى استغلالِ سياق الجلسة الواحدة، وتخلَّصوا من الأخطاء الناتجة عن التعرُّف الأوتوماتيكي إلى الصوت (ASR (Automated speech recognition عن طريقِ الشبكات العصبونية المتكرِّرة الهرمية.*نقصد بسياقِ الجلسة تسلسلَ استعلامات المستخدِم عن الموضوع نفسه لتوضيحِ طلبات البحث والاستعلام المستقبلية.- الثانية: يتطلَّب فهم الاستعلام وجودَ تكاملٍ بين طلبات الاستعلام المختلفة، وقد استطاع الباحثون تحقيقَ هذا التكامل عن طريقِ استخدام شبكة عصبونية متعدِّدة المهام؛ وهذه المهام هي:1- توقُّع البرنامج program prediction.2- تصنيف الهدف من الاستعلام intent classification.3- ترميز الاستعلام الواحد query tagging.واقترح الباحثون نموذجَين لتحسينِ فهم الاستعلامات الصوتية، وقد فُعِّلَ ووُظِّفَ النموذج الأول في المنصّة؛ إذ إنَّه يُخدِّم ملايين  الاستعلامات يوميًّا مع تحسينِ تجربة المستخدم.يعالج النموذج الأول المفعَّل على المنصّة الاستعلاماتِ الصعبة فقط، والتي لولاه لكانت ستُتَجاهَل؛ فما من داعٍ مثلًا لتفعيلِ شبكة عصبونية للاستجابة لطلبِ بحثٍ يقول فيه المستخدم اسمَ القناة فقط مثل "CNN".وأمَّا النموذج الجديد الثاني -وهو النموذج الذي يعتمد على الشبكات العصبونية متعدِّدة المهام- فقد وُصِّفَ في الورقة البحثية التي نُشرِت، ولم يُستخدَم عمليًّا في المنصّة بعد، ولكنَّه أظهر الكفاءةَ ضمن التجارب فقط.ماذا يُقصد بـ Multi-task learning التعليم متعدِّد المهمات؟يُعدُّ التعلُّم متعدِّد المهمّات (MTL) نموذجًا من نماذجِ تعلُّم الآلة؛ إذ تُحسَّن أهدافُ عدّة مهام متّصلة مع بعضِها.يتمثَّل الهدف الرئيس من -التعلُّم متعدِّد المهمات- بأنه عندما تكون هذه المهمات المتعدِّدة غيرَ مستقلّة بعضها عن بعض (أي متّصلة)؛ فإنَّ التدريب المشترك للشبكة العصبونية يعزِّز من أداءِ المهمات الفردية، وبذلك يؤدِّي إلى تعميمٍ أفضل عن طريق المعامِلات المشتركة.وأُخِذَ بعين النظر التفكير بالتعلُّم متعدِّد المهمات من أجلِ حلِّ العديد من المشكلات المختلفة في العديد من المجالات التقنية؛ مثل مجال الرؤية الحاسوبية وتطبيقات الويب.النموذج الأول:ركَّزت المحاولة الأولى للباحثين في معالجةِ مشكلات الاستعلام الصوتي على التحديد المباشر للبرنامج الذي ينوي المستخدِم مشاهدتَه، إذن؛ هذا النموذج قائمٌ على التنبُّؤ بالبرنامج المراد مشاهدتَه.وقد عمد الباحثون إلى استغلالِ سياق الجلسة الواحدة لتوضيحِ طلبات البحث والاستعلام المستقبلية.ويستطيع النظام مراكمةَ الإشارة في سياقٍ واحد ليتمكَّن من توضيحِ الاستعلامات المستقبلية عن طريقِ عدّة استعلامات للجلسة الواحدة.ويستفيد النظام من سياقِ الجلسة الواحدة، وذلك باستخدامِ شبكة عصبونية متكرِّرة هرمية والتي سنطلق عليها اسم (N-HRNN) اختصارًا ل Navigational Hierarchical Recurrent Neural Network. ...

أكمل القراءة »